A method and system organize and retrieve information using taxonomies, a
document classifier, and an autocontextualizer. Documents (or other
knowledge containers) in an organization and retrieval subsystem may be
manually or automatically classified into taxonomies. Documents are
transformed from clear text into a structured record. Automatically
constructed indexes help identify when the structured record is an
appropriate response to a query. An automatic term extractor creates a
list of terms indicative of the documents' subject matter. A subject
matter expert identifies the terms relevant to the taxonomies. A term
analysis system assigns the relevant terns to one or more taxonomies, and
a suitable algorithm is then used to determine the relatedness between
each list of terms and its associated taxonomy. The system then clusters
documents for each taxonomy in accordance with the weights ascribed to the
terms in the taxonomy's list and a directed acyclic graph (DAG) structure
is created.
Une méthode et un système organisent et recherchent l'information en utilisant des taxonomies, un classificateur de document, et un autocontextualizer. Des documents (ou d'autres récipients de la connaissance) dans un sous-ensemble d'organisation et de récupération peuvent classifier manuellement ou automatiquement dans des taxonomies. Des documents sont transformés du texte clair en disque structuré. Les index automatiquement construits aident à identifier quand le disque structuré est une réponse appropriée à une question. Un extracteur automatique de limite crée une liste de limites indicatives des thèmes des documents. Un expert en matière de thèmes identifie les limites concernant les taxonomies. Un système d'analyse de limite assigne les sternes appropriées à un ou plusieurs taxonomies, et un algorithme approprié est alors employé pour déterminer la parenté entre chaque liste de limites et son taxonomie associée. Le système groupe alors des documents pour chaque taxonomie selon les poids attribués aux limites dans la liste de la taxonomie et une structure acyclique dirigée du graphique (DAG) est créée.