A method and system are disclosed for creating compact integrated metadata
representing a set of documents. Each document comprises a set of terms.
The metadata comprises a set of topic profiles, each topic profile
defining a relationship between a topic and the documents, a set of
document surrogates, and a list of terms which may distinguish among
documents. Each document surrogate describes a subset of terms occurring
in the document and thus permits a document to be searched for by term as
well as topic.
Un metodo e un sistema sono rilevati per la generazione del metadata integrato compatto che rappresenta un insieme dei documenti. Ogni documento contiene un insieme i termini. Il metadata contiene un insieme i profili di soggetto, ogni profilo di soggetto che definisce un rapporto fra un soggetto ed i documenti, un insieme delle sostituti del documento e un elenco di termini che possono distinguersi fra i documenti. Ogni sostituto del documento descrive un sottoinsieme dei termini che accadono nel documento e così consente un documento di essere cercata dal termine così come il soggetto.