A text mining program is provided that allows a user to perform text mining
operations, such as: information retrieval, term and document
visualization, term and document clustering, term and document
classification, summarization of individual documents and groups of
documents, and document cross-referencing. This is accomplished by
representing the text of a document collection using subspace
transformations. This subspace transformation representation is performed
by: constructing a term frequency matrix of the term frequencies for each
of the documents, transforming the term frequencies for statistical
purposes, and projecting the documents or the terms into a lower
dimensional subspace. As the document collection is updated, the subspace
is dynamically updated to reflect the new document collection.
Um programa minando do texto está contanto que permite que um usuário execute operações de mineração do texto, como: recuperação de informação, visualization do termo e do original, aglomerar-se do termo e do original, classificação do termo e do original, summarization de originais individuais e grupos dos originais, e de fazer remissão recíproca do original. Isto é realizado representando o texto de uma coleção do original usando transformações do subspace. Esta respresentação da transformação do subspace é executada perto: construindo uma matriz da freqüência do termo das freqüências do termo para cada um dos originais, transformando as freqüências do termo para finalidades estatísticas, e projetar os originais ou os termos em um subspace dimensional mais baixo. Enquanto a coleção do original é updated, o subspace está atualizado dinâmicamente para refletir a coleção nova do original.