A phrase discovery is a method of identifying sequences of terms in a
database. First, a selection of one or more relevant sequences of terms,
such as relevant text, is provided. Next, several shorter sequences of
terms, such as phrases, are extracted from the provided relevant sequences
of terms. The extracted sequences of terms are then reduced through a
culling process. A gathering process then emphasizes the more relevant of
the extracted and culled sequences of terms and de-emphasizes the more
generic of the extracted and culled sequences of terms. The gathering
process can also include iteratively retrieving additional selections of
relevant sequences (e.g., text), extracting and culling additional
sequences of terms (e.g., phrases), emphasizing and de-emphasizing
extracted and culled sequences of terms and accumulating all gathered
sequences of terms. The resulting gathered sequences of terms are then
output.
Une découverte d'expression est une méthode d'identifier des ordres des limites dans une base de données. D'abord, un choix d'un ou plusieurs ordres appropriés des limites, telles que le texte approprié, est fourni. Après, plusieurs ordres plus courts des limites, telles que des expressions, sont extraits à partir des ordres appropriés fournis des limites. Les ordres extraits des limites sont alors réduits par un processus de cueillage. Un processus sourcilleux alors souligne le plus approprié des ordres extraits et cueillis des limites et de-emphasizes le plus générique des ordres extraits et cueillis des limites. Le processus sourcilleux peut également inclure rechercher itérativement des choix additionnels des ordres appropriés (par exemple, texte), extrayant et cueillant des ordres additionnels des limites (par exemple, expressions), soulignant et de-emphasizing des ordres extraits et cueillis des limites et accumulant tous les ordres recueillis des limites. Les ordres recueillis résultants des limites sont alors produits.