The present invention provides a facility for selecting from a sequence of natural language characters combinations of characters that may be words. The facility uses indications, for each of a plurality of characters, of (a) the characters that occur in the second position of words that begin with the character and (b) the positions in which the character occurs in words. For each of a plurality of contiguous combinations of characters occurring in the sequence, the facility determines whether the character occurring in the second position of the combination is indicated to occur in words that begin with the character occurring in the first position of the combination. If so, the facility determines whether every character of the combination is indicated to occur in words in a position in which it occurs in the combination. If so, the facility determines that the combination of characters may be a word. In some embodiments, the facility proceeds to compare the combination of characters to a list of valid words to determine whether the combination of characters is a word.

De onderhavige uitvinding verstrekt een faciliteit voor het selecteren uit een opeenvolging van de combinaties van natuurlijke taalkarakters karakters die woorden kunnen zijn. De faciliteit gebruikt aanwijzingen, voor elk van een meerderheid van karakters, van (a) de karakters die in de tweede positie van woorden voorkomen die met het karakter en (b) de posities beginnen in wie het karakter in woorden voorkomt. Voor elk van een meerderheid van aangrenzende combinaties karakters die in de opeenvolging voorkomen, bepaalt de faciliteit of het karakter dat in de tweede positie van de combinatie voorkomt vermeld om in woorden is voor te komen die met het karakter beginnen dat in de eerste positie van de combinatie voorkomt. Als zo, bepaalt de faciliteit of elk karakter van de combinatie vermeld om in woorden in een positie is voor te komen waarin het in de combinatie voorkomt. Als zo, bepaalt de faciliteit dat de combinatie karakters een woord kan zijn. In sommige belichamingen, gaat de faciliteit te werk om de combinatie karakters bij een lijst van geldige woorden te vergelijken om te bepalen of de combinatie karakters een woord is.


< (none)

< Ultrasonic wafer blade vibration detection

> Method and apparatus for implementing motion detection in video compression

> (none)

~ 00088