Systems and methods are described for concisely encoding into a lexicon (or
dictionary) and decoding from the lexicon regular expressions that can
represent certain huge word lists that might otherwise be considered
unmanageably large. Sets of words (character sequences or `strings`) that
share certain commonalities such as a set of numbers, which share common
digits, may be condensed into digital lexicons by representing the set
with a regular expression. The regular expression is a string that
includes meta-character, where each meta-character is a place-marker that
represents a set of at least two normal characters. When accessing or
searching the lexicon, the regular expressions are dynamically expanded,
as needed, to the underlying, original word list. The methods disclosed
are applicable to many lexicon driven language based systems such as
spelling verification systems, handwriting recognition systems, speech
recognition systems and the like.
I sistemi ed i metodi sono descritti per brevemente la cifratura in un lessico (o nel dizionario) e la decodificazione dalle espressioni normali del lessico che possono rappresentare determinate liste enormi di parola che potrebbero al contrario essere considerate unmanageably grandi. Gli insiemi delle parole (sequenze del carattere o strings` del `) determinate comunanze di quella parte quale un insieme dei numeri, che ripartiscono le cifre comuni, possono essere condensati nei lessici digitali rappresentando l'insieme con un'espressione normale. L'espressione normale è una stringa che include il meta-character, in cui ogni meta-character è un posto-indicatore che rappresenta un insieme almeno di due caratteri normali. Nell'accedere o cercando al lessico, le espressioni normali sono espanse dinamicamente, come stato necessaria, alla lista di fondo e originale di parola. I metodi rilevati sono applicabili a molti sistemi basati lingua guidati lessico quali i sistemi di verifica di ortografia, i sistemi di riconoscimento della scrittura a mano, i sistemi di riconoscimento della parola ed i simili.