The reading results of an agreed number of images of items, achieved by the
OCR reader, are temporarily stored subdivided into reading results which
are read unambiguously and reading results which are rejected. Then
classes of words or word groups belonging together of the reading results
temporarily stored and rejected, consisting in each case of n address
words, n=1, 2, . . . , a, with interword gaps m, m=0, 1, . . . b are
formed which do not drop below a particular similarity factor referred to
in each case a particular n and m value between them. In the dictionary or
dictionaries of the associated address areas, representatives, at least,
of the classes whose frequency exceeds a predetermined value are included.
Os resultados da leitura de um número concordado das imagens dos artigos, conseguidas pelo leitor do OCR, são armazenados temporariamente subdivididos nos resultados da leitura que são lidos unambiguously e nos resultados da leitura que são rejeitados. Então as classes das palavras ou dos grupos da palavra que pertencem junto da leitura resultam armazenado temporariamente e rejeitado, consistindo em cada caso das palavras do endereço de n, n=1, 2. . . , a, com aberturas interword m, m=0, 1. . . b é dado forma que não deixam cair abaixo de um fator particular da similaridade consultado em cada caso um valor particular de n e de m entre eles. No dicionário ou nos dicionários das áreas associadas do endereço, os representantes, ao menos, das classes cuja a freqüência excede um valor predeterminado são incluídos.