A method for image processing including segmenting document images into
text and continuous tone regions is provided. The method uses a token
shape comparison and resultant data (e.g. shape recurrence) to determine
which high-contrast regions of the image correspond to text or other
symbols. The identified text is then separated from the image and
processing ensues.
Een methode voor beeldverwerking met inbegrip van wordt het segmenteren van documentbeelden in tekst en ononderbroken toongebieden verstrekt. De methode gebruikt een symbolische vormvergelijking en een resulterend gegeven (b.v. vormherhaling) om te bepalen welke hoog-contrastgebieden van het beeld aan tekst of andere symbolen beantwoorden. De geïdentificeerde tekst is dan gescheiden van het beeld en de verwerking volgt.