A technique for segmenting a loosely constrained text block, such as an
e-mail signature block into sub-blocks by performing line segment
extraction and connected component analysis on the foreground characters
and background characters and recursively repeating connected component
analysis on both the foreground and background characters and line segment
extraction on the background characters until a text output includes no
mixed reading blocks. A technique for correcting over segmentation errors
in a line of text from a loosely constrained text block which has
undergone geometrical analysis.
Een techniek om een los beperkt tekstblok, zoals een e-mailhandtekeningsblok in sub-blokken te segmenteren door de extractie van het lijnsegment en verbonden componentenanalyse van de voorgrondkarakters en achtergrondkarakters uit te voeren en recursief verbonden componentenanalyse van zowel de voorgrond als achtergrondkarakters en de extractie van het lijnsegment op de achtergrondkarakters te herhalen tot een tekstoutput geen gemengde lezingsblokken omvat. Een techniek om over segmentatiefouten in een lijn van tekst van een los beperkt tekstblok te verbeteren dat geometrische analyse heeft ondergaan.