Systems and methods are provided for automatically determining the font of
text in a captured document image. Sequences of turns (left, right,
straight) around the boundaries of connected components of black pixels in
the captured document image are determined. The probabilities of the
sequences of turns have come from a particular font within a library of
known fonts can be determined using training set statistics. Using these
probabilities, the most probable source font is selected.
Los sistemas y los métodos se proporcionan para automáticamente determinar la fuente del texto en una imagen capturada del documento. Las secuencias de las vueltas (izquierdo, derecho, recto) alrededor de los límites de los componentes conectados de pixeles negros en la imagen capturada del documento se determinan. Las probabilidades de las secuencias de vueltas han venido de una fuente particular dentro de una biblioteca de fuentes sabidas se pueden determinar usando estadística determinada del entrenamiento. Usando estas probabilidades, se selecciona la fuente más probable de la fuente.