A method and a system by which a document image is analyzed for the
purposes of establishing a searchable data structure characterizing
ground-truthed contents of the document represented by the document image
operates by segmenting a document image into a set of image objects, and
linking the image objects with fields that store metadata. Image objects
identified by segmenting the document image are grouped into subsets. The
image objects are grouped according to characteristics suggesting that the
image objects may have common ground-truthed metadata. By grouping the
image objects into subsets, the image objects may be indexed to facilitate
the ground-truthing process. In some embodiments, the index of
representative image objects is presented to the user in a table form. A
database of image objects with ground-truthed metadata is formed.
Interactive tools and processes facilitate ground-truthing based on paired
image objects and metadata.
Um método e um sistema por que uma imagem do original é analisada para as finalidades de estabelecer uma estrutura de dados searchable que caracteriza índices da terra-truthed do original representado pela imagem do original operam-se segmentando uma imagem do original em um jogo de objetos da imagem, e ligando a imagem objetam com campos que armazenam o metadata. Os objetos da imagem identificados segmentando a imagem do original são agrupados em subconjuntos. Os objetos da imagem são agrupados de acordo com as características que sugerem que os objetos da imagem podem ter o metadata comum da terra-truthed. Agrupando os objetos da imagem em subconjuntos, os objetos da imagem podem ser posicionados para facilitar o processo da terra-truthing. Em algumas incorporações, o índice de objetos representativos da imagem é apresentado ao usuário em um formulário da tabela. Uma base de dados de objetos da imagem com metadata da terra-truthed é dada forma. As ferramentas interativas e os processos facilitam a terra-truthing baseada em objetos e no metadata emparelhados da imagem.