Method and apparatus for discriminating between documents in batch scanned document files

   
   

Discriminating between documents scanned in a batch scanning process is achieved based on various analyses of the constituent document pages. The data provided by the various analyses are compared with each other to determine whether successive pages belong to the same document. Scanned documents result in a page sequence. The page sequence is then analyzed to extract one or more features attributes for each page. The feature attributes are provided to a feature comparison process in order to assess the similarity of successive pages. If a sufficient likelihood of similarity is found, then the compared pages are deemed to be from the same document; otherwise, they are deemed to be from different documents, indicating the existence of a document break. Through the display of the page sequence, a user may optionally modify the location of one or more document breaks. Based on the document breaks, separate scan files may be established. In this manner, the present invention represents eliminates the requirement of user intervention.

Discriminar entre originais fêz a varredura em um processo da exploração do grupo é conseguido baseou em várias análises das páginas constituent do original. Os dados fornecidos pelas várias análises são comparados com se para determinar se as páginas sucessivas pertencem ao mesmo original. Os originais feitos a varredura resultam em uma seqüência da página. A seqüência da página é analisada então para extrair um ou mais atributo das características para cada página. Os atributos da característica são fornecidos a um processo da comparação da característica a fim avaliar a similaridade de páginas sucessivas. Se uma probabilidade suficiente da similaridade for encontrada, a seguir as páginas comparadas estão julgadas para ser do mesmo original; se não, são julgados para ser dos originais diferentes, indicando a existência de uma ruptura do original. Através da exposição da seqüência da página, um usuário pode opcionalmente modificar a posição de um ou mais ruptura do original. Baseado nas rupturas do original, as limas separadas da varredura podem ser estabelecidas. Nesta maneira, a invenção atual representa elimina a exigência da intervenção do usuário.

 
Web www.patentalert.com

< Method of compiling schema mapping

< System and method for implementing a user interface in a client management tool

> System and method for remote management

> Method and system for protecting a security parameter negotiation server against denial-of-service attacks

~ 00112