Pattern recognition process for text document interpretation

   
   

The present invention is directed to a method for extracting textual as well as tabular data material from financial documents. Initially, a comparison is made to determine the type of data schedule material provided in the document. Subsequently, the character strings of the financial document are compared to character strings provided in previous documents or in various databases. The database of the previous document would include the textual material in a first plane, and the tabular material also in that first plane. If a character string match is made between a new document and an old document, the new tabular data material would be provided in a data matrix in a second plane but the corresponding textual material would not be included in the textual matrix provided in that second plane. Only character strings not matched in the textual material of the first plane would be provided in the textual matrix of the second plane.

La présente invention est dirigée vers une méthode pour extraire textuel aussi bien que le matériel tabulaire de données à partir des documents financiers. Au commencement, une comparaison est faite pour déterminer le type de matériel de programme de données fourni dans le document. Plus tard, les chaînes de caractères du document financier sont comparées aux chaînes de caractères fournies dans les documents précédents ou dans diverses bases de données. La base de données du document précédent inclurait le matériel textuel dans un premier avion, et le matériel tabulaire également dans cet premier avion. Si une allumette de chaîne de caractères est faite entre un nouveau document et un vieux document, le nouveau matériel tabulaire de données serait fourni dans une matrice de données dans un deuxième avion mais le matériel textuel correspondant ne serait pas inclus dans la matrice textuelle fournie dans cet deuxième avion. Seulement des chaînes de caractères non assorties dans le matériel textuel du premier avion seraient fournies dans la matrice textuelle du deuxième avion.

 
Web www.patentalert.com

< Remote Coriolis flowmeter sizing and ordering system

< Adaptable security mechanism for preventing unauthorized access of digital data

> System, method and apparatus for tracking deployment of cellular telephone network sites

> Portable information communication terminal, entertainment system, and storage medium

~ 00131