The present invention is directed to a method for extracting textual as
well as tabular data material from financial documents. Initially, a
comparison is made to determine the type of data schedule material
provided in the document. Subsequently, the character strings of the
financial document are compared to character strings provided in previous
documents or in various databases. The database of the previous document
would include the textual material in a first plane, and the tabular
material also in that first plane. If a character string match is made
between a new document and an old document, the new tabular data material
would be provided in a data matrix in a second plane but the corresponding
textual material would not be included in the textual matrix provided in
that second plane. Only character strings not matched in the textual
material of the first plane would be provided in the textual matrix of the
second plane.
La présente invention est dirigée vers une méthode pour extraire textuel aussi bien que le matériel tabulaire de données à partir des documents financiers. Au commencement, une comparaison est faite pour déterminer le type de matériel de programme de données fourni dans le document. Plus tard, les chaînes de caractères du document financier sont comparées aux chaînes de caractères fournies dans les documents précédents ou dans diverses bases de données. La base de données du document précédent inclurait le matériel textuel dans un premier avion, et le matériel tabulaire également dans cet premier avion. Si une allumette de chaîne de caractères est faite entre un nouveau document et un vieux document, le nouveau matériel tabulaire de données serait fourni dans une matrice de données dans un deuxième avion mais le matériel textuel correspondant ne serait pas inclus dans la matrice textuelle fournie dans cet deuxième avion. Seulement des chaînes de caractères non assorties dans le matériel textuel du premier avion seraient fournies dans la matrice textuelle du deuxième avion.