A system and method for generating structured data outputs from a
semi-structured data source. The steps of this method include generating
an example output from an example generator. The example output is
generated in response to the acquisition of a sequence of annotated
strings. The annotated strings are generated in response to the
acquisition and modification of at least one data example and
corresponding coarse structure from a predetermined input source. Also, a
second sequence of annotated strings is generated from input from a
semi-structured data source. Both the example output and second sequence
of annotated strings are input to an acquisition engine that implements a
grammar layer incorporating a top-down parsing method and a comparison
layer. The structured data outputs are generated through the cooperation
of the comparison layer and the grammar layer.
Un système et une méthode pour produire des sorties de données structurées d'un point d'émission de données de semi-finale-structured. Les étapes de cette méthode incluent produire d'un exemple produit d'un générateur d'exemple. Le rendement d'exemple est produit en réponse à l'acquisition d'un ordre des cordes annotées. Les cordes annotées sont produites en réponse à l'acquisition et à la modification au moins d'un exemple de données et de structure brute correspondante d'une source prédéterminée d'entrée. En outre, un deuxième ordre des cordes annotées est produit de l'entrée d'un point d'émission de données de semi-finale-structured. Le rendement d'exemple et le deuxième ordre des cordes annotées sont entrés dans un moteur d'acquisition qui met en application une couche de grammaire incorporant une méthode de haut en bas d'analyse et une couche de comparaison. Les sorties de données structurées sont produites par la coopération de la couche de comparaison et de la couche de grammaire.