A table in an HTML document is analyzed to generate cell position data
indicating a positional relationship between cells and cell vectors
representing characteristics of the cells, and a table type is judged with
reference to the cell position data and the cell vectors, and, if the
table type is a table describing a table, it is judged whether the data is
represented in a column or a row with reference to the cell position data
and the cell vectors, and a cut direction of the table is determined, and
segments are generated with reference to the table type and the cut
direction. If the table type is a table for layout, the cells are
clustered with reference to the cell vectors, and the segments are
generated with reference to the cell position data and cell cluster
information.
Ένας πίνακας σε ένα έγγραφο HTML αναλύεται για να παραγάγει τα στοιχεία θέσης κυττάρων που δείχνουν μια θεσιακή σχέση μεταξύ των κυττάρων και των διανυσμάτων κυττάρων που αντιπροσωπεύουν τα χαρακτηριστικά των κυττάρων, και ένας επιτραπέζιος τύπος κρίνεται σε σχέση με τα στοιχεία θέσης κυττάρων και τα διανύσματα κυττάρων, και, εάν ο επιτραπέζιος τύπος είναι ένας πίνακας περιγράφοντας έναν πίνακα, αυτό κρίνονται εάν το στοιχείο αντιπροσωπεύεται σε μια στήλη ή μια σειρά σε σχέση με τα στοιχεία θέσης κυττάρων και τα διανύσματα κυττάρων, και μια κατεύθυνση περικοπών του πίνακα καθορίζεται, και τα τμήματα παράγονται σε σχέση με τον επιτραπέζιο τύπο και την κατεύθυνση περικοπών. Εάν ο επιτραπέζιος τύπος είναι ένας πίνακας για το σχεδιάγραμμα, τα κύτταρα είναι συγκεντρωμένα σε σχέση με τα διανύσματα κυττάρων, και τα τμήματα παράγονται σε σχέση με τα στοιχεία θέσης κυττάρων και τις πληροφορίες συστάδων κυττάρων.