A method of extracting a section of a page from a portable document format
file ("pdf"): The method includes receiving indication of a user-defined
region on a pdf file page, designating an extraction region including all
elements determined to be within the user-defined region, and placing the
extraction region into a new file. The method may also include determining
if one or more elements on the pdf page are within the user-defined region
by applying inclusion rules based on whether an element's bounding box is
within or intersects the user-defined region. The method may also include
verifying the accuracy of the extraction by converting the user-defined
region in the original pdf document and the extracted region to bitmap
images and comparing the two bitmap images, bit by bit.
Une méthode d'extraire une section d'une page à partir d'un dossier portatif de format de document ("pdf") : La méthode inclut recevoir l'indication d'une région définie pour l'utilisateur à une page de dossier de pdf, indiquant une région d'extraction comprenant tous les éléments déterminés pour être dans la région définie pour l'utilisateur, et plaçant la région d'extraction dans un nouveau dossier. La méthode peut également inclure déterminer si un ou plusieurs éléments à la page de pdf sont dans la région définie pour l'utilisateur en appliquant des règles d'inclusion basées dessus si la boîte de bondissement d'un élément est en dedans ou intersecte la région définie pour l'utilisateur. La méthode peut également inclure vérifier l'exactitude de l'extraction en convertissant la région définie pour l'utilisateur dans le document original de pdf et la région extraite pour établir une correspondance de bits des images et en comparant les deux images à mémoire d'image, peu par le peu.