A method and apparatus, including computer program apparatus, implementing
techniques for processing an image using one or more text masks to
represent lexical units representing text. The techniques can include
generating at least one text mask distinguishing between at least the text
pixels and the background pixels of at least one lexical unit in the
image; storing the text mask in an electronic document representing the
image; receiving an electronic document including at least one text mask
distinguishing between at least the text pixels and the background pixels
of at least one lexical unit in the image; and using at least one text
mask to generate a representation of the lexical unit for display on an
output device. An electronic document representing an image can include a
representation of the image in a page description language including at
least one text mask distinguishing between at least the text pixels and
the background pixels of at least one lexical unit in the image.
Μια μέθοδος και μια συσκευή, συμπεριλαμβανομένων των συσκευών προγράμματος υπολογιστών, για την εφαρμογή των τεχνικών για μια εικόνα που χρησιμοποιεί μια ή περισσότερες μάσκες κειμένων για να αντιπροσωπεύσει τις λεξικολογικές μονάδες που αντιπροσωπεύουν το κείμενο. Οι τεχνικές μπορούν να περιλάβουν την παραγωγή της τουλάχιστον μιας διάκρισης μασκών κειμένων μεταξύ τουλάχιστον των εικονοκυττάρων κειμένων και των εικονοκυττάρων υποβάθρου τουλάχιστον μιας λεξικολογικής μονάδας στην εικόνα αποθήκευση της μάσκας κειμένων σε ένα ηλεκτρονικό έγγραφο που αντιπροσωπεύει την εικόνα λήψη ενός ηλεκτρονικού εγγράφου συμπεριλαμβανομένης της τουλάχιστον μιας διάκρισης μασκών κειμένων μεταξύ τουλάχιστον των εικονοκυττάρων κειμένων και των εικονοκυττάρων υποβάθρου τουλάχιστον μιας λεξικολογικής μονάδας στην εικόνα και χρησιμοποιώντας τουλάχιστον μια μάσκα κειμένων για να παραγάγει μια αντιπροσώπευση της λεξικολογικής μονάδας για την επίδειξη σε μια συσκευή παραγωγής. Ένα ηλεκτρονικό έγγραφο που αντιπροσωπεύει μια εικόνα μπορεί να περιλάβει μια αντιπροσώπευση της εικόνας σε μια γλώσσα περιγραφής σελίδων συμπεριλαμβανομένης της τουλάχιστον μιας διάκρισης μασκών κειμένων μεταξύ τουλάχιστον των εικονοκυττάρων κειμένων και των εικονοκυττάρων υποβάθρου τουλάχιστον μιας λεξικολογικής μονάδας στην εικόνα.