Computer-implemented methods are described for, first, characterizing a specific category of information content--pornography, for example--and then accurately identifying instances of that category of content within a real-time media stream, such as a web page, e-mail or other digital dataset. This content-recognition technology enables a new class of highly scalable applications to manage such content, including filtering, classifying, prioritizing, tracking etc. An illustrative application of the invention is a software product for use in conjunction with web-browser client software for screening access to web pages that contain pornography or other potentially harmful or offensive content. A target attribute set of regular expression, such as natural language words and/or phrases, is formed by statistical analysis of a number of samples of datasets characterized as "containing," and another set of samples characterized as "not containing," the selected category of information content. This list of expressions is refined by applying correlation analysis to the samples or "training data." Neural-network feed-forward techniques are then applied, again using a substantial training dataset, for adaptively assigning relative weights to each of the expressions in the target attribute set, thereby forming an awaited list that is highly predictive of the information content category of interest.

Οι υπολογιστής-εφαρμοσμένες μέθοδοι περιγράφονται για, πρώτα, να χαρακτηρίσουν μια συγκεκριμένη κατηγορία περιεχομένου πληροφοριών -- πορνογραφία, παραδείγματος χάριν -- και έπειτα ακριβώς να προσδιορίσουν τις περιπτώσεις εκείνης της κατηγορίας περιεχομένου μέσα σε ένα σε πραγματικό χρόνο ρεύμα μέσων, όπως ιστοσελίδας, το ηλεκτρονικό ταχυδρομείο ή άλλο ψηφιακό σύνολο δεδομένων. Αυτή η τεχνολογία ικανοποιημένος-αναγνώρισης επιτρέπει μια νέα κατηγορία ιδιαίτερα εξελικτικών εφαρμογών για να ρυθμιστεί τέτοιο περιεχόμενο, συμπεριλαμβανομένου του φιλτραρίσματος, ταξινόμηση, να δώσει προτεραιότητα, ακολουθώντας κ.λπ.... Μια επεξηγηματική εφαρμογή της εφεύρεσης είναι ένα προϊόν λογισμικού για τη χρήση από κοινού με το λογισμικό πελατών Ιστός-ξεφυλλιστή για την πρόσβαση διαλογής ιστοσελίδας που περιέχουν την πορνογραφία ή άλλο ενδεχομένως επιβλαβές ή δυσάρεστο περιεχόμενο. Ένα σύνολο ιδιοτήτων στόχων κανονικής έκφρασης, όπως οι λέξεις φυσικής γλώσσας ή/και οι φράσεις, διαμορφώνεται τη στατιστική ανάλυση διάφορων δειγμάτων των συνόλων δεδομένων που χαρακτηρίζονται όπως "περιέχοντας," και ένα άλλο σύνολο δειγμάτων που χαρακτηρίζεται από όπως "μην περιέχοντας," η επιλεγμένη κατηγορία περιεχομένου πληροφοριών. Αυτός ο κατάλογος εκφράσεων καθαρίζεται με την εφαρμογή της ανάλυσης συσχετισμού στα δείγματα ή τα "στοιχεία κατάρτισης." Feed-forward νευρικός-δικτύων οι τεχνικές εφαρμόζονται έπειτα, χρησιμοποιώντας πάλι ένα ουσιαστικό σύνολο δεδομένων κατάρτισης, για προσαρμοστικά να ορίσουν τα σχετικά βάρη σε κάθε μια από τις εκφράσεις στο σύνολο ιδιοτήτων στόχων, με αυτόν τον τρόπο διαμορφώνοντας έναν αναμενόμενο κατάλογο που είναι ιδιαίτερα προφητικός της κατηγορίας περιεχομένου πληροφοριών ενδιαφέροντος.

 
Web www.patentalert.com

< Display plate for timepieces and method for fabricating the same

< Local naming for HDL compilation

> Zoom lens

> Plant cinnamyl-alcohol dehydrogenase

~ 00095