A method to automatically categorize messages or documents containing text. The method of solution fits in the general framework of supervised learning, in which a rule or rules for categorizing data is automatically constructed by a computer on the basis of training data that has been labeled beforehand. More specifically, the method involves the construction of a linear separator: training data is used to construct for each category a weight vector w and a threshold t, and the decision of whether a hitherto unseen document d is in the category will depend on the outcome of the test w.sup.T x.gtoreq.t, where x is a vector derived from the document d. The method also uses a set L of features selected from the training data in order to construct the numerical vector representation x of a document. The preferred method uses an algorithm based on Gauss-Seidel iteration to determine the weight factor w that is determined by a regularized convex optimization problem derived from the principle of minimizing modified training error.

Метод автоматически для того чтобы классифицировать сообщения или документы содержа текст. Методо решения пригонки в вообще рамках, котор наблюдали учить, в которых правило или правила для классифицировать данные автоматически построены компьютером on the basis of данные по тренировки которые были обозначены заранее. Более специфически, метод включает конструкцию линейного сепаратора: тренируя данные использованы для того чтобы построить для каждой категории вектор ш веса и порог т, и решение находится ли hitherto unseen документ д в категории будет зависеть на исходе испытания w.sup.T x.gtoreq.t, где х будет вектор выведенный от документа д. Метод также использует комплект л характеристик выбранных от данных по тренировки для того чтобы построить численное представление x вектора документа. Предпочитаемый метод использует алгоритм основанный на итерировании Gaussa-Seidel для того чтобы обусловить фактор ш веса обусловлен упорядоченный выпуклый задачаа оптимизации выведенный от принципа уменьшать доработанную тренируя ошибку.

 
Web www.patentalert.com

< Apparatus and method for adjusting interaction level, and storage medium for storing program therefor

< System and method for providing demographically targeted information

> System and method for processing knowledge items of a knowledge warehouse

> Method and apparatus for path planning

~ 00073