Methods and apparatus for classifying an instance (i.e., a data item or a
record) automatically into one or more classes selected from a set of
potential classes are described. This multi-class classification approach
enables instances to be classified with high accuracy, even when the
number of classes is very large. In accordance with one classification
scheme, a subset of two or more classes to which the instance is
determined to most likely belong is selected from the set of potential
classes. A classifier that is generated from a set of training records
corresponding to a class set inclusive of the selected subset of classes
is applied to the instance a to identify at least one class to which the
instance most likely belongs.
Os métodos e os instrumentos para classificar um exemplo (isto é, um artigo de dados ou um registro) automaticamente em um ou mais classe selecionada de um jogo de classes potenciais são descritos. Esta aproximação da classificação da multi-classe permite exemplos de ser classificada com exatidão elevada, mesmo quando o número das classes é muito grande. De acordo com um esquema da classificação, um subconjunto de dois ou o mais classes a que o exemplo é determinado pertencer muito provável são selecionados do jogo de classes potenciais. Um classificador que seja gerado de um jogo do treinamento grava corresponder a uma classe que inclusivo ajustado do subconjunto selecionado das classes é aplicado ao exemplo a para identificar ao menos uma classe a que o exemplo pertence muito provável.