A method and apparatus are disclosed for recommending items of interest to
a user, such as television program recommendations, before a viewing
history or purchase history of the user is available. A third party
viewing or purchase history is processed to generate stereotype profiles
that reflect the typical patterns of items selected by representative
viewers. A user can select the most relevant stereotype(s) from the
generated stereotype profiles and thereby initialize his or her profile
with the items that are closest to his or her own interests. A clustering
routine partitions the third party viewing or purchase history (the data
set) into clusters using a k-means clustering algorithm, such that points
(e.g., television programs) in one cluster are closer to the mean of that
cluster than any other cluster. The value of k is incremented until (i)
further incrementing of k does not yield any improvement in the
classification accuracy, (ii) a predefined performance threshold is
reached, or (iii) an empty cluster is detected.
Een methode en een apparaat worden onthuld voor het adviseren van de puntenrente van belang aan een gebruiker, zoals de aanbevelingen van het televisieprogramma, alvorens een het bekijken geschiedenis of de aankoopgeschiedenis van de gebruiker beschikbaar zijn. Een van de derde het bekijken of aankoop geschiedenis wordt verwerkt om stereotiepe profielen te produceren die op de typische patronen van punten wijzen die door representatieve kijkers worden geselecteerd. Een gebruiker kan meest relevante stereotiep (s) van de geproduceerde stereotiepe profielen selecteren en daardoor zijn of haar profiel met de punten initialiseren die aan zijn of haar eigen belangen het dichtst zijn. Een het groeperen zich routine verdeelt de van de derde het bekijken of aankoop geschiedenis (de gegevensreeks) in clusters gebruikend een k-middel zich groepeert algoritme, dusdanig dat de punten (b.v., televisieprogramma's) in één cluster dichter zijn aan het gemiddelde van die cluster dan een andere cluster. De waarde van k wordt verhoogd tot (i) het verdere verhogen van k geen verbetering van de classificatienauwkeurigheid opbrengt, (ii) een vooraf bepaalde prestatiesdrempel wordt bereikt, of (iii) een lege cluster wordt ontdekt.