A system and method for organizing raw data from one or more sources. The
content of the raw data is converted into an appropriate number system and
stored in a format that facilitates the use of efficient mathematical
operations. The number system is selected to handle each of the various
elements, characters, or other representative indicia found in the raw
data. Furthermore, the number system is selected so that the numerical
data retains semantic significance with respect to the raw data. Once
converted into the numeric format, the data is processed using various
techniques to extract the best information from the raw data into a
distilled database.
Un système et une méthode pour organiser des données brutes d'une ou plusieurs sources. La teneur des données brutes est convertie en système de numération approprié et stockée dans un format qui facilite l'utilisation des opérations mathématiques efficaces. Le système de numération est choisi pour manipuler chacun des divers éléments, de caractères, ou de tout autre indicia représentatif trouvé dans les données brutes. En outre, le système de numération est choisi de sorte que les données numériques maintiennent la signification sémantique en ce qui concerne les données brutes. Une fois converti en format numérique, les données sont traitées en utilisant de diverses techniques pour extraire la meilleure information à partir des données brutes dans une base de données distillée.