Multiple words in a text are transformed to unique numerical
representations for text mining applications. A web server receives the
text, including multiple words in a natural language. A key-word extractor
extracts one or more key-words from the received words. A morphologizer
morphologizes the extracted key-words based on similarities of fundamental
characteristics in the extracted key-words. An analyzer transforms each of
the morphologized words to a unique numerical representation such that the
transformed unique numerical representation does not result in multiple
similar numerical representations.
De veelvoudige woorden in een tekst worden omgezet aan unieke numerieke vertegenwoordiging voor de toepassingen van de tekstmijnbouw. Een Webserver ontvangt de tekst, met inbegrip van veelvoudige woorden in een natuurlijke taal. Een sleutelwoordtrekker haalt één of meerdere sleutelwoorden uit de ontvangen woorden. Een morphologizer morphologizes de gehaalde sleutelwoorden die op gelijkenissen van fundamentele kenmerken in de gehaalde sleutelwoorden worden gebaseerd. Een analysator zet elk van om morphologized woorden aan een unieke numerieke vertegenwoordiging dusdanig dat de omgezette unieke numerieke vertegenwoordiging niet in veelvoudige gelijkaardige numerieke vertegenwoordiging resulteert.