A parsing system and method are provided in which the break characters in the document are used to rapidly parse the document and extract one or more key phrases from the document which characterize the document. The break characters in the document may include explicit break characters, such as punctuation, soft stop words and hard stop words. The determination of which phrases in the document are extracted depends upon the type of break character appearing after the phrase in the document.

Een een het ontleden systeem en methode worden verstrekt waarin de onderbrekingskarakters in het document worden gebruikt om het document snel te ontleden en één of meerdere zeer belangrijke uitdrukkingen te halen uit het document die het document kenmerken. De onderbrekingskarakters in het document kunnen expliciete onderbrekingskarakters, zoals punctuatie, zachte eindewoorden en harde eindewoorden omvatten. De bepaling waarvan de uitdrukkingen in het document worden gehaald hangt van het type van onderbrekingskarakter dat na de uitdrukking in het document verschijnt af.

 
Web www.patentalert.com

< (none)

< Spelling and grammar checking system

> Tape drive apparatus for judging an operational mode of the tape based on detected tape management information

> (none)

~ 00038