A method and apparatus for determining the veracity of data. The method includes at least one comparison of manually input data and data generated by an automated process. The data generated by the automated process is typically the result of optical character recognition (OCR) and includes the generation of both classification of the optically read data as well as confidences for the data. For each piece of data processed by the OCR, the OCR program will generate a classification, which is a guess by the OCR program as to what that piece of data is, and a confidence level, which is the OCR's evaluation of how good the classification guess was. Depending on whether it is desired to check the accuracy of the manually input data or the results of the optical character recognition determines how the data is compared. The low confidence data is typically re-keyed into the system manually. To perform quality assurance on the manually input data, one compares the results of the optical character recognition with the manually input data. If they match, the manually input data is determined to be accurate and passes a quality assurance test. If they do not match, a second operator inputs additional data manually. This will be compared to the first set of manually input data, and if these sets of data match, then the first set of manually input data is determined to be accurate, thus passing the quality assurance test. If these data sets do not match, then the results of the optical character recognition are compared to the second set of manually input data. If these two sets of data match, then it is determined that the first set of manually input data is inaccurate and thus failing the quality assurance test. Similar comparisons are performed to test the veracity of the optical character recognition data.

Un método y un aparato para determinar la veracidad de datos. El método incluye por lo menos una comparación manualmente de los datos de entrada y de los datos generados por un proceso automatizado. Los datos generados por el proceso automatizado son típicamente el resultado del reconocimiento de caracteres óptico (OCR) e incluyen la generación de ambos clasificación de los datos ópticamente leídos así como los confidences para los datos. Para cada pedazo de datos procesado por el OCR, el programa del OCR generará una clasificación, que es una conjetura por el programa del OCR en cuanto a cuáles es ese pedazo de datos, y un nivel de la confianza, que es la evaluación de OCR's de cómo es bueno era la conjetura de la clasificación. Dependiendo si está deseado para comprobar la exactitud del manualmente de datos de entrada o de los resultados del reconocimiento de caracteres óptico se determina cómo se comparan los datos. Los datos bajos de la confianza se reintroducen típicamente en el sistema manualmente. Para realizar garantía de calidad en manualmente los datos de entrada, uno compara los resultados del reconocimiento de caracteres óptico con manualmente los datos de entrada. Si emparejan, los datos de entrada se determinan para ser exactos y pasan manualmente una prueba de la garantía de calidad. Si no emparejan, un segundo operador entra datos adicionales manualmente. Esto será comparada al primer sistema manualmente de datos de entrada, y si estos sistemas de datos emparejan, después al primer sistema de datos de entrada se determina manualmente de ser exacto, así pasando la prueba de la garantía de calidad. Si estos modems no emparejan, entonces los resultados del reconocimiento de caracteres óptico se comparan al segundo sistema manualmente de datos de entrada. Si estos dos sistemas de datos emparejan, entonces se determina que el primer sistema de datos de entrada es manualmente inexacto y así que falla en la prueba de la garantía de calidad. Las comparaciones similares se realizan para probar la veracidad de los datos del reconocimiento de caracteres óptico.

 
Web www.patentalert.com

< (none)

< Liquid-crystal shutter

> Wavelength division multiplexing device

> (none)

~ 00016