System and method for searching for duplicate data page

The invention concerns a method (200) and system (100) for searching for duplicate data. The method (200) includes the steps of: generating (212) at least one identifier from at least one portion of a first segment of data using a unique identifier function; generating (216) at least one identifier from at least one portion of a second segment of data using the unique identifier function; and comparing (220) at least one identifier associated with the first segment of data with at least one identifier associated with the second segment of data to determine whether the first segment of data is substantially identical to the second segment of data.

La invención se refiere a un método (200) y al sistema (100) para buscar para datos duplicados. El método (200) incluye los pasos de: generando (212) por lo menos un identificador por lo menos de una porción de un primer segmento de los datos que usan un identificador único funcione; generando (216) por lo menos un identificador por lo menos de una porción de un segundo segmento de los datos que usan el identificador único funcione; y comparando (220) por lo menos un identificador se asoció al primer segmento de datos con por lo menos un identificador asociado al segundo segmento de datos para determinarse si el primer segmento de datos es substancialmente idéntico al segundo segmento de datos.