The invention concerns a method (200) and system (100) for searching for
duplicate data. The method (200) includes the steps of: generating (212)
at least one identifier from at least one portion of a first segment of
data using a unique identifier function; generating (216) at least one
identifier from at least one portion of a second segment of data using the
unique identifier function; and comparing (220) at least one identifier
associated with the first segment of data with at least one identifier
associated with the second segment of data to determine whether the first
segment of data is substantially identical to the second segment of data.
La invención se refiere a un método (200) y al sistema (100) para buscar para datos duplicados. El método (200) incluye los pasos de: generando (212) por lo menos un identificador por lo menos de una porción de un primer segmento de los datos que usan un identificador único funcione; generando (216) por lo menos un identificador por lo menos de una porción de un segundo segmento de los datos que usan el identificador único funcione; y comparando (220) por lo menos un identificador se asoció al primer segmento de datos con por lo menos un identificador asociado al segundo segmento de datos para determinarse si el primer segmento de datos es substancialmente idéntico al segundo segmento de datos.