A method for estimating the result of a query on a database having data
records arranged in tables. The database has an expected workload that
includes a set of queries that can be executed on the database. An
expected workload is derived comprising a set of queries that can be
executed on the database. A sample is constructed by selecting data
records for inclusion in the sample in a manner that minimizes an
estimation error when the data records are acted upon by a query in the
expected workload to provide an expected workload to provide an expected
result. The query accesses the sample and is executed on the sample,
returning an estimated query result. The expected workload can be
constructed by specifying a degree of overlap between records selected by
queries in the given workload and records selected by queries in the
expected workload.
Un método para estimar el resultado de una pregunta en una base de datos que hace expedientes de datos arreglar en tablas. La base de datos tiene una carga de trabajo prevista que incluya un sistema de las preguntas que se pueden ejecutar en la base de datos. Una carga de trabajo prevista se deriva que abarca un sistema de las preguntas que se pueden ejecutar en la base de datos. Una muestra es construida seleccionando los expedientes de datos para la inclusión en la muestra de una manera que reduzca al mínimo un error de la valoración cuando los expedientes de datos son actuados sobre por una pregunta en la carga de trabajo prevista para proporcionar una carga de trabajo prevista para proporcionar un resultado previsto. La pregunta tiene acceso a la muestra y se ejecuta en la muestra, volviendo un resultado estimado de la pregunta. La carga de trabajo prevista puede ser construida especificando un grado del traslapo entre los expedientes seleccionados por preguntas en la carga de trabajo dada y los expedientes seleccionados por preguntas en la carga de trabajo prevista.