The present invention provides various methods and apparatus for providing
accurate estimates for point and range queries over two-dimensional
rectangular data. However, the techniques of the present invention for
rectangular data can be applied to data of other shapes, point data, or
linear data. The present invention provides several grouping techniques
for the approximating of spatial data. A method is disclosed for grouping
a plurality of spatial inputs into a plurality of buckets. In one form of
the present invention the plurality of spatial inputs, is grouped based on
an equi-area partitioning technique. The equi-area partitioning technique
can use the longest dimension of a bucket or bounding polygon as the
criteria for splitting into further buckets or bounding polygons. An
equi-count technique can also be used wherein the buckets are split using
the highest projected spatial input count along a dimension as a splitting
criteria. The bounding polygons may be minimum bounding rectangles. In one
form of the present invention a method is provided which uses a grid of
regions superimposed over a plurality of spatial inputs. The method can
determine a measure of the density of the spatial inputs within each
region of the grid of regions and uses this measurement of density to
determine how to group the spatial inputs into buckets. When a query is
received the present invention applies the query to the buckets created by
whatever method and gives an estimate of the number of spatial inputs
contained within the query by preferably assuming that spatial inputs are
uniformly distributed within each bucket.
La actual invención proporciona varios métodos y el aparato para proporcionar las estimaciones exactas para los datos rectangulares de dos dimensiones del excedente de las preguntas del punto y de la gama. Sin embargo, las técnicas de la actual invención para los datos rectangulares se pueden aplicar a los datos de otras formas, a los datos del punto, o a los datos lineares. La actual invención proporciona varias técnicas que agrupan para aproximar de datos espaciales. Un método se divulga para agrupar una pluralidad de entradas espaciales en una pluralidad de cubos. En una forma de la actual invención la pluralidad de entradas espaciales, se agrupa basó en una técnica que reparte del equi-a'rea. La técnica que reparte del equi-a'rea puede utilizar la dimensión más larga de un cubo o el polígono de limitación como los criterios para partir en otros cubos o polígonos de limitación. Equi-cuente la técnica puede también ser utilizado en donde los cubos están partidos usando la cuenta espacial lo más arriba posible proyectada de la entrada a lo largo de una dimensión como los criterios que parten. Los polígonos de limitación pueden ser rectángulos de limitación del mínimo. En una forma de la actual invención se proporciona un método que utiliza una rejilla de las regiones sobrepuestas sobre una pluralidad de entradas espaciales. El método puede determinar una medida de la densidad de las entradas espaciales dentro de cada región de la rejilla de regiones y utiliza esta medida de la densidad para determinarse cómo agrupar las entradas espaciales en los cubos. Cuando se recibe una pregunta la actual invención aplica la pregunta a los cubos creados por cualquier método y da a estimación del número de las entradas espaciales contenidas dentro de la pregunta preferiblemente si se asume que las entradas espaciales están distribuidas uniformemente dentro de cada cubo.