The invention provides a mechanism for using statistics, in connection with
various database query cost modeling techniques, to more accurately
estimate the number of rows and UECs that will be produced by relational
operators and predicates in database systems. The ability to accurately
estimate the number of rows and UECs returned by a relational operator
and/or a predicate is fundamental to computing the cost of a query
execution plan. This, in turn, drives the optimizer's ability to select
the query plan best suited for the desired performance goal. According to
the present invention, histogram statistics are synthesized bottom up from
the leaf nodes to the root node of a query tree. Given input statistics in
the form of histograms for each operand of a relational operator or
predicate, the present inventive method and apparatus merge the input
statistics in a way that it simulates the effects of the run time operator
on the actual data, so as to produce a predicted row count and UEC for
each histogram interval representative of the data that actually will be
produced by each such operator or predicate in the query tree. A database
query optimizer may use these statistics to select and implement an
optimal query plan.
La invención proporciona un mecanismo para usar estadística, en la conexión con la varia pregunta de la base de datos costada modelando técnicas, más exactamente a la estimación el número de las filas y de UECs que serán producidos por los operadores emparentados y los predicados en sistemas de la base de datos. La capacidad de estimar exactamente el número de las filas y de UECs vueltos por un operador emparentado y/o un predicado es fundamental a computar el coste de un plan de la ejecución de la pregunta. Esto, alternadamente, conduce la capacidad del optimizador de seleccionar el plan de la pregunta satisfecho lo más mejor posible para la meta deseada del funcionamiento. Según la actual invención, la estadística del histograma es fondo sintetizado para arriba de los nodos de la hoja al nodo de la raíz de un árbol de la pregunta. La estadística dada de la entrada en la forma de histogramas para cada operando de un operador emparentado o un predicado, el actual método inventivo y aparato combina la estadística de la entrada en una manera que simula los efectos del operador runtime en los datos reales, para producir una cuenta de la fila y un UEC predichos para cada representante del intervalo del histograma de los datos que serán producidos realmente por cada tal operador o predicado en el árbol de la pregunta. Un optimizador de la pregunta de la base de datos puede utilizar esta estadística para seleccionar y para poner un plan óptimo de la pregunta en ejecucio'n.