A hybrid hash join process joins data rows from two tables which have at least one common data column by partitioning the data rows based on the values in the common data column(s), creating data structures to decrease search time for matching rows, and recovering full data buffers using a unique buffer management methodology. A smaller one of the two tables is designated as an outer table and a larger one of the two tables as an inner table. The hybrid hash join process determines which rows in the inner and outer tables satisfy a selection criteria; the rows that satisfy the selection criteria are referred to as inner hit rows and outer hit rows. The hybrid hash join process assigns the inner and outer hit rows to corresponding inner and outer partitions, respectively. Buffer overflow in the outer partitions is handled by linking empty buffers to the outer partitions until all buffers are used. Buffer space is recovered by writing outer hit rows for a selected partition to mass storage. Buffer overflow in the inner partitions is handled by either writing the inner rows in the buffer to mass storage or by searching the corresponding outer partition for matches. The outer hit rows in the corresponding outer partition are allocated to entries in a data structure which is then probed to find matches for the inner hit rows in the buffer. Matching outer hit rows for any inner hit rows written to mass storage are found by repeatedly reading into memory inner and outer hit rows and probing a data structure created from the memory-resident outer hit rows in a partition. Optionally, binary trees are built from the entries in the data structure to speed up the probing procedure. The hybrid hash join process uses at least one hashing algorithm to assign hit rows to partitions, to allocate rows to entries in the data structures, and to probe the data structures for matches.

Des informations parasites hybrides joignent le processus joignent des rangées de données de deux tables qui ont au moins une colonne commune de données en divisant les rangées de données basées sur les valeurs dans le column(s) commun de données, créant des structures de données pour diminuer le temps de recherche pour des rangées assorties, et récupérant de pleins amortisseurs de données en utilisant une méthodologie unique de gestion d'amortisseur. Plus petit des deux tables est indiqué en tant qu'une table externe et plus grande des deux tables comme table intérieure. Les informations parasites hybrides joignent de processus déterminent quelles rangées dans les tables intérieures et externes satisfont des critères d'un choix ; les rangées qui satisfont les critères de choix désigné sous le nom des rangées intérieures de coup et des rangées externes de coup. Les informations parasites hybrides joignent le processus assignent les rangées intérieures et externes de coup à la correspondance les cloisons intérieures et externes, respectivement. Le débordement d'amortisseur dans les cloisons externes est manipulé en liant les amortisseurs vides aux cloisons externes jusqu'à ce que tous les amortisseurs soient employés. L'espace d'amortisseur est récupéré en écrivant des rangées externes de coup pour une cloison choisie à la mémoire de masse. Le débordement d'amortisseur dans les cloisons intérieures est manipulé en écrivant les rangées intérieures dans l'amortisseur à la mémoire de masse ou en recherchant la cloison externe correspondante des allumettes. Les rangées externes de coup dans la cloison externe correspondante sont assignées aux entrées dans une structure de données qui est alors sondée pour trouver des allumettes pour les rangées intérieures de coup dans l'amortisseur. Des rangées externes assorties de coup pour toutes les rangées intérieures de coup écrites à la mémoire de masse sont trouvées en lisant à plusieurs reprises dans des rangées intérieures et externes de mémoire de coup et en sondant une structure de données créée des rangées externes résidantes en mémoire de coup dans une cloison. Sur option, des arbres binaires sont construits des entrées dans la structure de données pour accélérer le procédé de sondage. Les informations parasites hybrides joignent des utilisations de processus au moins un algorithme de brouillage d'assigner des rangées de coup aux cloisons, d'assigner des rangées aux entrées dans les structures de données, et de sonder les structures de données pour des allumettes.

 
Web www.patentalert.com

< (none)

< Text structure analysis method and text structure analysis device

> Method and apparatus for cross-linguistic database retrieval

> (none)

~ 00009