Profile searching in nucleic acid sequences using the fast fourier transformation

   
   

One embodiment of the present invention provides methods for detecting known blocks of functionally aligned protein sequences in a test nucleic acid sequence, e.g., in an uncharacterized EST. The method can include the following steps. A) Reverse translate the set of protein sequences to a set of functionally aligned nucleic acid sequences using codon-usage tables and create a profile from the set of functionally aligned nucleic acid sequences. B) Construct a first indicator function for the profile. The first indicator function corresponds to adenine. The first indicator function allows the value at a given position to be continuous between 0 and 1 as a function of the percentage presence of adenine at a particular position. C) Construct a second indicator function for the test nucleic acid sequence. The second indicator function also corresponds to adenine. D) Compute the Fourier transform of each of the indicator functions. E) Complex conjugate the Fourier transform of the second indicator function. F) Multiply the Fourier transform of the first indicator function and the complex conjugated Fourier transform of the second indicator function to obtain a Fourier transform of the number of matches of adenine bases. G) Repeat steps B-F above for guanine, thymine, and cytosine. H) Sum the Fourier transforms of the number of matches for each base, respectively, to obtain the total Fourier transform. I) Compute the inverse Fourier transform of the total Fourier transform to obtain a complex series. J) Take the real part of the series to determine the total number of base matches for the variety of possible lags of the profile relative to the test sequence. The method can then detect the presence of known blocks of functionally aligned protein sequences in a test nucleic acid sequence based on the total number of base matches for the variety of possible lags.

Una encarnación de la actual invención proporciona los métodos para detectar bloques sabidos de las secuencias funcionalmente alineadas de la proteína en una secuencia del ácido nucleic de la prueba, e.g., en un EST uncharacterized. El método puede incluir los pasos siguientes. A) Invierta traducen el sistema de secuencias de la proteína a un sistema de secuencias funcionalmente alineadas del ácido nucleic usando las tablas del codon-uso y crean un perfil del sistema de secuencias funcionalmente alineadas del ácido nucleic. B) Construya una primera función del indicador para el perfil. La primera función del indicador corresponde a la adenina. La primera función del indicador permite que el valor en una posición dada sea continuo entre 0 y 1 en función de la presencia del porcentaje de la adenina en una posición particular. C) Construya una segunda función del indicador para la secuencia del ácido nucleic de la prueba. La segunda función del indicador también corresponde a la adenina. D) Compute el Fourier transforman de cada uno de las funciones del indicador. E) Conjugación del complejo que el Fourier transforma de la segunda función del indicador. F) Multiplique el Fourier transforman de la primera función del indicador y el Fourier conjugado complejo transforma de la segunda función del indicador para obtener un Fourier transforma del número de fósforos de las bases de la adenina. G) Repita los pasos B-F arriba para el guanine, el thymine, y el cytosine. H) Sume el Fourier transforma del número de los fósforos para cada base, respectivamente, para obtener el Fourier total transforman. I) Compute el Fourier inverso transforman del Fourier total transforman para obtener una serie compleja. J) Tome la parte real de la serie para determinar el número total de los fósforos bajos para la variedad de retrasos posibles del perfil concerniente a la secuencia de prueba. El método puede entonces detectar la presencia de bloques sabidos de las secuencias funcionalmente alineadas de la proteína en una secuencia del ácido nucleic de la prueba basada en el número total de los fósforos bajos para la variedad de retrasos posibles.

 
Web www.patentalert.com

< Functionalized thiophene oligomers and their use as fluorescent markers

< Romaine lettuce variety named Sunbelt

> Adenovirus vectors for the transfer of foreign genes into cells of the central nervous system particularly in brain

> Chemical structure identification

~ 00154