¿Existe el DNA basura? Proyecto ENCODE

La prepotencia y la soberbia de los científicos a veces alcanzan límites insospechados. Una muestra ha sido la corriente científica que llevó a pensar que la mayoría del DNA humano era “DNA basura” ya que solamente una pequeña cantidad estaba destinada a codificar proteínas. En lugar de admitir que no éramos capaces de averiguar el significado de la mayoría de las secuencias, lo que se propuso fue: “si no encontramos su función, será que no tiene ninguna”. Una muestra más de la estupidez humana, pero en el campo científico.

El proyecto ENCODE (acrónimo de ENCyclopedia Of  DNA Elements” ), en el que han intervenido 442 investigadores, 22 de ellos españoles, procedentes de 32 laboratorios del Reino Unido, Estados Unidos, Singapur, Japón, Suiza y España, ha sido coordinado por el Dr. Ewan Birney, director asociado del Instituto de Bioinformática Europeo. ENCODE es un proyecto financiado por el National Institutes of Health (NIH) y liderado por el National Genome Research Institute (NHGRI) de los Estados Unidos y el EMBL- European Bioinformatics Institute (EMBL-EBI) en el Reino Unido.

encode nature graphic

Figura de Darryl Leja (NHGRI) e Ian Dunham (EBI) procedente de la página de internet del proyecto ENCODE (http://encodeproject.org/ENCODE/aboutScaleup.html)

ENCODE ha analizado de forma exhaustiva el DNA humano y tras una primera fase, iniciada en Septiembre de 2003,  en la que se abordó  el estudio del 1% del genoma humano, los resultados actuales de la segunda fase, iniciada en 2007,  indican que al menos el 80.4% de los elementos del DNA tienen alguna función o significado bioquímico, ya que se han detectado 4 millones de señales que regulan la actividad génica. La mayoría del genoma está cerca de algún elemento regulador:  el 95% del genoma se sitúa  como promedio a 8 Kb de alguna interacción DNA-proteína y el 99% está a 1,7 Kb de algún evento bioquímico detectado por ENCODE. La principal conclusión ha sido el enorme grado de complejidad de nuestro genoma y la gran cantidad de elementos destinados a regular la expresión génica. Probablemente, cuando se siga avanzando en el conocimiento de nuestro genoma quedará poco espacio para la “basura”. Aunque existan elementos de DNA de función desconocida, que pueden proceder de genes o secuencias que en su día tuvieron función, siendo en la actualidad “DNA basura”, hay que recordar que hasta la basura tiene una función y se puede reciclar, siendo el actual “DNA basura” parte del material base con el que juega la evolución para producir  nuevas funciones.

genome-research

nature

 

 

 

 

 

 

 

 

 

 

 

 

ENCODE ha identificado la gran mayoría de los transcritos de 147 tipos celulares y tejidos diferentes, poniendo de manifiesto que lo habitual es el procesamiento alternativo y la aparición de varios polipéptidos a partir de una región genómica. Los 21.000 genes identificados, representan solamente un 1% de los 3.000 millones de nucleótidos del DNA humano, y codifican para 90.000 proteínas. El proyecto ha caracterizado 70.292 regiones promotoras e inicios de la transcripción alternativos  que se sitúan justo antes (“aguas arriba”) de los genes, a las que se unen proteínas que regulan su expresión. Además, se han encontrado 2,9 millones de elementos o secuencias de unión a diferentes factores de transcripción y 399.124 elementos que potencian o reducen la expresión de genes distantes.  Se han caracterizado regiones hipersensibles a la acción de la DNAasa y a la metilación, variaciones en la estructura de la cromatina con zonas en la que se producen modificaciones de las histonas (metilaciones, acetilaciones, etc) y regiones de cromatina más o menos compactada con una mayor o menor densidad de nucleosomas, estando dichas modificaciones estructurales de la cromatina íntimamente relacionadas con el estado activo o inactivo de las correspondientes regiones genómicas.

Se ha observado la transcripción de un porcentaje del genoma mucho más elevado de lo esperado, un 15% de los nucleótidos está en los transcritos maduros y hasta un 90% del resto de los nucleótidos se encuentra en los transcritos primarios de algún tipo celular o tejido. También se ha visto que una quinta parte de los 200 pseudogenes detectados se transcriben.

Un hallazgo singular ha sido la detección de un elevado porcentaje de RNA no codificantes o transcritos que no se traducen a proteína. En especial se ha encontrado una gran cantidad de RNA largos (con más de 200 ribonucleótidos) no codificantes o lncRNA, con importantes funciones reguladoras como la inhibición en “trans” de múltiples genes o su actuación como soporte o estructura a la que se unen diferentes factores que regulan la expresión génica modificando la estructura de la cromatina.

genome-research2encode-proyect

 

 

 

 

 

 

 

 

 

 

 

Como consecuencia de estos hallazgos, la hipótesis “un gen- una enzima” posteriormente matizada como “un gen – un polipéptido”  ha dejado de ser correcta. Incluso, la visión simple de un gen que da lugar mediante diferentes procesamientos alternativos a diferentes transcritos y a distintas isoformas proteicas también ha quedado obsoleta. El proyecto ENCODE ha puesto de manifiesto que ambas cadenas de DNA de una región del genoma pueden contener información para varios productos proteicos y dar lugar incluso a transcritos (RNA) que no se traducen o RNA no codificantes. Por tanto, el concepto actual de gen sería el de “región del genoma que codifica para varios productos funcionales solapantes (RNA no codificantes y proteínas)”.

El reto actual más importante es relacionar la enorme cantidad de información generada por ENCODE con las enfermedades. Por este motivo, la información obtenida se ha contrastado con datos de expresión génica y relacionado con la existencia de Polimorfismos de un Solo Nucleótido (SNPs) y variaciones en el número de copias (CNV) de diferentes regiones genómicas asociadas con la aparición de enfermedades. En muchos casos, los fenotipos de distintas enfermedades se han asociado con un tipo celular específico o con un factor de transcripción.

Los resultados de ENCODE son, actualmente, la principal referencia en estudios genómicos incluidos los de genómica personalizada del cáncer. Existen evidencias de la estrecha relación existente entre mutaciones que alteran señales que regulan la expresión génica y el cáncer, como son las mutaciones en genes relacionados con el procesamiento de la información genómica en la Leucemia Linfocítica Crónica.

Pin It

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Time limit is exhausted. Please reload CAPTCHA.