La historia del conocimiento del genoma

Inicio


El estudio de nuestro genoma no es tan reciente como algunos piensan; muchos investigadores, a lo largo de siglos, han contribuido a construir su conocimiento, en una historia de eventos que permitieron sentar las bases para lo que ahora llamamos el estudio del genoma humano.

El estado actual de nuestro conocimiento acerca de la molécula que controla el funcionamiento de nuestras células nos permite saber la cantidad de genes que nos conforman y, más recientemente, la forma en que está organizado nuestro material genético. Si bien falta todavía mucha investigación para llegar a conocer con precisión cómo se regula su funcionamiento, lo cierto es que el avance es notable.

Leeuwenhoek 
Hasta el momento en que los trabajos perdidos de Mendel fueron redescubiertos (1900) e introducidos en la literatura del mundo científico, nadie sabía de qué estaban hechos los genes, pero tales escritos inyectaron una gran energía a la investigación. Algunos eventos relevantes que desembocaron en la información que actualmente conocemos sobre nuestro genoma son: en 1683, Leeuwenhoek descubrió las bacterias; y el ácido desoxirribonucleico (ADN) surgió a la luz, a principios del siglo XX.

Durante la primera parte del siglo XX, la presencia de las cuatro letras (nucleótidos) que forman el ADN parecía carecer de la complejidad necesaria para codificar la gran cantidad de información presente en el genoma; por ello los científicos, originalmente, rechazaron la idea de que el ADN pudiese ser la fuente de la información genética. De modo que fue toda una sorpresa el que experimentos realizados en los años cuarentas pusieran los reflectores sobre el ADN, mostrándolo como la molécula depositaria de la información genética.

En la década de los cincuentas, el descubrimiento de los secretos en torno a la replicación del ADN y su transcripción, vía el arreglo (apareamiento) de nucleótidos —también llamados bases nitrogenadas, porque son compuestos químicos que contienen nitrógeno en su estructura—, respondió algunas de las interrogantes acerca de cómo la información genética puede ser copiada y transmitida de célula a célula y de generación en generación. Para 1961, el descubrimiento del funcionamiento del código genético resolvió el problema sobre la forma en que 20 aminoácidos utilizan un código de sólo cuatro letras, para formar diferentes tipos de proteínas.

La invención de la técnica de secuenciación del ADN —que consiste en leer el orden de las letras químicas que componen la molécula— así como de las técnicas de clonación (procesos que posibilitan la separación de genes individuales del resto del genoma, y que éstos se repliquen en muchas copias idénticas) condujeron, en los años setentas, a conocer las primeras secuencias de los genes humanos, lo que fue un gran logro en ese tiempo.

En los años ochentas, la técnica de Reacción en Cadena de la Polimerasa hizo viable el estudio del ADN, sin necesidad de clonarlo previamente, y la creación de los cromosomas artificiales facilitó la clonación de enormes piezas de ADN, miles de veces más grandes que las primeras piezas clonadas en los años setentas.

La planeación del Proyecto del Genoma Humano se comenzó durante la década de los ochentas y se inició oficialmente en 1990, cuando ya se contaba con el apoyo de la robótica y las computadoras de alta velocidad, todo lo cual permitió la obtención de grandes cantidades de datos de secuenciación en un solo experimento. El resultado es que, actualmente, se puede tener acceso a las secuencias de nuestros genes, porque éstas se encuentran públicamente disponibles en una base de datos llamada GenBank, en el Centro Nacional para la Información Biotecnológica (NCBI, por sus siglas en inglés), de la Librería Nacional de Medicina de los Estados Unidos de América.

El Proyecto del Genoma Humano fue planeado para tener una duración de 15 años, pero los avances tecnológicos permitieron realizarlo en sólo 13; así, los resultados fueron publicados en abril de 2003, y ello significó la culminación de un esfuerzo realizado por un equipo internacional, compuesto por 20 grupos de investigación de los Estados Unidos, el Reino Unido, Japón, Francia, Alemania y China.

¿Que encontramos en nuestro material genético?


Al hablar de la secuenciación del ADN, nos referimos al orden en el que se encuentran los elementos que componen la molécula, los cuales son los nucleótidos adenina, guanina, timina y citocina. Cuando se conoce este orden, es posible hacer mapas para ubicar la localización de los diferentes genes en nuestros cromosomas. Conviene recordar que el genoma humano está ordenado en 23 cromosomas, que contienen aproximadamente tres billones de bases nitrogenadas, por lo que su secuenciación y análisis representó un desafío de gran magnitud.

Los resultados del proyecto de la secuenciación del genoma humano revelaron que hay, probablemente, 20,500 genes en nuestro genoma; cifra que se considera es la base de las instrucciones heredables para el desarrollo y función de un ser humano. Un hallazgo sorprendente fue que el número de genes contabilizados resultó ser notablemente menor al previamente estimado, el cual fluctuaba entre 50,000 y 140,000.


De manera significativa, el análisis reveló que cerca de 50% de nuestro genoma contiene secuencias repetitivas (fragmentos de ADN, cuyo orden de bases nitrogenadas se repite cada determinado espacio, en un cromosoma) que no codifican para ninguna proteína, por lo cual, la función de estos segmentos de ADN aún es desconocida; así mismo, dicho análisis dejó ver que la longitud promedio de un gen que se expresa es de, aproximadamente, 3,000 bases. Aún más, a partir de esta información, los científicos pudieron detectar que de persona a persona hay una similitud de 99.9% en su secuencia de ADN; incluso, se logró identificar más fácilmente genes candidatos (aquellos que pueden ser relacionados con la presencia de enfermedades); sin embargo, también se encontró que la función de la mitad de los genes de nuestro genoma todavía no se conoce.
Proyecto ENCODE




Una vez terminada la secuenciación de nuestro genoma, se hizo necesario conocer su organización para entender cómo se regula la expresión de nuestros genes; de esta manera nació el proyecto de la Enciclopedia de los elementos del ADN (The Encyclopedia of DNA Elements, ENCODE, por su acrónimo en inglés), y con ello, la siguiente fase del estudio del genoma.

El proyecto ENCODE nació en 2003, y su objetivo fue catalogar las secuencias (fragmentos) de ADN con una función ya identificada, además de conocer cuándo y en cuáles células las secuencias se encuentran activas, cómo se regulan sus funciones, y cómo son leídas por la maquinaria celular.


El proyecto fue realizado por un consorcio de 32 grupos de investigación, con la participación de más de 440 científicos, quienes aplicaron 24 diferentes tipos de experimentos sobre la molécula de ADN. En total, el equipo realizó 1,648 experimentos en cerca de 147 diferentes tipos de células, cuyos resultados fueron publicados en septiembre de 2012. 

Los científicos aislaron y secuenciaron las moléculas de ácido ribonucleico (ARN) que se trascribieron del ADN, e identificaron los sitios de unión de más o menos 120 factores de transcripción. También ubicaron sitios en el genoma en donde se unió el grupo químico metilo (grupo químico considerado como una marca que indica las áreas en las cuales los genes no se están expresando). Así mismo, investigaron los patrones de las modificaciones químicas de unas proteínas llamadas histonas —que se unen y ayudan a empaquetar el ADN en los cromosomas y señalan regiones en donde la expresión de genes se está realizando o no; es decir, regiones que producen o no proteínas encargadas de regular una función celular—.

Después de una fase piloto, iniciada en 2003, a partir de la cual se analizó sólo 1% del genoma, para determinar cuáles técnicas podrían aplicarse en el estudio del genoma completo, los científicos del proyecto ENCODE comenzaron a aplicar los métodos de análisis seleccionados en el genoma completo, durante el año 2007.

El proyecto piloto inicial transformó la visión de los biólogos del genoma; por ejemplo, se encontró que si, por una parte, sólo una pequeña cantidad del ADN genera ARN mensajeros —que codifican para (producen) proteínas—, por otra, una gran cantidad del genoma transcribe (produce) moléculas de ARN que no codifican para (producen) proteínas; también se halló que algunas de estas moléculas —como ahora se sabe— son reguladores importantes para controlar la expresión de genes.


Esta segunda fase de análisis del genoma ha concluido y los resultados se publicaron en 30 artículos científicos en las revistas Nature, Genoma Research y Genome Biology. Entre ellos se aborda un hallazgo: de manera contraria a lo que anteriormente constituía una consideración más o menos extendida, respecto de que gran parte del ADN parecía no tener función alguna, los resultados del proyecto concluyeron con la asignación de una función a, aproximadamente, 80% del genoma. Uno de sus descubrimientos permitió encontrar más de 70,000 promotores (sitios en el ADN adyacentes a los genes, en los cuales se unen las proteínas que controlan su expresión), aproximadamente 400,000 regiones potenciadoras (enhancers) de la expresión genética (secuencias de ADN que regulan la expresión de genes distantes). Los promotores y las regiones potenciadoras, por controlar la expresión de los genes, fueron denominados regiones reguladoras de la expresión genética; las cuales se encontraron en 125 diferentes tipos de células, y casi 2.9 millones de ellas fueron ubicadas; un tercio se encontró en un solo tipo de célula y 3,700 en todos los tipos celulares, lo que sugiere la existencia de diferencias importantes en la forma como se regula la expresión de genes de célula a célula, porque no se encontraron todas las regiones reguladoras en todos los tipos de células.


De esta manera, las vastas zonas del ADN que, anteriormente, se suponía no contenían genes, ahora se sabe que están pobladas con cientos de miles de regiones que contribuyen a la regulación de la expresión genética, y que diferentes células usan diferentes combinaciones de dichas regiones, para contribuir a la biología única de la célula. Esta riqueza presente en las regiones responsables de regular la expresión genética podría explicar cómo es que, relativamente pocos genes que codifican para proteínas, pueden dar lugar a la complejidad necesaria para crear un ser humano, y que, si bien el genoma humano es el mismo en todas las células humanas, aparentemente, no se usa de la misma manera en todas ellas.



Genoma y enfermedades genéticas 


La información obtenida del análisis del genoma ayuda también a los investigadores a entender más sobre las enfermedades genéticas. Por ejemplo, desde hace tiempo se conoce que en el genoma existen variaciones, ubicadas en la molécula de ADN, asociadas con riesgos de enfermedades, pero ahora se sabe también que casi 90% de estas variaciones se encuentran en regiones que no codifican para proteínas, por lo tanto, hasta ahora se desconoce cómo ellas podrían causar una enfermedad genética, puesto que la información del proyecto ENCODE reveló que muchas de estas variaciones se encuentran en las regiones que regulan la expresión genética.

Los datos obtenidos hasta ahora iluminan algunas partes oscuras del genoma, permitiéndonos entender cómo las variaciones genéticas afectan las características del humano y propician la presencia de enfermedades.

¿Y ahora que sigue?


El proyecto está lejos de terminar, de acuerdo con los investigadores de ENCODE, pues consideran que aún los esfuerzos para conocer la organización y función del genoma están a la mitad del camino, y que, probablemente, su caracterización detallada sólo ha alcanzado 10%; no obstante, se calcula que una tercera fase del análisis proveerá información más detallada sobre el genoma.

Los investigadores podrían pasar años analizando los datos obtenidos hasta ahora por el proyecto ENCODE; sin embargo, dado que los resultados se han generado a partir de experimentos realizados en sólo unos pocos tipos diferentes de células, resulta difícil considerar cuántos tipos de ellas deben ser analizados para obtener información concluyente sobre la función del ADN.

En este sentido, la mayoría de los experimentos se ha realizado en células utilizadas como modelos de investigación en laboratorio y, por lo mismo, tienen propiedades diferentes de las células normales, porque han sido manipuladas genéticamente. Por ejemplo, las células más estudiadas son unas llamadas HeLa y GM12878; las primeras tuvieron su origen en una biopsia de cáncer cervical hace más de 50 años, y contienen muchas modificaciones en su genoma; por otro lado, las GM12878 provienen de células sanguíneas, que fueron inducidas a reproducirse mediante el uso de un virus; de modo que, los resultados obtenidos de los experimentos con estas células no se podrían comparar con lo que sucede en células normales.

Debido a lo anterior, los investigadores del proyecto ENCODE planean hacer ahora experimentos en células tomadas directamente de una persona, aunque, desafortunadamente, muchas de estas células no se pueden dividir en el laboratorio, y la obtención de material suficiente representa un problema complicado de resolver; además de que es difícil tomar muestras de algunos tejidos, como el cerebro. 

De acuerdo con los investigadores del proyecto ENCODE, éste no tiene un tiempo definido de conclusión, pues al parecer, esto se definirá cuando la acumulación de información sea suficiente para conocer la forma en que las secuencias de ADN regulan la función del genoma.

Bibliohemerografía

◂ Holmes, K. V., L. Enjuanes (2003). “Virology. The SARS Coronavirus: a Postgenomic Era”. Science. 300:1377-8.

◂ Maher, B. (2012). “The Human Encyclopedia”. Nature 484:46-48.

◂ Richards, J. E., R. S. Hawley (2011). The Human Genome. A User´s Guide. (Third Edition). Elsevier Inc. London NW1 7BY, U. K.

◂ Richards, J. E., R. S. Hawley (2011). The Human Genome: How the Sequence Enables Genome wide Studies: 405-452.

◂ Seemungal, D., G. Newton (2001). “Encyclopedia of Genetics”. Human Genome Project: 980–981

Autores

Ernesto García Pineda es Doctor en Biotecnología de Plantas, por el Departamento de Ingeniería Genética, Cinvestav-IPN, campus Guanajuato. Actualmente, es Profesor investigador titular, en el Instituto de Investigaciones Químico Biológicas, de la UMSNH. Ha publicado 26 artículos en revistas nacionales e internacionales y es miembro del SNI, nivel I. Su área de investigación es: Mecanismos de defensa en plantas. C. e.: egpineda@umich.mx

Elda Castro Mercado es Maestra en Biología Experimental, por el Instituto de Investigaciones Químico Biológicas de la UMSNH. Ha presentado sus trabajos de investigación en congresos nacionales e internacionales, y ha publicado 15 artículos en revistas nacionales e internacionales.

Compartir en Google Plus

    Comentario Blogger
    Comentario Facebook

0 comentarios:

Publicar un comentario