La secuencia genética y la variación que encontramos en ella
Desde que se publicaron los resultados del Proyecto Genoma Humano (en 2003), fruto de la colaboración científica a nivel internacional, sabemos cual es la longitud de nuestro genoma (conjunto de genes) y tenemos una cartografía fiable de los genes que contiene. El genoma humano está compuesto por una cadena de 30 mil millones de moléculas de ácido desoxirribonucleico, de aquí sus siglas de ADN (o DNA en inglés). Estas moléculas se distinguen por llevar una de las 4 posibles bases nitrogenadas llamadas adenina, citosina, guanina y timina, que se representan con las letras A, C, G y T. Por tanto, la secuencia de nuestro genoma puede describirse a base de combinaciones de estas cuatro letras (ejemplo: ATGCTTAAGCC…..). En esta secuencia se encuentran las regiones de inicio y fin de codificación de los genes, así como regiones cuya función es la de regular el funcionamiento de los genes, o su función es desconocida (si la tienen). Existe una secuencia llamada “de referencia” generada por el Proyecto Genoma Humano. Pero cada individuo posee una secuencia única, presente en todas las células del cuerpo, fruto de pequeñas variaciones en la combinación de estas 4 letras, que se han producido y transmitido al largo de las generaciones. Estas pequeñas variaciones en la secuencia son, en parte, las responsables de que nuestros atributos físicos sean ligeramente o muy distintos entre individuos, y de que no existan dos individuos idénticos, a excepción de los gemelos univitelinos.
La secuencia “de referencia” no es ni una secuencia original ni la más común o representativa de todos los individuos del planeta, es simplemente un punto de inicio para poder generar comparaciones entre secuencias. Para generar esta secuencia de referencia se necesitaron más 10 años de esfuerzo de varios grupos de investigación, pero a la vez, se innovó en las técnicas de secuenciación haciéndolas menos costosas y permitiendo acelerar la descripción de genomas completos. Llegados a este punto, científicos de todo el planeta se coordinaron a través de un consorcio internacional (grupos de trabajo) para tener una representación fiable de la distinta variación genética que puede describirse entre los seres humanos del planeta. Este proyecto lo llamaron Mil Genomas (o Thousand Genomes en inglés), ya que pretendía secuenciar el genoma de 250 individuos genéticamente originarios de los continentes europeo, africano, asiático y americano. Los resultados finales de este proyecto fueron publicados recientemente (en 2016) describiendo el genoma completo de 2.500 individuos genéticamente originarios de los cuatro continentes. Este panel de referencia de la distinta variación genética que se puede encontrar entre los seres humanos es de gran ayuda para todos los científicos que actualmente trabajan en genética humana para diseñar sus estudios o para complementar y comparar sus resultados.