Por Stephen Hart

Los detectives moleculares han encontrado un ancestro humano más antiguo, por lo que lo han llamado Víspera Mitocondrial, el último ancestro común femenino. Investigaciones más recientes han definido un cromosoma Adán Y, el último ancestro común masculino.
Monica Riley, una microbióloga especializada en evolución molecular está intentando llegar más atrás. Ella y sus colegas en laboratorio The Marine Biological en Woods Hole, Massachussets, están buscando trazas de precursores pertenecientes a los últimos antecesores comunes de las células modernas al completo.
Riley busca estimar cuántas proteínas y de qué tipo se desarrollaron hasta el conjunto de proteínas que la primera célula primitiva pudo haber utilizado para llevar a cabo sus procesos de vida. Conjuntos, o familias, de proteínas contemporáneas pueden aportar algunos indicios importantes. “Mi meta es formar una amalgama de proteínas contemporáneas en grupos que podrían haber sido ocasionadas por proteínas simples ancestrales en un remoto pasado,” dice Riley.
Proteínas, mientras que son únicas en cada una de las especies contemporáneas, se dividen en familias cuyos miembros se presentan en la mayoría de las especies vivientes modernas. Las proteínas de una familia pueden ser relacionadas con secuencias de aminoácidos, en estructuras 3D, o como una combinación de esas propiedades. Distintos grupos de investigación definen las familias de proteínas de forma diferente, algunos postulan cientos de familias y otros más de un millar. La existencia de familias, por tanto, no se discute.
Riley comenzó con bases de datos públicas de ADN, que ahora contienen los genomas completos de casi 50 microorganismos. Un examen de la secuencia de ADN de un gen, leído desde la base de datos de genomas y traducido utilizando el código familiar tres-letras, reporta la secuencia de aminoácidos que constituye la estructura molecular básica de una proteína. Software especial ayuda a los investigadores a encontrar similitudes entre secuencias de aminoácidos. (visita “Genomics Metes Geology’ http://nai.arc.nasa.gov/genomic.htm)
Tras encontrar grupos de secuencias de proteínas que parecen representar a distintas familias, Riley investiga su estructura 3D. Estructuras 3D similares pueden encontrarse en más de una familia con secuencia relacionada. De hecho, las proteínas pueden relacionarse por estructura incluso cuando están muy poco relacionados por secuencia.
La estructura 3D de una proteína se puede deducir si su secuencia corresponde con la secuencia de una proteína cuya estructura 3D ya sea conocida. La variedad de algoritmos disponible es tal que se puede seguir el hilo de la secuencia desconocida a lo largo de la espina dorsal de la estructura conocida.
Riley compara la estructura 3D con un hilo en forma de bolita. Marcas en el hilo que están muy apartadas cuando está estirado pueden acercarse cuando se enrolla.
“La proteína, para realizar su trabajo, tiene que tener aminoácidos concretos a distancias concretas entre ellas en áreas de actividad.” Dice Riley. Durante la síntesis proteínica, una cadena de aminoácidos se pliega en una capa específica en 3D, creando un área con aminoácidos específicos en su superficie. Esa adecuación única acelera, o cataliza, una reacción química en la base.
Los laboratorios pueden determinar la capa 3D de una proteína utilizando dos métodos. El primero es una cristalografía por rayos x, el método que Rosalind Franklin utilizó para proporcionar la información en la cual Watson y Crick basaron su estructura del ADN en 3D. La segunda es una resonancia magnética nuclear (NMR). Cada uno de los métodos tiene limitaciones, con la difracción de rayos x únicamente para las proteínas que cristalizan y el NMR sólo para proteínas pequeñas. Esto deja algunas lagunas.
“Nuestro trabajo se concentra ahora en las enzimas como los tipos más característicos de proteínas en una célula. Finalmente tendremos que haber dejado el cómodo césped para girarnos hacia las proteínas de membranas unidas y otros tipos más complicados,” dice Ryley. “No esperamos encontrar en las Bases de Datos actuales estructuras 3D de todos los tipos de proteínas que se conocen en la actualidad en las células. Sin embargo, podemos comenzar a pensar en cómo ensamblar información de las familias en (algunas) proteínas.
Con algunas familias de enzimas, la única diferencia entre las funciones de las proteínas se reduce en las moléculas sobre las que actúan. Todos los miembros de una misma familia, por ejemplo, transfieren el grupo amino de un aminoácido a otra molécula. Las reacciones de las proteínas relacionadas son las mismas, difiriendo únicamente en el donante y el que recibe las moléculas.
Miembros de otro tipo de familias de enzimas actúan en una gran variedad de funciones, utilizando una química similar para conseguir una variedad de reacciones.
Miembros de la familia de las crotonasas exhiben una gran variedad, tanto en funciones como en química específica. No todos los miembros de esta familia comparten cadena de aminoácidos en una cantidad suficiente para ser reconocidos únicamente por software de análisis de secuencia, pero un vistazo más cercano a las estructuras 3D revela que muchos de los mismos aminoácidos importantes se encuentran relativamente en las mismas posiciones. Existen suficientes similitudes en la estructura 3D para categorizarlas dentro de la familia de las crotonasas. “La familia de las crotonasas incluye proteínas que están relativamente distantes mediante la secuencia, pero bastante cercanas mediante la estructura. Y dependiendo de qué aminoácido esté activo en el lugar de la catalización, son capaces de realizar distintas reacciones.
Los investigadores de Riley intentan no sólo encontrar relaciones entre las proteínas de la misma familia. Con el tiempo esperan enumerar los grupos de proteínas que fueron antepasados de las proteínas que constituyen todas las funciones celulares del Último Ancestro Común. “El Último Ancestro Común” es el término utilizado por los científicos para describir la célula antigua que fue la última en dar paso a los tres grandes dominios de la vida: La Arqueo bacteria y Eukarya.
“En absoluto este es un nuevo concepto para mí,” dice Riley. “Es sólo que ahora estamos abordándolo mediante las familias de proteínas que son las más universalmente soportadas por todos (los secuenciados por el momento) los microorganismos. ¿Cuántas proteínas ancestrales habrá? Si acabamos con un centenar de familias, postularemos un centenar de proteínas ancestrales. O un millar de familias, un millar de ancestros.”
S. Blair Hedges, investigador del genoma en la Universidad Estatal de Pennsylvania, ve el trabajo de Riley como importante. “Lo que hace es muy interesante porque el registro fósil de esos eventos primitivos (en el origen y evolución de la vida) es muy pobre. Cuando vas más atrás de la explosión Cámbrica, casi todos los registros fósiles son microscópicos. Por eso es por lo que los datos moleculares, como los datos de la proteínas, son útiles, porque se puede deducir mucha información acerca de la evolución de la vida sin tener que confiar en los muy expandidos registros fósiles.
Hedges utiliza los mismos datos que Riley, pero tiene un propósito distinto. “Comenzamos con los mismos datos y extraemos información temporal de ellos para datar los drásticos eventos de los organismos, como datar el último ancestro, por ejemplo.” Él utiliza los llamados relojes moleculares para construir árboles genealógicos de arqueo bacterias y células eukarvoticas.
¿Qué sigue?
Las proteínas con moléculas químicamente interesantes, por supuesto, pero una de sus funciones –como introducir y extraer moléculas de las células y descomponer las moléculas de alimento (proceso de metabolismo)— interesa a los investigadores fuera de la comunidad de la química orgánica. “Si conoces el complemento de los genes y las proteínas presentes en esos primeros organismos puedes extrapolar lo que pudieran haber estado haciendo,” dice Hedges.
¿Podrá la proteína ancestral de Riley dar paso a una imagen de las funciones metabólicas que el último ancestro común pudiera realizar? “Realmente no hemos pensado en asumir eso, pero si tenemos enfrente de nosotros –cuantas familias hubo y cuáles fueron sus características—probablemente podrás realizar una historia metabólica,” dice Riley. “Pero no hay nada en lo que nos podamos concentrar porque es demasiado especulativo. Estaría satisfecha si listásemos los tipos únicos de proteínas, uno de cada, que es lo único que sería necesario para desarrollar la diversidad metabólica existente hoy.”
“No tendremos todas esas respuestas, pero es un camino que estamos tomando, describir la primera célula para imaginarnos desde los comienzos puros lo que estas capacidades limitadas pudieran haber... para intentar y definir las primeras etapas de la vida en la Tierra y después esperanzados en aplicar lo imaginado a otros orígenes de vida en otros lugares.”