Un nuevo estudio conecta biología y física para explicar el origen de la vida compleja: la célula eucariota habría surgido tras una transición de fase en el crecimiento del ADN, un cambio abrupto que resolvió un límite computacional evolutivo gracias a la incorporación de secuencias no codificantes.
Los seres humanos han intentado reconstruir los grandes hitos de la evolución desde hace décadas, como quien recompone un enorme rompecabezas con piezas dispersas por millones de años. Uno de los más desconcertantes es el origen de la célula eucariota, esa estructura compleja que hizo posible la vida tal como la conocemos: desde los árboles a los pulpos, pasando por nuestros propios cuerpos. Sin embargo, seguimos sin tener claro cuándo ni cómo exactamente ocurrió esa transformación decisiva, a pesar de contar con la teoría endosimbiótica. Hasta ahora.
Un equipo internacional de científicos ha propuesto una explicación sorprendente: la aparición de las células eucariotas no fue un proceso gradual, sino una transición repentina, similar a los cambios de fase que estudia la física, como cuando el agua se convierte en hielo. Y lo más llamativo es que ese salto puede describirse con un modelo matemático que analiza cómo crecen los genes. El estudio, publicado en la revista PNAS, no solo aporta una posible fecha al evento (hace unos 2.600 millones de años), sino que sostiene que este cambio representa una transición algorítmica en la historia de la vida.
La Clave Está en la Longitud de los Genes
Los investigadores analizaron más de 33.000 genomas y 55 millones de proteínas en organismos de todos los dominios de la vida: bacterias, arqueas y eucariotas. En lugar de centrarse en genes individuales, examinaron una propiedad estadística global: la longitud promedio de los genes y su relación con la de las proteínas que codifican. Descubrieron que tanto los genes como las proteínas siguen distribuciones lognormales, un patrón característico de procesos multiplicativos.
Esto les llevó a proponer un modelo simple, en el que los genes crecen en longitud como resultado de multiplicaciones aleatorias sucesivas. Según los autores, “la longitud media de los genes crece exponencialmente con el tiempo evolutivo”, como resultado de mecanismos como duplicaciones o inserciones. Esta idea fue verificada con datos reales, mostrando una correlación sólida entre la longitud media de los genes y el momento en que apareció cada grupo de organismos.
El punto crucial de este crecimiento se alcanza cuando la longitud media de los genes llega a 1.500 nucleótidos. A partir de ahí, las proteínas dejan de seguir ese mismo ritmo: su longitud se estabiliza alrededor de 500 aminoácidos, mientras los genes continúan alargándose. ¿Por qué ocurre esto? Porque a partir de ese umbral, la mayor parte del crecimiento se debe a la incorporación de secuencias no codificantes, como los intrones.
¿Qué son los Intrones?
Los intrones son fragmentos de ADN dentro de un gen que no codifican proteínas, es decir, no se traducen directamente en aminoácidos durante la síntesis proteica. Están intercalados entre las regiones codificantes llamadas exones, y aunque se transcriben en ARN junto con estos, son eliminados durante un proceso llamado Splicing antes de que el ARN mensajero se traduzca en una proteína. Durante mucho tiempo se pensó que los intrones eran “ADN basura”, pero hoy se sabe que desempeñan funciones clave en la regulación genética, como permitir la generación de múltiples proteínas a partir de un solo gen mediante el empalme alternativo. Su aparición y expansión están asociadas a la evolución de los organismos complejos, especialmente a partir de la célula eucariota.
Un punto de Inflexión Evolutivo
Esa divergencia marca lo que los autores describen como una transición de fase de segundo orden, un tipo de cambio que en física se asocia a fenómenos como la magnetización o la mezcla de líquidos. En este caso, se trata de un cambio en la Arquitectura Genética, que introduce nuevas formas de regulación basadas en secuencias que no producen proteínas pero que permiten generar una mayor diversidad funcional.
Lo notable es que esta transición no solo fue abrupta, sino que dejó una huella visible en los datos actuales. Cuando los investigadores representaron la relación entre longitud media de los genes y de las proteínas en 6.519 especies, la gráfica mostró dos fases bien diferenciadas, separadas por ese umbral crítico de 1.500 nucleótidos. Por debajo de ese valor, todos los genes están compuestos casi exclusivamente por secuencias codificantes; por encima, predominan las no codificantes.
Según el artículo, “la célula eucariota emergió como un compromiso entre un proceso conservado de crecimiento génico y un cambio en la regulación genética, que incorporó secuencias no codificantes”. Este nuevo sistema fue capaz de superar las limitaciones de complejidad que imponía el modelo basado solo en proteínas.
¿Cambio de fase o transición de fase? Una distinción importante en Física
En Física, “Cambio de Fase” se usa comúnmente para describir las transformaciones clásicas entre estados de la materia, como pasar de sólido a líquido o de líquido a gas; son procesos físicos visibles, familiares y habitualmente asociados al calor latente. En cambio, el término “transición de fase” tiene un significado más general y técnico: se aplica a cualquier fenómeno en el que un sistema cambia bruscamente su comportamiento colectivo cuando se supera un umbral crítico, aunque no implique un cambio de estado físico convencional. Por ejemplo, la aparición del magnetismo en ciertos materiales al enfriarse o la pérdida de conductividad eléctrica en un superconductor son transiciones de fase. En estos casos, no cambia el “estado de la materia” en sentido clásico, pero sí la organización interna del sistema. Por eso, en física estadística y en campos como la biología teórica, “transición de fase” es el término adecuado para describir fenómenos estructurales complejos como el que aborda el estudio sobre el origen de la célula eucariota.
¿Un Problema de Computación?
Lo más provocador de la propuesta es su interpretación algorítmica. Los autores comparan la evolución con un algoritmo de búsqueda que intenta encontrar soluciones (es decir, nuevos genes útiles) en un espacio de posibilidades creciente. Mientras los genes eran cortos, este problema era manejable. Pero al crecer, buscar proteínas funcionales se volvió cada vez más difícil, hasta llegar a un punto en que el sistema se estanca.
Fue entonces cuando la evolución encontró una solución inesperada: incorporar partes del ADN que no codifican proteínas, pero que permiten reorganizar y modular la expresión génica, gracias a procesos como el empalme alternativo. En términos de teoría computacional, esto equivale a un cambio en la estructura del algoritmo, que reduce su complejidad y permite avanzar de nuevo.
Esta fase “dura” del proceso evolutivo queda reflejada en otro indicador que los autores llaman complejidad algorítmica, definida como el tiempo evolutivo invertido por cada nucleótido hasta alcanzar una determinada longitud génica. Ese valor alcanza un máximo precisamente en el umbral de los 1.500 nucleótidos, y luego desciende, como ocurre en las transiciones algorítmicas conocidas en problemas NP-completos.
¿Qué son los problemas NP-completos?
Los problemas NP-completos son desafíos matemáticos y computacionales cuya solución es fácil de verificar, pero muy difícil de encontrar. Se llaman así porque pertenecen a una clase de problemas conocidos como “NP” (nondeterministic polynomial time), donde, si alguien da una solución, se puede comprobar rápidamente que es correcta, aunque encontrar esa solución pueda requerir un tiempo exponencial si se prueba cada posibilidad. Ejemplos clásicos son el problema del viajante (encontrar la ruta más corta que visita varias ciudades una sola vez) o el problema de colorear un mapa con el menor número de colores sin que regiones vecinas tengan el mismo. Estos problemas crecen en dificultad a medida que aumenta el número de elementos implicados, hasta que se vuelven prácticamente irresolubles para un ordenador. En el contexto del artículo científico sobre el origen de la célula eucariota, se propone que la evolución genética enfrentó una situación similar: encontrar nuevas proteínas útiles se volvió tan complejo que solo un cambio en el “algoritmo” de búsqueda —la incorporación de secuencias no codificantes— permitió seguir avanzando.
Una predicción cuantitativa y coherente
Uno de los puntos fuertes del estudio es su capacidad para hacer predicciones numéricas. A partir del modelo de crecimiento multiplicativo, los investigadores estiman que el umbral de transición debió alcanzarse unos 1.000 millones de años después del Último Ancestro Común Universal (LUCA), lo que sitúa el evento hace unos 2.600 millones de años. Esta fecha coincide con las estimaciones actuales del origen de las primeras células eucariotas, basadas en fósiles y análisis genéticos.
Además, el modelo permite estimar el crecimiento de la fracción de secuencias no codificantes con gran precisión. En organismos como bacterias y arqueas, esta fracción es prácticamente cero. Pero a medida que aumenta la longitud génica, la proporción de intrones y otras regiones no codificantes crece de forma predecible, siguiendo una fórmula matemática muy ajustada a los datos observados.
Todo esto sugiere que la transición no fue solo un cambio estructural, sino también una consecuencia inevitable del modo en que los genes crecen a lo largo del tiempo, si se mantienen ciertos principios básicos. No haría falta invocar adaptaciones específicas para explicar la aparición de la célula eucariota: bastaría con un proceso neutro sometido a restricciones computacionales.
Cuando el ADN también encuentra su límite: una Analogía Nuclear
En física nuclear, existe un concepto bien conocido: el límite de estabilidad de los núcleos atómicos. A medida que se añaden más protones o neutrones a un núcleo, este se vuelve cada vez más inestable. Si se supera cierto umbral, la estructura ya no puede sostenerse y el núcleo decae. No es solo una cuestión de cantidad, sino de equilibrio interno. De forma curiosamente paralela, el nuevo estudio sobre el origen de la célula eucariota sugiere que algo similar ocurre en la evolución genética: los genes crecieron hasta un punto crítico en el que ya no era viable seguir aumentando el tamaño de las proteínas que producían. Esa tensión estructural marcó un límite que obligó a cambiar de estrategia.
En lugar de colapsar, la evolución reorganizó el sistema. Así como en física nuclear ciertos núcleos logran mantenerse estables incorporando nuevos patrones de enlace o adoptando otras configuraciones, la genética superó su propio límite incorporando secuencias no codificantes, como los intrones, y creando nuevas formas de regulación. El resultado no fue el caos, sino una transición hacia una mayor complejidad. Igual que un átomo puede ganar estabilidad con una nueva arquitectura nuclear, el ADN encontró un camino evolutivo más robusto mediante una reestructuración profunda. El hallazgo conecta de manera elegante biología y física, mostrando que los límites estructurales también impulsan la innovación en la naturaleza.
Más allá del Azar: Evolución como Cálculo
Este enfoque ofrece una perspectiva novedosa sobre la evolución. En lugar de depender únicamente de la selección natural o el azar, introduce el concepto de limitaciones computacionales y soluciones algorítmicas. La vida, según esta visión, sería una especie de sistema autoorganizado que explora caminos viables dentro de un espacio limitado por la física, las matemáticas y la estadística.
Por supuesto, los autores reconocen que su modelo tiene limitaciones. Se basa en organismos actuales y reconstruye el pasado como si fuera una fotografía final. Además, simplifica la evolución como si fuera un paseo aleatorio, sin tener en cuenta eventos clave como la especiación. Aun así, su capacidad de predecir patrones universales es notable, y podría abrir nuevas líneas de investigación sobre otras transiciones evolutivas, como el origen de la multicelularidad o la aparición de redes neuronales.
Como señala el propio artículo, “el origen de la célula eucariota dejó una señal en forma de una transición algorítmica de segundo orden, tras una crisis de dificultad computacional”. Lejos de ser una metáfora, esta afirmación está respaldada por modelos matemáticos precisos y datos empíricos extensos. Y puede que estemos ante una nueva forma de comprender los grandes saltos evolutivos.