El Arc Institute ha presentado Evo 2, una revolucionaria actualización de su modelo de inteligencia artificial capaz de analizar y diseñar secuencias genéticas de cualquier organismo vivo, desde bacterias hasta seres humanos. Este avance, desarrollado en colaboración con Nvidia, representa un salto significativo en la comprensión y manipulación del código genético.
Un modelo para toda la vida
Evo 2 supera las limitaciones de su predecesor, que solo podía trabajar con genomas de organismos unicelulares. Según informó el Arc Institute, el nuevo modelo ha sido entrenado con más de 9,3 billones de nucleótidos procedentes de más de 128.000 especies diferentes, abarcando todos los dominios de la vida.
"La receta de la vida está enteramente presente en la información genética contenida en nuestro ADN", explicó Kimberly Powell, vicepresidenta de healthcare en Nvidia, a GEN Edge. "Estamos buscando una comprensión más profunda de la complejidad biológica".
Aplicaciones en medicina y biotecnología
Una de las características más destacadas de Evo 2 es su capacidad para predecir el impacto de las mutaciones genéticas. En pruebas realizadas con variantes del gen BRCA1, asociado al riesgo de cáncer de mama y ovario, el modelo alcanzó una precisión superior al 90% en la identificación de mutaciones benignas frente a las causantes de enfermedades.
Patrick Hsu, cofundador del Arc Institute y profesor asistente de bioingeniería en UC Berkeley, destacó que "Evo 2 es el único modelo que puede predecir los efectos tanto de las mutaciones codificantes como no codificantes".
Características técnicas innovadoras
El modelo utiliza una nueva arquitectura llamada StripedHyena 2, que según Dave Burke, director tecnológico del Arc Institute, permite un entrenamiento "casi tres veces más rápido que los modelos transformadores optimizados". Con 40.000 millones de parámetros, Evo 2 se encuentra a la altura de los modelos de lenguaje más avanzados actuales.
Acceso público y código abierto
En un movimiento poco común en el campo de la IA, Evo 2 se ha puesto a disposición del público a través de la plataforma NVIDIA BioNeMo y mediante una interfaz interactiva llamada Evo Designer. Además, tanto el código como los datos de entrenamiento son de código abierto y están disponibles en GitHub.
El futuro de la investigación genómica
Brian Hie, profesor asistente de ingeniería química en Stanford University, ve a Evo 2 como un "sistema operativo" que proporciona una base para la genómica funcional generativa. "Si tenemos un modelo capaz que nos permita generar a escala de organismos completos, esto desbloquea muchas tareas posteriores con una amplia gama de casos de uso", explicó.
El equipo del Arc Institute ya está trabajando en colaboración con expertos de la Universidad de Washington para validar experimentalmente las capacidades del modelo en células de ratón. El objetivo final es construir una "célula virtual" que permita comprender mejor las causas de las enfermedades y acelerar el descubrimiento de nuevos fármacos.
Este desarrollo marca un hito importante en la intersección entre la inteligencia artificial y la biología, abriendo nuevas posibilidades para la investigación médica, la biotecnología y la comprensión fundamental de la vida.