La inteligencia artificial ha revolucionado la exploración y descubrimiento de virus en el que ya es el mayor logro científico de su corta historia, especialmente de los virus de ARN. Gracias a herramientas avanzadas de aprendizaje profundo, como el modelo LucaProt, se han identificado más de 160,000 especies potenciales de virus de ARN en diversos ecosistemas, lo que mejora de forma impresionante nuestro conocimiento sobre la diversidad viral en el planeta.Este descubrimiento no hace otra cosa que demostrar la capacidad de la IA para encontrar patrones en datos complejos y detectar especies virales que hasta ahora permanecían ocultas, muchas de las cuales no se identificaban con métodos tradicionales debido a su alta divergencia genética. Un avance fundamentalLos virus de ARN, entidades que contienen ácido ribonucleico en lugar de ADN como material genético, destacan por su gran variabilidad genética y capacidad de adaptación, lo que los hace demasiado pertinaces a la hora de encontrar una forma de pararlos. Sin embargo, esta misma naturaleza dinámica hace que sean difíciles de detectar, ya que muchos presentan secuencias altamente divergentes, es decir, con características genéticas que se desvían considerablemente de los virus conocidos.Los métodos tradicionales de identificación, que se basan en comparaciones de similitud de secuencias, han resultado insuficientes para captar la diversidad completa de estos virus. La inteligencia artificial ha surgido como una herramienta capaz de superar estas limitaciones, facilitando descubrimientos antes inalcanzables en la investigación virológica. El modelo LucaProt, utiliza una red neuronal que ha demostrado ser muy eficaz en la identificación de patrones complejos en datos secuenciales como las secuencias de proteínas y genes. Este modelo fue diseñado específicamente para reconocer la polimerasa dependiente de ARN (RdRP), una enzima clave en la replicación de los virus de ARN. Mediante LucaProt, los investigadores han podido explorar un conjunto de datos extenso, compuesto por más de 10.000 metatranscriptomas (fragmentos de secuencias genéticas obtenidas de distintos ecosistemas), lo que ha permitido analizar la diversidad genética de los virus en un nivel sin precedentes.El uso de IA no solo permite la identificación de secuencias de RdRP en estos virus, sino que también incorpora información estructural de las proteínas virales, lo que mejora la precisión del modelo. Este enfoque ha facilitado la detección de virus que presentan una gran diversidad estructural y genética. Se han encontrado virus en entornos extremos, como aguas termales y respiraderos hidrotermales, lo que demuestra que la diversidad de virus de ARN es incluso mayor de lo que se pensaba, con la presencia de estos microorganismos en ambientes de gran diversidad geológica y climática.A través de LucaProt, la IA ha revelado cientos de miles de contigs (fragmentos de ADN o ARN ensamblados) que, mediante su análisis, fueron agrupados en más de 180 supergrupos de virus de ARN, algunos de los cuales representan linajes previamente desconocidos. Esto sugiere que hay una "materia oscura" viral, es decir, virus que hasta ahora no habían sido reconocidos por las herramientas convencionales, y que habitan en una variedad de entornos naturales. Los supergrupos identificados fueron comparados con los grupos virales definidos previamente, y se determinó que solo una pequeña parte coincidía con los virus ya clasificados, lo que indica una ampliación de la virosfera a niveles que no se habían anticipado. Sin LucaProt, este proceso habría sido realmente difícil, ya que estaríamos ante un trabajo mucho más manual y humano, haciendo que tardasemos muchísimo más tiempo en efectuarlo.