La «oreja de silicio»: un estudio muestra cómo la inteligencia artificial podría descifrar los tumores

La Universidad Francisco de Vitoria lidera una revisión internacional sobre algoritmos capaces de deducir la composición celular de un tejido sin microscopio ni bisturí

La deconvolución celular abre la puerta a diagnósticos más rápidos, personalizados y asequibles / UFV

Un estudio coordinado por la Universidad Francisco de Vitoria ha trazado el primer mapa completo de una disciplina emergente que combina biología e inteligencia artificial. A través de una revisión sistemática de las herramientas más prometedoras, el análisis ordena los avances logrados hasta ahora y señala áreas clave de mejora, abriendo la puerta a diagnósticos más rápidos, económicos y personalizados.

Cada año se diagnostican en España cerca de 300.000 nuevos casos de cáncer. En muchos de ellos, conocer con precisión qué tipos de células componen el tumor resulta determinante para seleccionar el tratamiento más adecuado.

Hasta ahora, esta información solo podía obtenerse mediante técnicas altamente especializadas, como el análisis célula a célula, que, pese a su enorme potencia, son lentas y costosas —con precios que pueden alcanzar los 2.250 dólares por muestra—. Otra alternativa son los cortes histológicos, que requieren tejido fresco y la intervención de especialistas entrenados para interpretar las muestras al microscopio.

Frente a estas opciones, existe una técnica más rápida y económica conocida como bulk RNA-seq, que permite analizar de forma global los genes activos en una muestra. Su principal limitación es que ofrece un promedio de toda la mezcla celular, sin distinguir qué tipo de célula expresa cada gen. Es, en palabras sencillas, como analizar una sopa sin poder identificar sus ingredientes.

Descifrar esa mezcla y comprender qué células la componen se ha convertido en uno de los grandes retos de la medicina personalizada.

Qué es la deconvolución con IA

En lugar de separar físicamente cada célula, la deconvolución recurre a algoritmos capaces de analizar la mezcla y deducir, como haría un sumiller al distinguir sabores complejos, qué proporciones de cada tipo celular contiene un tejido.

La idea no es nueva en bioinformática, pero la llegada del deep learning —una rama de la inteligencia artificial capaz de detectar patrones muy sutiles en grandes volúmenes de datos— ha supuesto un punto de inflexión. Redes neuronales con nombres tan técnicos como MLP, autoencoders o modelos generativos se entrenan a partir de ejemplos en los que sí se conoce la composición celular. Una vez entrenadas, pueden estimar con gran precisión la composición de nuevas muestras, sin necesidad de manipular físicamente el tejido.

El resultado es una especie de radiografía digital que puede revelar, por ejemplo, cuántas células inmunes infiltran un melanoma, cuán puro es un tumor cerebral o qué proporción de macrófagos participa en un proceso inflamatorio renal. Todo ello a partir de datos moleculares, sin abrir una sola célula.

El mapa del conocimiento

Ante la proliferación de modelos y enfoques, Alba Lomas, investigadora predoctoral del CEIEC, junto a José M. Sánchez Velázquez y Víctor Sánchez-Arévalo, llevaron a cabo un estudio sistemático con el objetivo de poner orden en el campo. Siguiendo la guía PRISMA, considerada el estándar de oro en revisiones sistemáticas, analizaron seis grandes bases bibliográficas.

De los 171 artículos identificados inicialmente, solo 13 cumplieron todos los criterios de rigor científico: uso de deep learning, datos reales de RNA-seq y revisión por pares. La selección final incluye modelos aplicados a tejidos tan diversos como sangre periférica, cerebro, páncreas o tumores sólidos, y arquitecturas que van desde redes densas clásicas hasta modelos híbridos con atención y convolución.

«Queríamos ofrecer una visión clara de hacia dónde va este campo y cuáles son sus límites actuales», señaló Lomas, coautora del estudio.

Lo que encontró el algoritmo:

El análisis revela el claro predominio de las redes densas, especialmente las redes neuronales multicapa (MLP), que destacan por su equilibrio entre sencillez y eficacia, al detectar relaciones complejas sin requerir grandes recursos computacionales.

No obstante, comienzan a emerger enfoques más sofisticados, como los autoencoders —que comprimen la información para identificar estructuras ocultas— o las redes generativas (GANs), capaces de crear datos sintéticos y mejorar el entrenamiento cuando las muestras disponibles son escasas. De forma llamativa, los transformers, que han revolucionado ámbitos como el procesamiento del lenguaje natural o la visión artificial, aún no se han aplicado a este campo, aunque los expertos apuntan a su potencial disruptivo.

Los datos constituyen el eje central de todos los modelos. Aunque todos utilizan perfiles de expresión génica obtenidos mediante bulk RNA-seq, diez de ellos requieren además datos de célula única para generar mezclas sintéticas o pseudobulks con los que entrenar los algoritmos. La mayoría de los estudios se centran en muestras humanas, especialmente de sangre y tejidos tumorales, mientras que los modelos animales siguen siendo minoritarios.

Uno de los principales obstáculos identificados es la ausencia de estándares comunes. Cada grupo aplica distintos métodos de preprocesamiento, selección génica y métricas de evaluación, lo que dificulta la comparación entre herramientas y complica su traslado al ámbito clínico.

«Si queremos que estas herramientas lleguen al hospital, necesitamos que hablen un idioma común. No basta con que un modelo funcione: hay que saber compararlo y confiar en cómo llega a sus conclusiones», afirmó Lomas.

Hacia diagnósticos rápidos y asequibles

Los autores imaginan un futuro cercano en el que el patólogo reciba, junto al informe histológico tradicional, un panel digital con información detallada sobre la composición celular del tejido: «70% células tumorales, 15% linfocitos T, 10% macrófagos, 5% fibroblastos».

Todo ello podría generarse en cuestión de minutos a partir de un análisis convencional de secuenciación de ARN, una técnica ya presente en numerosos centros sanitarios. Este enfoque permitiría avanzar hacia diagnósticos más rápidos, personalizados y económicos, optimizando la selección de terapias inmunológicas, facilitando el seguimiento de recaídas mediante biopsias líquidas y reduciendo la necesidad de pruebas invasivas.

Para alcanzar este escenario, el equipo del CEIEC trabaja en dos líneas prioritarias: la creación de conjuntos de datos abiertos y robustos que sirvan de referencia, y el desarrollo de modelos más explicables —las llamadas «cajas negras transparentes»— capaces no solo de ofrecer resultados, sino de justificar cómo los obtienen.

«Nuestro siguiente reto es asegurar que estos modelos puedan usarse con confianza en entornos reales, con datos compartidos y validaciones clínicas», apuntó José M. Sánchez Velázquez, director del CEIEC.

La revolución silenciosa de la IA en medicina

Al igual que AlphaFold transformó la biología estructural sin necesidad de cristalizar proteínas, la deconvolución basada en inteligencia artificial promete cambiar el diagnóstico tisular sin bisturí, microscopio ni procedimientos invasivos.

El estudio del CEIEC de la UFV dibuja el primer mapa completo de esta disciplina emergente, ordenando los avances actuales y señalando los desafíos pendientes. Los investigadores reclaman más datos compartidos, métricas comunes y algoritmos que no solo acierten, sino que expliquen con transparencia sus decisiones.

Si estos retos se superan, los médicos podrían pronto «escuchar» la composición celular de un tumor en la propia consulta, a partir de una muestra estándar de ARN, y decidir el tratamiento más eficaz sin necesidad de abrir al paciente. Una revolución silenciosa, sí, pero con el potencial de transformar para siempre la forma en que entendemos —y tratamos— las enfermedades desde dentro.


También te puede interesar…