La inteligencia artificial (IA) abre nuevas oportunidades en el ámbito médico, pero también plantea riesgos importantes: la generación de información e imágenes falsas. Este fenómeno amenaza con desinformar a pacientes y profesionales, poner en peligro la seguridad en diagnósticos y tratamientos, y erosionar la confianza en las herramientas tecnológicas de salud.
En este contexto, diversos estudios publicados en Nature han analizado cómo la manipulación de datos por investigadores y la producción masiva de artículos fraudulentos han sido problemas persistentes en la literatura académica. Ahora, los científicos dedicados a detectar y corregir estas irregularidades enfrentan un reto cada vez mayor con la llegada de la inteligencia artificial generativa. La capacidad de las herramientas de IA generativa para crear textos, imágenes y datos con gran facilidad plantea preocupaciones sobre la fiabilidad de la literatura científica.
El temor es que esta se llene cada vez más de cifras, manuscritos y conclusiones falsas, difíciles de identificar por los seres humanos. Como resultado, ha surgido una carrera entre expertos en integridad, editoriales y empresas tecnológicas para desarrollar herramientas de IA que permitan detectar de manera rápida los elementos fraudulentos generados por inteligencia artificial en los artículos científicos. «La IA generativa está evolucionando muy rápido», afirmó Jana Christopher, analista de integridad de imágenes de FEBS Press en Heidelberg, Alemania. «Las personas que trabajan en mi campo (integridad de imágenes y ética de publicaciones) están cada vez más preocupadas por las posibilidades que ofrece», aseguró.
Vigilar los fraudes
Los expertos en integridad de la investigación señalan que, aunque algunas revistas permiten el uso de textos generados por IA en ciertas circunstancias, es menos probable que se considere adecuado emplear estas herramientas para crear imágenes u otros tipos de datos. De hecho, los expertos ya sospechan que los datos, incluidas las imágenes, creados con IA generativa ya están ampliamente presentes en la literatura académica, y que las publicaciones están utilizando estas herramientas para generar manuscritos en grandes cantidades.
Detectar imágenes generadas por IA representa un gran desafío, ya que, en muchos casos, es casi imposible diferenciarlas de las reales a simple vista. Existen ejemplos claros del uso de inteligencia artificial generativa en imágenes científicas, como una imagen de una rata con genitales desproporcionadamente grandes que se hizo famosa, creada con la herramienta de imágenes Midjourney. Esta figura, publicada en una revista en febrero, causó un gran revuelo en las redes sociales y fue retirada pocos días después.
La mayoría de los casos no son tan evidentes como el de la rata. Las imágenes manipuladas con Adobe Photoshop u otras herramientas similares, previas al auge de la IA generativa, solían presentar señales detectables, como fondos repetidos o una falta inusual de manchas, que los expertos podían identificar fácilmente. Sin embargo, las imágenes generadas por IA a menudo carecen de estos indicios, lo que dificulta su detección. Ya hay indicios de que los manuscritos publicados están incluyendo figuras generadas por IA. Además, los textos producidos con herramientas como ChatGPT se están multiplicando en los artículos científicos, y suelen delatarse por frases típicas de chatbots que los autores pasan por alto al no eliminarlas, así como por el uso de palabras o estructuras que los modelos de IA tienden a emplear de forma recurrente.
Según los expertos, una nueva pista que sugiere el uso de herramientas de imagen avanzadas por parte de los estafadores es que la mayoría de los problemas que los investigadores están identificando actualmente se encuentran en documentos de varios años de antigüedad.
Tarea sencilla
Crear imágenes claras y realistas mediante IA generativa no es una tarea complicada. Los investigadores mostraron lo sencillo que puede ser, utilizando la herramienta de IA Generative Fill de Photoshop, generaron imágenes que parecen reales y podrían figurar en artículos científicos, como tumores, cultivos celulares y transferencias Western, entre otras. La mayoría de las imágenes fueron creadas en menos de un minuto. Algunas editoriales ya han afirmado haber descubierto evidencia de contenido generado por IA en estudios publicados. Una de ellas es PLoS, que ha recibido alertas sobre material sospechoso y, tras realizar investigaciones internas, ha encontrado pruebas de texto y datos creados por IA en artículos y presentaciones.
Otras herramientas también podrían ofrecer oportunidades a quienes buscan generar contenido falso, aseguraron. El mes pasado, un grupo de investigadores presentó un modelo de inteligencia artificial generativa capaz de crear imágenes de microscopía de alta resolución, lo que ha generado inquietud entre algunos especialistas en integridad científica. En este sentido, Yoav Shechtman, del Instituto Tecnológico Technion de Israel en Haifa y creador de la herramienta, indicó que esta puede ser útil para generar datos de entrenamiento para modelos, ya que las imágenes de microscopía de alta resolución son difíciles de conseguir, pero que no es adecuada para crear imágenes falsas, ya que los usuarios tienen un control limitado sobre el resultado final.
Eliminar las falsificaciones
Los ojos humanos pueden no ser capaces de identificar imágenes generadas por IA, la propia inteligencia artificial sí tiene la capacidad de hacerlo. Los desarrolladores de herramientas como Imagetwin y Proofig, que utilizan IA para detectar problemas de integridad en imágenes científicas, están ampliando sus programas para incluir la capacidad de identificar imágenes creadas por IA generativa. Dado lo complicado que es detectar estas imágenes, ambas empresas están construyendo sus propias bases de datos de imágenes generadas por IA para entrenar y mejorar sus algoritmos.
Proofig ha lanzado una nueva función en su herramienta para identificar imágenes de microscopio generadas por IA. Al probar el algoritmo en miles de imágenes generadas por IA y reales de artículos científicos, logró detectar las imágenes generadas por IA en un 98% de los casos, con una tasa de falsos positivos de solo el 0,02%. Este equipo ahora está trabajando para entender con mayor precisión qué es lo que exactamente detecta su algoritmo.
Las revistas científicas, como Science, utilizan Proofig para detectar problemas de integridad en las imágenes. Por su parte, Springer Nature, la editorial de la revista Nature, está desarrollando sus propias herramientas de detección de texto e imágenes, denominadas Geppetto y SnapShot. Estas herramientas buscan irregularidades que luego son evaluadas por expertos humanos.
También te puede interesar…