Los colectivos humano-I.A. realizan los diagnósticos médicos más precisos

Un estudio destaca el potencial de una mayor seguridad del paciente y una asistencia sanitaria más equitativa

24.06.2025
Computer-generated image

Imagen simbólica

La inteligencia artificial (IA) puede ayudar eficazmente a los médicos a realizar diagnósticos. Comete errores distintos de los humanos, y esta complementariedad representa una ventaja hasta ahora desaprovechada. Un equipo internacional dirigido por el Instituto Max Planck para el Desarrollo Humano ha demostrado sistemáticamente por primera vez que la combinación de la experiencia humana con modelos de IA conduce a los diagnósticos abiertos más precisos.

Los errores de diagnóstico son uno de los problemas más graves de la práctica médica diaria. Los sistemas de inteligencia artificial, especialmente los grandes modelos lingüísticos (LLM) como ChatGPT-4, Gemini o Claude 3, ofrecen nuevas formas de apoyar eficazmente los diagnósticos médicos. Sin embargo, estos sistemas también entrañan riesgos considerables: por ejemplo, pueden "alucinar" y generar información falsa. Además, reproducen los prejuicios sociales o médicos existentes y cometen errores que a menudo dejan perplejos a los humanos.

Un equipo internacional de investigación, dirigido por el Instituto Max Planck para el Desarrollo Humano y en colaboración con socios del Human Diagnosis Project (San Francisco) y el Instituto de Ciencias y Tecnologías Cognitivas del Consejo Nacional de Investigación Italiano (CNR-ISTC Roma), investigó cómo pueden colaborar mejor los humanos y la IA.

El resultado: los colectivos de diagnóstico híbridos -grupos formados por expertos humanos y sistemas de IA- son mucho más precisos que los colectivos formados únicamente por humanos o IA. Esto es especialmente cierto en el caso de preguntas de diagnóstico complejas y abiertas con numerosas soluciones posibles, en lugar de simples decisiones de sí o no. "Nuestros resultados demuestran que la cooperación entre humanos y modelos de IA tiene un gran potencial para mejorar la seguridad de los pacientes", afirma el autor principal, Nikolas Zöller, investigador postdoctoral del Centro de Racionalidad Adaptativa del Instituto Max Planck para el Desarrollo Humano.

Simulaciones realistas con más de 2.100 viñetas clínicas

Los investigadores utilizaron datos del Proyecto de Diagnóstico Humano, que proporciona viñetas clínicas -breves descripciones de casos médicos- junto con los diagnósticos correctos. Utilizando más de 2.100 de estas viñetas, el estudio comparó los diagnósticos realizados por profesionales médicos con los de cinco destacados modelos de IA. En el experimento central, se simularon varios colectivos de diagnóstico: individuos, colectivos humanos, modelos de IA y colectivos mixtos de humanos e IA. En total, los investigadores analizaron más de 40.000 diagnósticos. Cada uno se clasificó y evaluó según los estándares médicos internacionales (SNOMED CT).

Humanos y máquinas se complementan, incluso en sus errores

El estudio demuestra que la combinación de varios modelos de IA mejoró la calidad de los diagnósticos. De media, los colectivos de IA superaron al 85% de los diagnosticadores humanos. Sin embargo, hubo numerosos casos en los que los humanos obtuvieron mejores resultados. Curiosamente, cuando la IA fallaba, los humanos a menudo conocían el diagnóstico correcto.

La mayor sorpresa fue que la combinación de ambos mundos dio lugar a un aumento significativo de la precisión. Incluso la adición de un único modelo de IA a un grupo de diagnosticadores humanos -o viceversa- mejoró sustancialmente el resultado. Los resultados más fiables procedían de decisiones colectivas en las que participaban varios humanos y varias IA.

La explicación es que los humanos y la IA cometen errores sistemáticamente diferentes. Cuando la IA fallaba, un profesional humano podía compensar el error, y viceversa. Esta complementariedad de errores hace que los colectivos híbridos sean tan potentes. "No se trata de sustituir a los humanos por máquinas. Más bien deberíamos considerar la inteligencia artificial como una herramienta complementaria que despliega todo su potencial en la toma de decisiones colectivas", afirma Stefan Herzog, coautor del estudio e investigador principal del Instituto Max Planck para el Desarrollo Humano.

Sin embargo, los investigadores también subrayan las limitaciones de su trabajo. El estudio sólo tuvo en cuenta viñetas de casos basados en texto, no pacientes reales en entornos clínicos reales. Queda pendiente la cuestión de si los resultados pueden trasladarse directamente a la práctica. Asimismo, el estudio se centró únicamente en el diagnóstico, no en el tratamiento, y un diagnóstico correcto no garantiza necesariamente un tratamiento óptimo.

También sigue siendo incierto cómo los sistemas de apoyo basados en IA serán aceptados en la práctica por el personal médico y los pacientes. Los posibles riesgos de sesgo y discriminación tanto por parte de la IA como de los humanos, sobre todo en relación con las diferencias étnicas, sociales o de género, también requieren más investigación.

Amplio abanico de aplicaciones para los colectivos híbridos humano-IA

El estudio forma parte del proyecto Hybrid Human Artificial Collective Intelligence in Open-Ended Decision Making (HACID), financiado por Horizon Europe, cuyo objetivo es promover el desarrollo de futuros sistemas de apoyo a la toma de decisiones clínicas mediante la integración inteligente de la inteligencia humana y la de las máquinas. Los investigadores ven un potencial especial en regiones donde el acceso a la atención médica es limitado. Los colectivos híbridos de inteligencia humana e inteligencia artificial podrían contribuir de forma decisiva a una mayor equidad sanitaria en esas zonas.

"El planteamiento también puede trasladarse a otras áreas críticas -como el sistema jurídico, la respuesta ante catástrofes o la política climática- en cualquier lugar donde sea necesario tomar decisiones complejas y de alto riesgo. Por ejemplo, el proyecto HACID también está desarrollando herramientas para mejorar la toma de decisiones en la adaptación al clima", afirma Vito Trianni, coautor y coordinador del proyecto HACID.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales