El nuevo sistema, llamado MAI-DxO, no solo supera a un grupo de médicos experimentados en la resolución de los casos más difíciles publicados en el New England Journal of Medicine, sino que también lo hace con un menor coste en pruebas diagnósticas.
Microsoft ha dado un paso de gigante en el campo de la inteligencia artificial aplicada a la medicina. Según una publicación en el blog de Microsoft AI, su equipo de investigación ha desarrollado un sistema de IA capaz de investigar y resolver secuencialmente los desafíos diagnósticos más complejos de la medicina, aquellos que a menudo desconciertan incluso a los médicos más expertos.
El sistema, bautizado como Microsoft AI Diagnostic Orchestrator (MAI-DxO), ha demostrado una capacidad asombrosa. Al ser puesto a prueba con casos reales publicados en el prestigioso New England Journal of Medicine (NEJM), logró resolver correctamente hasta el 85,5% de ellos. Esta cifra es especialmente significativa cuando se compara con el rendimiento de un grupo de 21 médicos en ejercicio de Estados Unidos y el Reino Unido, quienes, enfrentados a los mismos desafíos, alcanzaron una tasa media de acierto del 20%. Es decir, la IA fue más de cuatro veces más precisa.
Además de la precisión, el estudio destaca que MAI-DxO consigue llegar al diagnóstico correcto de una manera más eficiente en términos de costes, solicitando menos pruebas diagnósticas que los facultativos humanos.
Un salto cualitativo en el diagnóstico por inteligencia artificial
El desarrollo de esta tecnología responde a una necesidad acuciante. La demanda sanitaria no deja de crecer, los costes se disparan a un ritmo insostenible y millones de personas en todo el mundo se enfrentan a diagnósticos imprecisos o tardíos. En este contexto, Microsoft señala que herramientas como sus buscadores Bing y su asistente Copilot ya gestionan más de 50 millones de sesiones diarias relacionadas con la salud.
«Queremos hacer más para ayudar y creemos que la IA generativa puede ser transformadora», afirman Dominic King y Harsha Nori, autores de la publicación. Este esfuerzo se suma a otras iniciativas de la compañía en el sector, como RAD-DINO, que mejora los flujos de trabajo en radiología, o Microsoft Dragon Copilot, un asistente de voz para clínicos.
El avance de MAI-DxO radica en su capacidad para ir más allá de las métricas tradicionales. Hasta ahora, la competencia de las IA médicas se medía a menudo con exámenes como el USMLE (el examen de licenciatura médica de EE. UU.). Aunque los modelos más recientes obtienen puntuaciones casi perfectas, estos exámenes se basan principalmente en preguntas de opción múltiple que premian la memorización sobre el razonamiento profundo.
El desafío de imitar el razonamiento médico real
Para superar esta limitación, el equipo de Microsoft AI ha creado una nueva forma de evaluación: el Sequential Diagnosis Benchmark (SD Bench). Esta prueba de referencia utiliza 304 casos recientes y complejos del NEJM y los transforma en desafíos interactivos.
A diferencia de un examen de respuesta única, el SD Bench imita el proceso real de un médico. El sistema (ya sea una IA o un humano) comienza con la presentación inicial del paciente y debe decidir qué preguntas hacer o qué pruebas (análisis de sangre, radiografías, etc.) solicitar para obtener más información. Con cada nuevo dato, debe actualizar su razonamiento hasta llegar a un diagnóstico final, que se compara con el verificado y publicado en la revista. Este enfoque permite evaluar no solo la precisión, sino también la eficiencia del proceso.
MAI-DxO: El «director de orquesta» diagnóstico
Una de las claves de este éxito no es un único modelo de IA superinteligente, sino un sistema más complejo: un orquestador. Microsoft describe a MAI-DxO como un «director de orquesta digital» o un «panel virtual de médicos» que colaboran para resolver un caso.
En lugar de depender de un solo modelo de lenguaje (como GPT, Llama o Gemini), el orquestador coordina múltiples agentes de IA. Puede solicitar una segunda opinión a otro agente, verificar su propio razonamiento, realizar una comprobación de costes antes de pedir una prueba y, en general, gestionar el flujo de trabajo diagnóstico de manera sistemática. Este enfoque, según sus creadores, mejora el rendimiento de cualquier modelo base y añade capas cruciales de seguridad, transparencia y auditabilidad, atributos indispensables en un entorno de alto riesgo como es la sanidad.
Potencial, limitaciones y el futuro de la relación médico-IA
Los resultados de esta investigación abren la puerta a un futuro donde la IA podría remodelar la atención sanitaria. Un sistema con esta capacidad podría ayudar a los pacientes a gestionar aspectos rutinarios de su salud y dotar a los médicos de un potente asistente para la toma de decisiones en los casos más complejos.
Además, sugiere un camino para reducir el enorme gasto sanitario. El gasto en salud en Estados Unidos se acerca al 20% de su PIB, y se calcula que hasta un 25% de esa cifra se desperdicia en procedimientos que apenas influyen en los resultados del paciente. Una IA capaz de optimizar las pruebas diagnósticas podría tener un impacto económico muy significativo.
Ante la pregunta inevitable de si la IA reemplazará a los médicos, el equipo de Microsoft, compuesto también por clínicos en activo, es tajante: la IA es un complemento, no un sustituto. «Las funciones clínicas son mucho más amplias que simplemente hacer un diagnóstico. Los médicos necesitan navegar por la ambigüedad y construir una relación de confianza con los pacientes y sus familias de una manera para la que la IA no está preparada», explican. Creen que el rol del médico evolucionará para centrarse en tareas de mayor valor, mientras la IA automatiza rutinas y personaliza tratamientos.
Los investigadores también son transparentes sobre las limitaciones de su estudio. MAI-DxO se ha probado en los casos más complejos, y su rendimiento en patologías más comunes aún debe ser evaluado. Asimismo, los médicos que participaron en la comparativa trabajaron en condiciones de aislamiento, sin acceso a colegas, libros o la propia IA, herramientas que sí utilizan en su práctica diaria.
Un camino por recorrer hacia la implementación clínica
Microsoft subraya que MAI-DxO es, por ahora, una demostración de investigación. Antes de que una tecnología así pueda llegar a hospitales y consultas, se necesita una validación rigurosa en entornos clínicos reales, así como el desarrollo de marcos de gobernanza y regulación que garanticen su fiabilidad, seguridad y eficacia.
La compañía está colaborando con organizaciones sanitarias para probar y validar estos enfoques. Para aquellos interesados en la metodología y los resultados detallados, el equipo ha publicado un artículo preimpreso en arXiv que está en proceso de revisión por pares.
«El futuro de la sanidad», concluyen, «se configurará aumentando la experiencia y la empatía humanas con el poder de la inteligencia de las máquinas». Con avances como este, ese futuro parece estar un poco más cerca.






