GPT-4 superó a los lectores humanos simulados en el diagnóstico de casos clínicos complejos

El GPT-4 de OpenAIdiagnosticó correctamente el 52,7 % de los casos complejos, frente al 36 % de los lectores de revistas médicas, y superó al 99,98 % de los lectores humanos simulados, según unestudio publicado por la revista New England Journal of Medicine.

La evaluación, realizada por investigadores de Dinamarca, utilizó GPT-4 para encontrar diagnósticos relacionados con 38 casos clínicos complejos con información textual publicada en línea entre enero de 2017 y enero de 2023. Las respuestas de GPT-4 se compararon con 248 614 respuestas de lectores de revistas médicas en línea.

Cada caso clínico complejo incluía un historial médico junto con una encuesta con seis opciones para el diagnóstico más probable. La indicación utilizada para GPT-4 pedía al programa que resolviera el diagnóstico respondiendo a una pregunta de opción múltiple y analizando el texto completo y sin editar del informe del caso clínico. Cada caso se presentó a GPT-4 cinco veces para evaluar la reproducibilidad.

Como alternativa, los investigadores recopilaron votos para cada caso entre los lectores de revistas médicas, lo que simuló 10 000 conjuntos de respuestas, lo que dio como resultado una pseudopoblación de 10 000 participantes humanos.

Los diagnósticos más comunes incluyeron 15 casos en el campo de las enfermedades infecciosas (39,5 %), cinco casos en endocrinología (13,1 %) y cuatro casos en reumatología (10,5 %). Los pacientes de los casos clínicos tenían edades comprendidas entre recién nacidos y 89 años, y el 37 % eran mujeres.

El GPT-4 de OpenAI diagnosticó correctamente el 52,7 % de los casos complejos, frente al 36 % de los lectores de revistas médicas, y superó al 99,98 % de los lectores humanos simulados, según un estudio publicado por la revista New England Journal of Medicine.
Ver artículo de referencia

Hombre sonriente con traje oscuro, camisa blanca y corbata a rayas de pie en un despacho de abogados corporativos moderno y luminoso.

[email protected]

San Diego 858.847.6733

Información relacionada

22 de mayo de 2026 Puntos de vista de Foley

Una nueva demanda pone a prueba los límites de los privilegios de asesoramiento de los fondos asesorados por donantes

Se ha presentado recientemente una demanda en... con el fin de aclarar el alcance de las facultades de un asesor en relación con un fondo asesorado por donantes (DAF).

22 de mayo de 2026 Puntos de vista de Foley

Lo que revela la sentencia del Tribunal Federal de Apelación sobre la patente avícola en relación con el término «about»

La resolución no parece prohibir el uso de términos como «aproximadamente» o «alrededor de». Más bien, reitera que dichos términos pueden ser admisibles cuando el expediente de la patente ofrece un contexto suficiente para comprender el alcance del intervalo reivindicado.

21 de mayo de 2026 Puntos de vista de Foley

¿Se está jugando el todo por el todo? El análisis de riesgo-rentabilidad de los pagarés con recurso para la financiación mediante capital

Introducción: Una de las herramientas más complejas del conjunto de instrumentos de remuneración de los directivos es el uso de un pagaré con derecho de recurso emitido por una…

Búsquedas populares

GPT-4 superó a los lectores humanos simulados en el diagnóstico de casos clínicos complejos.

Autor(es)

Paul S. Hunter

Información relacionada

Una nueva demanda pone a prueba los límites de los privilegios de asesoramiento de los fondos asesorados por donantes

Lo que revela la sentencia del Tribunal Federal de Apelación sobre la patente avícola en relación con el término «about»

¿Se está jugando el todo por el todo? El análisis de riesgo-rentabilidad de los pagarés con recurso para la financiación mediante capital