Un estudio de Stanford revela un alto porcentaje de errores al utilizar grandes modelos lingüísticos en contextos jurídicos

El estudio realizado por la Universidad de Stanford reveló que las alucinaciones, o la tendencia de los modelos de lenguaje grandes (LLM) a producir contenido que se desvía de los hechos reales o de los principios y precedentes legales bien establecidos, se produjeron entre el 69 % y el 88 % de las veces en respuesta a consultas legales específicas.

El estudio aplicó 200 000 consultas a cada uno de los modelos GPT 3.5, Llama 2 y PaLM 2. Aunque se supone que estos programas de IA generativa han aprobado los exámenes de acceso a la abogacía, fallaron en algunas tareas básicas que realizan los abogados noveles. Por ejemplo, en una tarea que medía la relación entre dos casos diferentes, la mayoría de los LLM no obtuvieron mejores resultados que las respuestas aleatorias. Al responder a consultas sobre la sentencia principal (o fallo) de un tribunal, se descubrió que los modelos alucinaban al menos el 75 % de las veces.

Los riesgos de utilizar los LLM para la investigación jurídica son especialmente elevados en los siguientes casos:

Litigantes en tribunales inferiores o en jurisdicciones menos prominentes
Personas que buscan información jurídica detallada o compleja.
Los usuarios formulan preguntas basadas en premisas incorrectas.
Aquellos que no están seguros de la fiabilidad de las respuestas del LLM

Los resultados de este estudio son especialmente preocupantes, dado que hay docenas de startups tecnológicas jurídicas y bufetes de abogados que afirman estar utilizando la IA para prestar servicios jurídicos mejores y más eficientes. Sin embargo, dado el pobre rendimiento obtenido en estas pruebas, cualquiera que utilice IA o LLM debería actuar con extrema precaución. La ley parece requerir más inteligencia de la que ofrece actualmente la inteligencia artificial.

... las tasas de alucinación oscilan entre el 69 % y el 88 % en respuesta a consultas jurídicas específicas para modelos lingüísticos de última generación. Además, estos modelos suelen carecer de conciencia de sus errores y tienden a reforzar suposiciones y creencias jurídicas incorrectas. Estos hallazgos suscitan importantes preocupaciones sobre la fiabilidad de los LLM en contextos jurídicos, lo que subraya la importancia de una integración cuidadosa y supervisada de estas tecnologías de IA en la práctica jurídica.
Ver artículo de referencia

Hombre sonriente con traje oscuro, camisa blanca y corbata a rayas de pie en un despacho de abogados corporativos moderno y luminoso.

[email protected]

San Diego 858.847.6733

Información relacionada

24 de marzo de 2026 Puntos de vista de Foley

Reunión de primavera de la NAIC de 2026: Grupo de trabajo sobre datos y modelos de terceros (H) – 23 de marzo de 2026

Resumen y conclusiones: El Grupo de Trabajo sobre Datos y Modelos de Terceros (H) sigue avanzando en su Marco Regulador de Datos de Terceros…

20 de marzo de 2026 Puntos de vista de Foley

Un tribunal federal anula la normativa sobre trenes de alta velocidad de la era Biden

Al invalidar los cambios de la era Biden, el tribunal sostuvo que la FTC no demostró que los beneficios de los cambios superaran sus importantes costos para las partes que se fusionaban, en particular, para la gran mayoría (históricamente, el 92 %) de las partes cuyas transacciones no requieren investigación antimonopolio alguna.

18 de marzo de 2026 Puntos de vista de Foley

Cuando el sombrero de copa se inclina: cómo proteger la remuneración de los ejecutivos de la lista negra de los acreedores

Tu empresa se encamina hacia el Capítulo 11 y, de repente, una parte de la remuneración de los ejecutivos se ha convertido en el blanco de los acreedores. Los altos cargos…

Búsquedas populares

Un estudio de Stanford revela un alto porcentaje de errores al utilizar grandes modelos lingüísticos en contextos jurídicos.

Autor(es)

Paul S. Hunter

Información relacionada

Reunión de primavera de la NAIC de 2026: Grupo de trabajo sobre datos y modelos de terceros (H) – 23 de marzo de 2026

Un tribunal federal anula la normativa sobre trenes de alta velocidad de la era Biden

Cuando el sombrero de copa se inclina: cómo proteger la remuneración de los ejecutivos de la lista negra de los acreedores