El psiquiatra frente al algoritmo: cuando la IA acierta, pero no

Hay una paradoja cada vez más evidente en la inteligencia artificial aplicada a la psiquiatría. Los modelos son cada vez mejores detectando patrones asociados a depresión, ansiedad o riesgo suicida. Sin embargo, cuanto más complejos se vuelven, más difícil resulta entender cómo han llegado a una determinada conclusión.

Los trabajos publicados durante las últimas semanas muestran que esta cuestión empieza a convertirse en uno de los principales desafíos para la incorporación real de la IA a la práctica clínica.

Uno de los ejemplos más llamativos es InsightDep, presentado en Scientific Reports. El sistema fue diseñado para detectar señales de depresión en publicaciones de redes sociales utilizando grandes modelos de lenguaje (LLM). Lo novedoso no es únicamente su rendimiento, que alcanza precisiones superiores al 99 % en algunos conjuntos de datos experimentales. Lo realmente interesante es que intenta explicar sus conclusiones.

En lugar de limitarse a emitir una etiqueta diagnóstica, el modelo traduce los patrones internos de la red neuronal en explicaciones comprensibles para humanos. Es decir, intenta responder a la pregunta que cualquier psiquiatra formularía de manera inmediata: «¿por qué crees que esta persona presenta signos compatibles con depresión?».

Puede parecer un detalle técnico, pero en realidad toca el núcleo del problema.

La mayoría de sistemas actuales funcionan como cajas negras. Reciben enormes cantidades de datos, identifican patrones estadísticos y generan una predicción. El clínico recibe el resultado, pero desconoce el proceso que ha conducido a él.

En cardiología o radiología esta limitación ya genera debates intensos. En psiquiatría la situación es todavía más delicada. No estamos clasificando tumores o detectando fracturas. Estamos interpretando experiencias humanas, sufrimiento emocional, contextos sociales y narrativas personales.

Por eso resulta especialmente relevante otro de los trabajos publicados recientemente: la auditoría realizada por Pendse y colaboradores sobre seis grandes modelos de lenguaje utilizados para tareas diagnósticas psiquiátricas.

El estudio empleó 97 casos clínicos DSM-5 modificados sistemáticamente para representar distintos grupos demográficos. Los resultados fueron tan interesantes como preocupantes.

GPT-4o fue capaz de identificar correctamente al menos un diagnóstico en más del 80 % de los casos evaluados. Sin embargo, añadió diagnósticos adicionales innecesarios en aproximadamente siete de cada diez situaciones.

Más inquietante todavía fue la aparición de sesgos demográficos. Algunos diagnósticos aparecían con mayor frecuencia cuando el caso pertenecía a determinados grupos étnicos o culturales. Determinadas expresiones conductuales eran descritas con un lenguaje más problemático cuando se asociaban a hombres negros que cuando se presentaban exactamente los mismos síntomas en otros grupos.

Los autores no concluyen que los modelos sean discriminatorios de forma deliberada. Lo que muestran es algo más importante: los LLM aprenden los sesgos presentes en los datos con los que fueron entrenados.

La implicación clínica es enorme. Durante décadas los psiquiatras hemos trabajado para reducir sesgos relacionados con género, etnia, edad o nivel socioeconómico. Si la IA reproduce automáticamente estos patrones históricos, podríamos estar incorporando nuevas fuentes de desigualdad precisamente en el momento en que intentamos eliminarlas.

Pero existe un problema aún más profundo.

La psiquiatra Hina Tahseen lo plantea de forma especialmente clara en un artículo reciente publicado en JMIR Mental Health. Introduce el concepto de «colusión algorítmica».

La idea es sencilla. Si entrenamos modelos utilizando datos procedentes exclusivamente de autoinformes de pacientes sin validación clínica rigurosa, la IA puede aprender a reforzar distorsiones en lugar de corregirlas.

Un paciente con ansiedad grave puede sobreestimar determinados síntomas. Un paciente deprimido puede interpretar sistemáticamente la realidad de forma negativa. Si esos datos se convierten en la base del entrenamiento del sistema, la IA aprenderá precisamente esas distorsiones. En lugar de funcionar como una herramienta correctora, terminaría amplificando los mismos errores cognitivos que pretendemos comprender y tratar.

La preocupación conecta directamente con otro hallazgo relevante de esta semana.

Una revisión publicada en Brain Sciences sobre grandes modelos de lenguaje para detección de depresión señala que la mayoría de sistemas funcionan razonablemente bien cuando trabajan con datos completos y limpios. Sin embargo, la realidad clínica es otra.

Las entrevistas son incompletas. Los pacientes olvidan información. Algunos rechazan grabaciones de voz o vídeo. Los datos llegan fragmentados, contradictorios o directamente ausentes. Es precisamente en ese entorno donde deben demostrar su utilidad.

Los autores concluyen que la próxima generación de sistemas deberá aprender a manejar incertidumbre clínica, datos incompletos y contextos ambiguos. Exactamente los mismos desafíos que afronta un psiquiatra en una consulta cotidiana.

Todo ello explica por qué cada vez más expertos empiezan a desplazar el foco desde la precisión hacia la explicabilidad.

La cuestión ya no es únicamente si un modelo acierta. La cuestión es si podemos entender por qué acierta.

Porque en medicina la confianza no surge únicamente del resultado. Surge de la capacidad para justificar una decisión ante un paciente, un familiar, un tribunal o uno mismo.

Y esa necesidad es especialmente intensa en salud mental. Ningún psiquiatra puede permitirse responder a un paciente: «el algoritmo lo dice, pero no sabemos exactamente por qué».

Quizá esa sea la lección más importante que dejan los trabajos de esta semana.

La inteligencia artificial seguirá mejorando sus capacidades diagnósticas. Probablemente seguirá superando a los humanos en determinadas tareas concretas. Pero si quiere formar parte real de la práctica psiquiátrica tendrá que aprender algo que los clínicos llevan siglos haciendo: explicar su razonamiento.

Porque en psiquiatría no basta con tener razón. También hay que poder defenderla.

Referencias

Large language model empowered explainable and interpretable mental health analysis (InsightDep) Scientific Reports (2026)

Diagnostic biases in large language models across demographic groups Pendse, et al. · Mayo Clinic Proceedings: Digital Health (2026)

When AI Colludes: Clinical Reliability of Training Data as a Trustworthy-AI Criterion Tahseen H. · JMIR Mental Health (2026)

Large Language Models for Depression Detection: A Review Brain Sciences (2026)

Artificial intelligence and psychiatric diagnosis: a warning to the mental health community Frances A. · World Psychiatry (2026)

Actualidad y Artículos | Inteligencia artificial Seguir 167 Favorito

El psiquiatra frente al algoritmo: cuando la IA acierta, pero no sabemos si debemos creerle

Este contenido es exclusivo para suscriptores.

Referencias

Comentarios de los usuarios

IMPORTANTE: Debes indicar tu profesión para poder tener acceso a todas las opciones de psiquiatria.com

Próximos cursos

Terapia de resolución de problemas