La heterogeneidad en la respuesta a los antipsicóticos sigue siendo uno de los principales desafíos en el tratamiento de la esquizofrenia y otros trastornos psicóticos. A pesar de disponer de múltiples fármacos, la selección terapéutica continúa basándose en un enfoque de ensayo-error, con el consiguiente retraso en la estabilizaci&oac...
La heterogeneidad en la respuesta a los antipsicóticos sigue siendo uno de los principales desafíos en el tratamiento de la esquizofrenia y otros trastornos psicóticos. A pesar de disponer de múltiples fármacos, la selección terapéutica continúa basándose en un enfoque de ensayo-error, con el consiguiente retraso en la estabilización clínica y un mayor riesgo de cronificación.
En este contexto, la Inteligencia Artificial en psiquiatría ha emergido como una herramienta prometedora para anticipar la respuesta al tratamiento y avanzar hacia una auténtica psiquiatría de precisión. Sin embargo, uno de los principales obstáculos para su implementación clínica ha sido la falta de generalización externa y la limitada evaluación de su utilidad real.
Un reciente estudio publicado en Psychiatry and Clinical Neurosciences desarrolla y valida modelos de machine learning capaces de predecir la respuesta a antipsicóticos en distintas poblaciones con psicosis, evaluando además su calibración, beneficio clínico y posibles sesgos.
Diseño del estudio: más allá de la validación interna
El trabajo analizó datos de dos grandes ensayos clínicos internacionales: CATIE (esquizofrenia establecida) y EUFEST (primer episodio psicótico). Se desarrollaron modelos predictivos utilizando variables clínicas, sociodemográficas y cognitivas compartidas entre ambas muestras.
Los algoritmos incluyeron modelos de Support Vector Machine con validación cruzada anidada repetida, minimizando el riesgo de sobreajuste. Se evaluaron cuatro definiciones de resultado a los tres meses: severidad total de síntomas, cambio porcentual, reducción mayor o igual al 25% y remisión según criterios RSWG.
El elemento diferencial fue la validación externa cruzada entre cohortes, probando los modelos entrenados en una muestra dentro de la otra población.
Resultados: ¿qué predice mejor la IA?
Los modelos que predijeron severidad total de síntomas alcanzaron correlaciones moderadas, mientras que los modelos de remisión RSWG lograron precisiones balanceadas entre el 62% y el 69%. Lo más relevante fue que estos modelos generalizaron correctamente entre poblaciones con diferente estadio clínico.
En cambio, los modelos basados en porcentaje de cambio sintomático mostraron menor rendimiento y peor generalización. Este hallazgo subraya que no todas las definiciones de respuesta son igualmente predecibles ni útiles desde el punto de vista clínico.
Variables predictivas relevantes
Entre los predictores más robustos se encontraron la severidad basal, síntomas específicos como delirios o afecto embotado, falta de insight, rendimiento cognitivo, situación laboral y gravedad clínica global.
De forma destacable, los modelos pudieron reducirse a un conjunto limitado de variables clave manteniendo un rendimiento significativo, lo que sugiere viabilidad clínica sin necesidad de aplicar escalas completas en todos los casos.
Utilidad clínica: más allá de la precisión estadística
El estudio incorporó análisis de utilidad clínica mediante curvas de decisión y análisis de calibración. Los modelos de remisión mostraron beneficio neto en determinados umbrales de riesgo, especialmente en pacientes con alta probabilidad de no respuesta.
Aunque una precisión cercana al 65% puede parecer modesta, estudios previos sugieren que modelos con rendimientos superiores al 60% podrían tener impacto clínico y económico relevante en esquizofrenia, especialmente en decisiones de alto riesgo como la introducción precoz de clozapina.
No obstante, los autores advierten que los modelos aún no están listos para implementación directa debido a diferencias de calibración entre poblaciones y a variaciones en el rendimiento según subgrupos.
Sesgos y equidad: un reto estructural
El análisis de subgrupos mostró mejor rendimiento en varones frente a mujeres y diferencias según grupo étnico y antipsicótico utilizado. Estos resultados reflejan un problema más amplio: la falta de diversidad en ensayos clínicos puede traducirse en modelos menos equitativos.
La equidad predictiva es un requisito esencial si la Inteligencia Artificial en psiquiatría pretende contribuir a una medicina personalizada responsable.
Implicaciones para la práctica clínica
La posibilidad de identificar tempranamente a pacientes con alto riesgo de no respuesta podría reducir retrasos en la optimización terapéutica, disminuir ensayos fallidos y mejorar la planificación asistencial.
Sin embargo, antes de su integración en sistemas clínicos reales será necesaria validación prospectiva, recalibración local y consenso internacional sobre las definiciones de respuesta clínicamente relevantes.
Conclusión
Este estudio representa un avance metodológico significativo en el desarrollo de modelos de Inteligencia Artificial en psiquiatría. Demuestra que la generalización y la evaluación de utilidad clínica son tan importantes como la precisión estadística.
La psiquiatría de precisión no dependerá únicamente de algoritmos sofisticados, sino de modelos validados, calibrados y aplicables en entornos clínicos reales, con especial atención a la equidad y la relevancia clínica de los resultados.
Marc Moreno, comité científico psiquiatria.com
Coutts F, Mena S, Ucur E, et al. Ensuring generalizability and clinical utility in mental health care applications: Robust artificial intelligence-based treatment predictions in diverse psychosis populations. Psychiatry and Clinical Neurosciences. 2026;80:64–75. https://onlinelibrary.wiley.com/doi/10.1111/pcn.13914/full