← Volver a Investigación
Detección y Biomarcadores

NLP y Análisis de Sentimiento para Mapeo PHQ-9

SentirIA Research Papers — 2026
← Todas las investigaciones

Resumen

El procesamiento de lenguaje natural puede mapear conversaciones en lenguaje libre a items individuales del PHQ-9 con precision clinicamente significativa, abriendo la puerta al screening invisible y longitudinal mediante IA conversacional. GPT-4o alcanza 75.9% de precision binaria en análisis zero-shot de transcripciones clínicas, mientras que modelos especificos de dominio como MentalBERT alcanzan F1 superiores a 0.89 en detección de depresión en Reddit.

Cada item del PHQ-9 tiene firmas linguisticas identificables. La anhedonia (Item 1) se detecta a través de la ausencia de afecto positivo — negativos negados, lenguaje de retiro, palabras de discrepancia. El animo deprimido (Item 2) se manifiesta con palabras de tristeza, desesperanza y pronombres en primera persona singular. Los trastornos del sueño (Item 3) muestran la detección mas confiable, con FLAN-T5 alcanzando F1 = 0.92 para extraccion de problemas de sueño de historias clínicas.

El lenguaje absolutista ("siempre", "nunca", "nada", "completamente") representa el marcador linguistico mas potente, con tamanos de efecto superiores a d = 3.14 en foros de depresión versus controles. Ningun LLM individual sobresale en todos los items — los autores recomiendan un enfoque de ensemble: GPT-4o para items cognitivos/emocionales, Llama para anhedonia, Cohere para cambios psicomotores.

Para el contexto hispanohablante, el PHQ-9 en espanol ha sido validado en multiples poblaciones latinoamericanas, con sensibilidad y especificidad agrupadas de 0.89 cada una para el PHQ-2. Los hablantes de espanol tienden a descripciones mas somaticas de la depresión ("me duele el cuerpo", "siento un peso en el pecho") y usan idiomas culturales de malestar como "nervios" y "susto".

d > 3.14
Lenguaje absolutista
El marcador linguistico mas potente para depresión, superando a palabras de emocion negativa (Al-Mosaiwi, 2018).
F1 = 0.92
Detección de sueño
FLAN-T5 para extraccion de problemas de sueño — el item del PHQ-9 con detección mas confiable.

Descargar investigación completa

Accede al documento completo con todas las referencias y análisis.

Descargar documento