Este proyecto propone desarrollar y validar el primer corpus de habla para detección de depresión en espanol argentino (AR-DEP-Corpus), abordando la brecha mas significativa en el campo de biomarcadores vocales de salud mental: la ausencia total de datasets validados en cualquier variedad del espanol. La base de evidencia global se sustenta en aproximadamente 800 participantes clinicamente etiquetados, con ingles y chino mandarin representando mas del 90% del total.
El estudio reclutara 120 adultos (60 con depresión mayor, 60 controles) del area metropolitana de Buenos Aires. Se recopilaran grabaciones de voz en condiciones clínicas estandarizadas y mediante mensajes de audio de WhatsApp para validez ecologica. Se extraera el set estandarizado de 88 features acusticas eGeMAPS mediante openSMILE, y se evaluara la capacidad de detección mediante modelos de machine learning con validación cruzada leave-one-subject-out.
Como resultado secundario, se evaluara la transferibilidad de modelos entrenados en ingles (DAIC-WOZ) al espanol argentino, cuantificando la degradacion cross-linguistica. El espanol rioplatense presenta desafios especificos: patrones de entonacion influenciados por el italiano, la realizacion /sh/ de ll/y, velocidad del habla tipicamente mas rápida, y el voseo en conjugaciones verbales.
La depresión afecta al 5.7% de la población argentina con una brecha de tratamiento superior al 70%. Solo el 4% de pacientes en atención primaria son evaluados para depresión. Los biomarcadores vocales de Kintsugi mostraron sensibilidad del 80.3% en población hispana/latina — la mas alta de todos los grupos etnicos — sugiriendo que esta tecnología podria ser particularmente efectiva en esta población.
Documento con la propuesta de investigación completa, metodología y presupuesto.
Descargar documento