La start-up chinoise d’intelligence artificielle Voice Health Tech a lancé un projet conjoint avec un groupe de chercheurs dirigé par Yue Weihua, professeur au sixième hôpital de l’Université de Pékin, sur l’utilisation de la parole pour le dépistage et l’évaluation de la dépression.
Le projet est maintenant entré dans la phase de recherche clinique. En novembre 2022, l’équipe a publié un article de recherche clinique dans Frontiers in Psychiatry, une revue médicale internationale.
L’équipe utilise une méthode basée uniquement sur l’apprentissage profond pour le traitement du signal acoustique, permettant de diagnostiquer la dépression à partir d’un discours d’environ 30 secondes via un smartphone.
La sensibilité et la spécificité de la méthode – mesures utilisées pour déterminer la précision d’un test – auraient atteint 82,14% et 80,65%, respectivement.
La sensibilité est la capacité d’un test à identifier les patients atteints d’une maladie, tandis que la spécificité est la capacité d’identifier les personnes sans la maladie.
Malgré l’utilisation de critères d’évaluation plus stricts appelés DSM-5, ou Manuel diagnostique et statistique des troubles mentaux, cinquième édition, les performances démontrées par ce modèle d’apprentissage profond dans la recherche clinique auraient dépassé celles des sociétés occidentales liées.
Le modèle vocal du projet a été préparé à l’aide d’un ensemble de données comprenant jusqu’à 43 000 conversations cliniques. Il a également été testé et étudié à l’aide d’un ensemble de données de validation indépendant.
Les conversations recueillies auprès des patients, qui ont tous été diagnostiqués sur la base du DSM-5, ont été enregistrées avec différents smartphones dans divers contextes.
He Gongcheng, cofondateur et médecin en chef de Voice Health Tech, a déclaré que la qualité de l’ensemble de données pourrait être la plus élevée dans le domaine à ce stade.
Les statistiques montrent qu’il y a 1 milliard de personnes souffrant de problèmes mentaux dans le monde. La dépression est une maladie grave qui mine la santé des gens.
Selon un rapport de l’Organisation mondiale de la santé, on estime que plus de 300 millions de personnes souffrent de dépression, avec un taux d’incidence moyen de 4,4%.
En Chine, la prévalence de la dépression au cours de la vie atteindrait 6,8%. La dépression devrait également devenir un fardeau majeur de la maladie dans le monde d’ici 2030.
Dans l’état actuel des choses, de nombreux patients souffrant de dépression sont diagnostiqués à tort ou ne peuvent pas recevoir le soutien nécessaire en raison de facteurs tels que l’accessibilité médicale.
La dépression a jusqu’à présent été diagnostiquée par des experts psychiatriques, qui interrogent et évaluent les patients en fonction de certains critères pour déterminer qui souffre de dépression.
Mais une pénurie de psychiatres rend le diagnostic plus difficile en Chine. En 2017, la Chine comptait 27 000 psychiatres, soit deux psychiatres pour 100 000 habitants.
Selon les données de l’OMS, la Russie et les États-Unis ont respectivement 11 et 12 psychiatres pour 100 000 habitants. Bien que le nombre de psychiatres en Chine soit passé à 40 000 en 2020, leur présence reste relativement faible, compte tenu de la population du pays.
De plus, certains patients souffrant de dépression ne sont pas conscients de la gravité de leurs symptômes ou tentent de les cacher aux médecins. C’est pourquoi les erreurs de diagnostic sont souvent commises dans le cadre des méthodes de diagnostic traditionnelles.
Ces dernières années, la technologie de l’IA pour les appareils mobiles a joué un rôle important dans la surveillance des données physiologiques et psychologiques de manière non invasive et continue.
Dans le même temps, des technologies telles que la reconnaissance sémantique et la traduction automatique ont progressivement mûri, tandis que l’acoustique et le traitement des commandes vocales ont progressé. En conséquence, l’apprentissage automatique est devenu un nouveau domaine du diagnostic.
Certaines caractéristiques acoustiques – y compris glottales, spectrales et prosodiques – sont utilisées pour identifier la dépression.
L’apprentissage automatique permet de détecter des changements objectifs dans les caractéristiques acoustiques que les humains ne peuvent pas percevoir avec leurs oreilles. Il montre également un potentiel en termes de détection des troubles mentaux, y compris la dépression.