La télémédecine met les professionnels de la santé à un simple appel des patients, mais les microphones permettant ces conversations ont leur propre potentiel de diagnostic. Aujourd’hui, l’utilisation de biomarqueurs vocaux – des signatures dans la parole humaine – qui peuvent fournir des avertissements en matière de bien-être lorsqu’ils sont décodés par l’IA de santé suscite un énorme intérêt.
Ce mois-ci, chercheurs de Klick Labs à Toronto, Canada, ont démontré comment les biomarqueurs vocaux présents dans des échantillons de parole pouvaient constituer un moyen extrêmement abordable de dépistage du diabète de type 2. L’approche, qui utilise l’IA en santé pour trouver des caractéristiques révélatrices dans les soumissions audio pointant vers la maladie, ne coûte que quelques centimes par rapport aux dollars des tests conventionnels.
Un modèle de prédiction pour le diabète de type 2
« En utilisant les smartphones des participants, nous avons enregistré plus de 18 000 segments vocaux d’individus atteints de diabète de type 2 et d’individus non diabétiques », a déclaré Jaycee Kaufman, premier auteur de l’étude sur les biomarqueurs vocaux publiée dans Mayo Clinic Proceedings: Digital Health. « Nous avons ensuite créé un modèle de prédiction afin de prédire le statut du diabète de type 2. »
La précision de l’utilisation de biomarqueurs vocaux se situait entre 86 et 89 %, contre 85 à 92 % pour le dépistage basé sur le glucose, et pourrait considérablement accélérer le diagnostic à l’échelle mondiale. Kaufman souligne qu’environ 200 millions de personnes dans le monde souffrent de diabète non diagnostiqué. Plutôt que d’avoir à se rendre à la clinique, les gens pourraient enregistrer leur voix sur un smartphone comme simple première étape de dépistage.
Le diabète n’est qu’une des nombreuses conditions médicales qui, selon les développeurs, pourraient être mises en évidence à l’aide de biomarqueurs vocaux. Le potentiel de l’IA en santé pour la surveillance vocale des patients devient vite évident si l’on considère que la parole est une combinaison d’actions musculaires, de contrôle cognitif et de physiologie.
Si l’un de ces éléments de la production vocale est altéré, il est possible que ces changements se manifestent sous forme de biomarqueurs vocaux. En ce qui concerne le diabète de type 2, on suppose que les concentrations de glucose à un moment donné affectent les propriétés élastiques des cordes vocales.
Les troubles liés à la voix comprennent des signes de cancer des voies vocales et des infections respiratoires. Des maladies telles que la maladie de Parkinson, la maladie d’Alzheimer et les accidents vasculaires cérébraux – pour ne citer que quelques exemples – peuvent diminuer le contrôle musculaire, ce qui a un impact sur l’articulation de la voix. Et les applications de dépistage médical et de suivi des patients ne s’arrêtent pas là.
Les biomarqueurs vocaux peuvent également signaler une réduction de la santé mentale et du bien-être afin de permettre une identification précoce du stress, de l’anxiété et de la dépression. Compte tenu de la large application de cette approche de l’IA en santé, le Le marché mondial des biomarqueurs vocaux devrait quadrupler au cours de la prochaine décennie. Fact.MR – une société d’études de marché – estime que le secteur pourrait être valorisé à plus de 9 milliards de dollars américains d’ici 2033.
« La voix est bien plus que de simples paroles », explique Dagmar Schuller, PDG et co-fondatrice d’Audeering. « Nous pouvons identifier de nombreux états et traits tout au long du processus de parole. » Le sexe, la taille, l’âge, la charge cognitive – que nous soyons alertes ou fatigués – et les informations sur la personnalité recueillies grâce à des modèles psychologiques ne sont que quelques-uns des détails qui peuvent être déchiffrés.
Liste des entreprises de technologie médicale utilisant des biomarqueurs vocaux et l’IA de la santé pour diagnostiquer des problèmes médicaux :
De plus, si vous souhaitez contribuer à ce domaine de recherche, vous pouvez faire don d’échantillons de voix à des initiatives telles que ColiveVoix – géré par l’Institut luxembourgeois de la santé. « Nous avons besoin de nombreux participants dans le monde entier, parlant différentes langues et étant soit en bonne santé, soit vivant avec une maladie chronique », écrit l’équipe de ColiveVoice.
Comment l’IA en santé trouve-t-elle des biomarqueurs vocaux dans la parole ?
Les techniques d’apprentissage profond sont idéales pour la correspondance de modèles et ont battu des records en matière de reconnaissance d’images. Comme de nombreuses équipes travaillant sur des applications de biomarqueurs vocaux, l’équipe de Klick Labs effectue son analyse en convertissant les données audio en spectrogrammes, qui – à un niveau élevé – peuvent être considérés comme des images sonores.
En fait, vous pouvez commencer à explorer cette approche par vous-même en téléchargeant logiciel d’analyse de la parole gratuit baptisé Praat, qui a longtemps été un outil privilégié pour faire de la phonétique par ordinateur. Praat est disponible pour Windows, Macintosh, Linux, Raspberry Pi et Chromebook. On peut également y accéder utiliser Python en installant la bibliothèque Parselmouthqui est la voie empruntée par les chercheurs de Klick Labs pour effectuer l’extraction de fonctionnalités.
Nous avons été nommés gagnants dans la catégorie Bien-être des consommateurs du #DigitalHealthAwards!🏆C’est un témoignage du travail acharné de nos Sondees et de nos partenaires. Nous sommes impatients de continuer à travailler pour diriger l’industrie du suivi de la santé dans le domaine des biomarqueurs vocaux. 🎉 pic.twitter.com/6i5fZ0X3nN
– Sonde Health, Inc. (@sondehealth) 10 octobre 2023
Les spectrogrammes affichent le temps en bas avec les données de fréquence sur l’axe vertical. Plus les signaux sont sombres, plus l’amplitude ou l’énergie est élevée. Rien qu’en regardant l’image, il est possible de voir des modèles, et les outils d’IA font passer ce processus au niveau supérieur.
La reconnaissance vocale utilise depuis longtemps des spectrogrammes, bien que de nouvelles techniques d’IA telles que clonage vocal – quelque chose que Microsoft a montré est possible en utilisant seulement 3 secondes de clips vocaux – travaillez plutôt avec des codecs audio.
Compte tenu de l’omniprésence des microphones et des enregistreurs de son dans un monde avec des milliards de téléphones portablesla facilité de capture de données à des fins de dépistage médical à l’aide de biomarqueurs vocaux et de l’IA en santé est frappante.
La voix est-elle le sang neuf ?
Peu d’entre nous souhaiteraient être sous surveillance audio complète, mais l’échantillonnage périodique de notre discours pourrait – grâce aux biomarqueurs et à l’IA en matière de santé – être bénéfique s’il permettait de détecter rapidement un malaise.
Curieusement, de tels algorithmes peuvent également mettre en lumière des personnages historiques – là où des enregistrements audio sont disponibles – et découvrir beaucoup plus d’informations sur les locuteurs qu’on n’en sait actuellement.