Harry Cohen Tanugi

Une nouvelle invention conçue pour aider les personnes sourdes pourrait aussi aider les militaires

La langue des signes devient-elle obsolète ?

Des innovations constantes comme celles-ci pourraient bientôt faire des interprètes et même le langage des signes obsolètes. En mars 2021, Google a dévoilé sa fonction de sous-titres en direct sur les navigateurs Chrome. Live Caption utilise l'apprentissage automatique pour créer instantanément des sous-titres codés sur n'importe quel clip vidéo ou audio, offrant ainsi aux personnes sourdes et malentendantes un meilleur accès au contenu Internet.

Dans le passé - et encore aujourd'hui - les sous-titres codés étaient soit préprogrammés pour les formats vidéo, soit un sténographe tapait un sous-titre quasi instantané qui était diffusé à la télévision. Cependant, dans les endroits où le sous-titrage n'est pas la "norme", comme sur des applications comme Instagram ou TikTok, les sous-titres sont presque impossibles à trouver. Live Caption change cela : en quelques pressions sur l'écran, n'importe quel utilisateur peut disposer de légendes instantanées et précises qui élargissent la portée de l'audio et de la vidéo.

Le sous-titrage en direct de Google est un type de traitement du langage naturel (NLP). Le NLP est une forme d'intelligence artificielle qui utilise des algorithmes pour faciliter une sorte d'"interaction" entre les personnes et les machines. Les NLP nous aident à décoder les langages humains en langage machine, et souvent vice versa.

La nouvelle étude est publiée dans Nature Communications.

Résumé de l'étude :

Une interface vocale silencieuse (SSI) portable est une plateforme prometteuse qui permet la communication verbale sans vocalisation. La méthodologie la plus largement étudiée pour la SSI se concentre sur l'électromyographie de surface (sEMG). Cependant, la sEMG souffre d'une faible évolutivité en raison de problèmes liés à la qualité du signal, notamment le rapport signal/bruit et les interférences inter-électrodes. Par conséquent, nous présentons ici un nouveau SSI en utilisant des capteurs de contrainte à base de silicium cristallin combinés à un algorithme d'apprentissage profond convolutif 3D. Deux jauges de contrainte placées perpendiculairement avec une dimension de cellule minimisée (0,1 mm2) peuvent capturer efficacement les informations de contrainte biaxiale avec une grande fiabilité. Nous avons fixé quatre capteurs de déformation près de la bouche des sujets et recueilli les données de déformation d'ensembles de mots d'une taille sans précédent (100 mots), que notre SSI peut classer avec un taux de précision élevé (87,53 %). Plusieurs méthodes d'analyse ont été démontrées pour vérifier la fiabilité du système, ainsi que la comparaison des performances avec un autre SSI utilisant des électrodes sEMG de même dimension, qui présentait un taux de précision relativement faible (42,60 %).

[SOURCE]

menu