Analyse de l'effet de la réverbération sur la reconnaissance automatique de la parole - Structuration, Analyse et Modélisation de documents Vidéo et Audio Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Analyse de l'effet de la réverbération sur la reconnaissance automatique de la parole

Résumé

La Reconnaissance Automatique de la Parole (RAP) est moins performante lorsque le signal de parole est de mauvaise qualité. Dans cette étude, nous analysons les erreurs commises par les systèmes de RAP lorsque la parole transcrite est réverbérée afin de mieux comprendre les raisons de ces erreurs. Notre analyse permet de mettre en valeur les erreurs dues notamment à un mauvais alignement phonétique. Nous avons pu constater que les phonèmes de courte durée sont majoritairement supprimés lors du décodage phonétique. De plus, les phonèmes détectés, qu’ils soient corrects ou pas, ont tendance à avoir la même durée, ce qui est anormal pour certaines classes phonétiques comme les voyelles courtes ou les plosives. Nous avons aussi analysé les principales confusions entre les différentes classes phonétiques. Finalement, nous avons pu montrer que les erreurs lors de l’alignement phonétique des systèmes de transcription automatique entraînent beaucoup d’erreurs de détection.
Fichier principal
Vignette du fichier
57.pdf (959.81 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02798542 , version 1 (07-06-2020)
hal-02798542 , version 2 (18-06-2020)
hal-02798542 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02798542 , version 3

Citer

Sébastien Ferreira, Jérôme Farinas, Julien Pinquier, Julie Mauclair, Stéphane Rabant. Analyse de l'effet de la réverbération sur la reconnaissance automatique de la parole. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, 2020, Nancy, France. pp.235-243. ⟨hal-02798542v3⟩
192 Consultations
80 Téléchargements

Partager

Gmail Facebook X LinkedIn More