Station hybride (DSP/FPGA) pour un système rapide de reconnaissance automatique de la parole

Numéro de la revue: Volume 26 , Numéro 2

AuteursHamza Atoui*, Mouhamed Boughazi & Mouhamed Fezari

Département d’électronique, Université Badji Mokhtar, BP 12,  Annaba, 23000, Algérie.

 

Résumé

La reconnaissance automatique de la parole (RAP) a fait l’objet de plusieurs investigations depuis le début des années 50. La nature complexe de la parole oblige, l’auditeur humain à utiliser plusieurs niveaux de traitement pour ce domaine. Le 1er niveau est la détermination des caractéristiques du signal de la parole lui-même, c’est-à-dire l’analyse acoustique. Les niveaux phonétique, lexical et sémantique, etc. c’est dire combien chez l’être humain la reconnaissance et la compréhension de la parole sont fortement liées. Le but du présent travail est la réalisation d’un système embarqué (DSP/FPGA) pour le domaine de RAP fonctionnant en temps réel. Pour atteindre ce but, nous avons matérialisé quelques parties du système RAP implémenté sur DSP comme le filtre LMS et le cœur de la distance DTW (accélérateurs matériels) sur FPGA. Cette implantation nous permet d’accélérer le processus de la reconnaissance donc une augmentation considérable du dictionnaire de références.

 

Keywords

DSP-FPGA-DTW-LMS- Reconnaissance de la parole