Nous décrivons le processus de construction d'un corpus pour la reconnaissance des émotions dans la parole en Tunisie (SER). À notre connaissance, il s'agit du premier travail dans le domaine de la SER qui utilise des émotions spontanées dans le dialecte tunisien. La SER représente un problème de recherche actif dans le domaine du traitement du langage naturel (NLP). Elle vise à détecter différentes émotions telles que la satisfaction, la frustration et la colère à partir de discours audio à l'aide de divers classificateurs. Le prétraitement du signal de parole est la première et la plus importante étape du processus de SER. En outre, le prétraitement de la parole est très important dans les applications où le silence ou le bruit ambiant est totalement indésirable. La détection de l'activité vocale est une procédure courante qui joue un rôle clé dans le prétraitement des signaux vocaux et l'élimination du bruit. La préaccentuation de la parole permet au système d'être plus efficace sur le plan informatique . Ce travail propose une méthode de prétraitement pour extraire les caractéristiques de la parole tunisienne naturelle. Le prétraitement de la parole consiste à nettoyer le signal de la parole des bruits ambiants et indésirables, à détecter l'activité de la parole et à normaliser la longueur du conduit vocal.
- Présentation