1 |
Contributions to the study of automatic speech recognitionon Fongbe ; Contributions à l'étude et à la reconnaissance automatique de la parole en Fongbe
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-01628455 ; Modélisation et simulation. Université du Littoral Côte d'Opale; Université d'Abomey-Calavi (Bénin), 2016. Français. ⟨NNT : 2016DUNK0452⟩ (2016)
|
|
BASE
|
|
Show details
|
|
2 |
Algorithme de découpages en groupes prosodiques pour la dictée par l'usage de synthèse vocale
|
|
|
|
In: Journées d'études sur la parole ; https://hal.archives-ouvertes.fr/hal-01137707 ; Journées d'études sur la parole, Jun 2014, Le Mans, France (2014)
|
|
BASE
|
|
Show details
|
|
3 |
Le chunking perceptif de la parole : sur la nature du groupement temporel et son effet sur la mémoire immédiate
|
|
|
|
BASE
|
|
Show details
|
|
4 |
Novel multiscale methods for nonlinear speech analysis ; Nouvelles méthodes multi-échelles pour l'analyse non-linéaire de la parole
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-00821896 ; Other [cs.OH]. Université Sciences et Technologies - Bordeaux I, 2013. English. ⟨NNT : 2013BOR14737⟩ (2013)
|
|
BASE
|
|
Show details
|
|
5 |
Gestion d'erreurs pour la fiabilisation des retours automatiques en apprentissage de la prosodie d'une langue seconde
|
|
|
|
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://hal.inria.fr/hal-00834278 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2013, 53 (3) ; http://www.atala.org/Gestion-d-erreurs-pour-la (2013)
|
|
BASE
|
|
Show details
|
|
6 |
Le chunking perceptif de la parole : sur la nature du groupement temporel et son effet sur la mémoire immédiate
|
|
|
|
BASE
|
|
Show details
|
|
7 |
Structuration automatique de flux télévisuels
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-00646522 ; Multimédia [cs.MM]. INSA de Rennes, 2011. Français (2011)
|
|
BASE
|
|
Show details
|
|
8 |
Acoustic Cues to Speech Segmentation in Spoken French: Native and Nonnative Strategies
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-00676964 ; Linguistics. University of Texas at Austin, 2009. English (2009)
|
|
BASE
|
|
Show details
|
|
9 |
La Résolution de la liaison par des locuteurs natifs et non-natifs
|
|
|
|
In: ISSN: 1243-969X ; EISSN: 1778-7432 ; Acquisition et Interaction en Langue Etrangère ; https://halshs.archives-ouvertes.fr/halshs-00668888 ; Acquisition et Interaction en Langue Etrangère, Association Encrages, 2008, 27, pp.43-62 (2008)
|
|
BASE
|
|
Show details
|
|
10 |
Utilisation des grammaires probabilistes dans les tâches de segmentation et d'annotation prosodique
|
|
|
|
In: Actes, Journées d'Etudes sur la Parole ; Journées d'Etudes sur la Parole ; https://hal.archives-ouvertes.fr/hal-00285643 ; Journées d'Etudes sur la Parole, Jun 2008, Avignon, France. pp.1-5 (2008)
|
|
BASE
|
|
Show details
|
|
11 |
Les variables temporelles dans la production et la perception de la parole ...
|
|
|
|
BASE
|
|
Show details
|
|
12 |
Les variables temporelles dans la production et la perception de la parole
|
|
|
|
BASE
|
|
Show details
|
|
13 |
The use of hypothetical reasoning techniques for automatic speech recognition ; Utilisation des techniques du raisonnement hypothétique pour la reconnaissance automatique de la parole
|
|
|
|
In: https://hal.univ-lorraine.fr/tel-01754150 ; Autre. Université Henri Poincaré - Nancy 1, 1994. Français. ⟨NNT : 1994NAN10311⟩ (1994)
|
|
BASE
|
|
Show details
|
|
14 |
Contribution to the automatic identification of the speaker on acoustic and phonetic criteria ; Contribution à l’identification automatique du locuteur sur des critères acoustiques et phonétiques
|
|
|
|
In: https://hal.inria.fr/tel-01739696 ; Informatique et langage [cs.CL]. Université de Nancy I, 1993. Français. ⟨NNT : 1993NAN10411⟩ (1993)
|
|
Abstract:
Methods for achieving automatic speaker recognition may be classified into twocategories: pattern recognition based approaches that implicitly use interspeaker and intraspeakervariability of speech and approaches which explicitly take into account the sources ofinterspeaker and intraspeaker differences. The latter examine linguistic units in order to extractfeatures which are relevant for speaker characterization. The aim of the present study is precise/y to analyse the relative effectiveness of the three first formants of French vowels in thecontext /p-vowel-R/.These selected trigrams are a part of a larger set of preselected acoustic and phoneticparameters which lead us to record and digitalize a set of seventeen sentences, uttered fourtimes by ten male speakers coming from the same region.We begin to expound the required know/egdes about speech production process andintraspeaker and interspeaker variability for understanding issues in speaker characterization.We then present a review of the studies in automatic speaker recognition according to theabove classification. With regards of methods adapted from the domain of speech recognition,we restrict our review to the more recent works. In the other hand, we try to be more exhaustivefor studies in speaker characterization.Following this, we develop the different stages of our study. After describing and praving theprese/ected acoustic and phonetic parameters, we deal with the the hand-Iabeling of our corpusaccording to strict rules. We examine furthermore the effectiveness of the three first formantsof French vowels in the context /p-vowel-R/. For that purpose, we firstly propose an automaticmethod to determine reliable values of the three frequencies of the first formants of selectedvowels. We besides discuss the re/iability of the results. For every vowel, we then analysethe relative effectiveness of each combination of formants frequencies and differences betweenthese frequencies. This analyse is based on the computation of three "relevance indicators" fromthe results of speaker identification experiments. ; Les recherches en reconnaissance automatique du locuteur peuvent être reparties en deux grandes classes, d'une part les recherches qui sont fondées sur les techniques de reconnaissance de formes issues de la reconnaissance automatique de la parole, et d'autre part, celles qui ont pour objectif d'exploiter explicitement la variabilité interlocuteur et la variabilité intralocuteur de la parole. Notre étude se situe dans cette seconde classe. Dans un premier temps, nous présentons les connaissances des domaines de la production de la parole et de la variabilité de la parole qui sont nécessaires à la compréhension de la problématique de la caractérisation du locuteur. Puis, nous plaçons notre travail dans le cadre plus général de la reconnaissance automatique du locuteur en présentant une synthèse des travaux les plus récents dans les deux classes de recherches définies au début de ce résumé. Enfin, nous développons les différentes étapes de notre étude. Après une présentation des paramètres acoustiques et phonétiques sélectionnés comme susceptibles de caractériser au mieux le locuteur, nous décrivons les phases d'élaboration et d'étiquetage manuel de notre corpus. Puis, nous détaillons l'étude de la pertinence des trois premiers formants de sept voyelles orales dans un contexte /p-voyelle-r/. Pour cela, nous exposons une méthodologie de détermination automatique de valeurs robustes des trois premiers formants des voyelles et nous commentons les résultats obtenus. Ensuite, nous présentons, pour chacun des triplets sélectionnés, l'analyse de la pertinence des combinaisons de formants et des écarts entre les formants pour l'identification du locuteur. Cette analyse est fondée sur l'établissement de trois indicateurs issus d'expériences d'identification d'un locuteur parmi dix. Nous terminons par une interprétation de ces résultats.
|
|
Keyword:
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; caractérisation du locuteur; étiquetage; formant computation; Formants; identification du locuteur; Reconnaissance du locuteur; Segmentation; speaker characterization; speaker recognition; speech labeling; Speech processing; speech variability; traitement automatique de la parole; variabilité interlocuteur; Variabilité intralocuteur; Vérification du locuteur
|
|
URL: https://hal.inria.fr/tel-01739696/document https://hal.inria.fr/tel-01739696 https://hal.inria.fr/tel-01739696/file/SCD_T_1993_0411_MELLA.pdf
|
|
BASE
|
|
Hide details
|
|
15 |
The use of prosodic parameters in automatic speech recognition
|
|
|
|
In: Recent advances in speech understanding and dialog systems ; https://halshs.archives-ouvertes.fr/halshs-00363982 ; H. Niemann & al. Recent advances in speech understanding and dialog systems, Springer Verlag, pp.71-99, 1988, NATO ASI Series (1988)
|
|
BASE
|
|
Show details
|
|
|
|