2 |
The processing of intimately familiar and unfamiliar voices: Specific neural responses of speaker recognition and identification
|
|
|
|
In: PLoS One (2021)
|
|
BASE
|
|
Show details
|
|
3 |
Traitement neuronal des voix et familiarité : entre reconnaissance et identification du locuteur
|
|
|
|
Abstract:
La capacité humaine de reconnaitre et d’identifier de nombreux individus uniquement grâce à leur voix est unique et peut s’avérer cruciale pour certaines enquêtes. La méconnaissance de cette capacité jette cependant de l’ombre sur les applications dites « légales » de la phonétique. Le travail de thèse présenté ici a comme objectif principal de mieux définir les différents processus liés au traitement des voix dans le cerveau et les paramètres affectant ce traitement. Dans une première expérience, les potentiels évoqués (PÉs) ont été utilisés pour démontrer que les voix intimement familières sont traitées différemment des voix inconnues, même si ces dernières sont fréquemment répétées. Cette expérience a également permis de mieux définir les notions de reconnaissance et d’identification de la voix et les processus qui leur sont associés (respectivement les composantes P2 et LPC). Aussi, une distinction importante entre la reconnaissance de voix intimement familières (P2) et inconnues, mais répétées (N250) a été observée. En plus d’apporter des clarifications terminologiques plus-que-nécessaires, cette première étude est la première à distinguer clairement la reconnaissance et l’identification de locuteurs en termes de PÉs. Cette contribution est majeure, tout particulièrement en ce qui a trait aux applications légales qu’elle recèle. Une seconde expérience s’est concentrée sur l’effet des modalités d’apprentissage sur l’identification de voix apprises. Plus spécifiquement, les PÉs ont été analysés suite à la présentation de voix apprises à l’aide des modalités auditive, audiovisuelle et audiovisuelle interactive. Si les mêmes composantes (P2 et LPC) ont été observées pour les trois conditions d’apprentissage, l’étendue de ces réponses variait. L’analyse des composantes impliquées a révélé un « effet d’ombrage du visage » (face overshadowing effect, FOE) tel qu’illustré par une réponse atténuée suite à la présentation de voix apprise à l’aide d’information audiovisuelle par rapport celles apprises avec dans la condition audio seulement. La simulation d’interaction à l’apprentissage à quant à elle provoqué une réponse plus importante sur la LPC en comparaison avec la condition audiovisuelle passive. De manière générale, les données rapportées dans les expériences 1 et 2 sont congruentes et indiquent que la P2 et la LPC sont des marqueurs fiables des processus de reconnaissance et d’identification de locuteurs. Les implications fondamentales et en phonétique légale seront discutées. ; The human ability to recognize and identify speakers by their voices is unique and can be critical in criminal investigations. However, the lack of knowledge on the working of this capacity overshadows its application in the field of “forensic phonetics”. The main objective of this thesis is to characterize the processing of voices in the human brain and the parameters that influence it. In a first experiment, event related potentials (ERPs) were used to establish that intimately familiar voices are processed differently from unknown voices, even when the latter are repeated. This experiment also served to establish a clear distinction between neural components of speaker recognition and identification supported by corresponding ERP components (respectively the P2 and the LPC). An essential contrast between the processes underlying the recognition of intimately familiar voices (P2) and that of unknown but previously heard voices (N250) was also observed. In addition to clarifying the terminology of voice processing, the first study in this thesis is the first to unambiguously distinguish between speaker recognition and identification in terms of ERPs. This contribution is major, especially when it comes to applications of voice processing in forensic phonetics. A second experiment focused more specifically on the effects of learning modalities on later speaker identification. ERPs to trained voices were analysed along with behavioral responses of speaker identification following a learning phase where participants were trained on voices in three modalities : audio only, audiovisual and audiovisual interactive. Although the ERP responses for the trained voices showed effects on the same components (P2 and LPC) across the three training conditions, the range of these responses varied. The analysis of these components first revealed a face overshadowing effect (FOE) resulting in an impaired encoding of voice information. This well documented effect resulted in a smaller LPC for the audiovisual condition compared to the audio only condition. However, effects of the audiovisual interactive condition appeared to minimize this FOE when compared to the passive audiovisual condition. Overall, the data presented in both experiments is generally congruent and indicate that the P2 and the LPC are reliable electrophysiological markers of speaker recognition and identification. The implications of these findings for current voice processing models and for the field of forensic phonetics are discussed.
|
|
Keyword:
acoustique de la voix; apprentissage de la voix; Event-realted potentials (ERP); Forensic phonetics; identification de la voix; Identification du locuteur; Language - Linguistics / Langues - Linguistique (UMI : 0290); LPC; Multimodal; Multimodal perception; N250; P2; perception multimodale; phonétique légale; potentiels évoqués (PÉ); reconnaissance du locuteur; Speaker identification; Speaker recognition; Speech acoustics; Voice acoustics; Voice identification; Voice learning
|
|
URL: http://hdl.handle.net/1866/25929
|
|
BASE
|
|
Hide details
|
|
4 |
Liens entre les habiletés rythmiques et les compétences de décodage en lecture : associer les périodicités oculaires au chunking perceptif en parole lue
|
|
|
|
BASE
|
|
Show details
|
|
5 |
The Structural Effects of Modality on the Rise of Symbolic Language: A Rebuttal of Evolutionary Accounts and a Laboratory Demonstration
|
|
|
|
BASE
|
|
Show details
|
|
6 |
L’effet de la familiarité sur l’identification des locuteurs : pour un perfectionnement de la parade vocale
|
|
|
|
BASE
|
|
Show details
|
|
7 |
Analyse acoustique de la conviction exprimée dans des réponses de sondage : un raffinement des enquêtes téléphoniques
|
|
|
|
BASE
|
|
Show details
|
|
8 |
Le chunking perceptif de la parole : sur la nature du groupement temporel et son effet sur la mémoire immédiate
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Effets des facteurs biologiques hormonaux sur la performance langagière
|
|
|
|
BASE
|
|
Show details
|
|
10 |
Effets de la croissance des capacités respiratoires sur la longueur des énoncés et sur la diversité lexicale
|
|
|
|
BASE
|
|
Show details
|
|
11 |
Les variables du mensonge dans la parole : une analyse discriminante
|
|
|
|
BASE
|
|
Show details
|
|
12 |
Le chunking perceptif de la parole : sur la nature du groupement temporel et son effet sur la mémoire immédiate
|
|
|
|
BASE
|
|
Show details
|
|
13 |
Vers un outil d'évaluation du langage préscolaire et détecteur de préalables pour l'éducation de base au Cameroun en cas de retard de langage
|
|
|
|
BASE
|
|
Show details
|
|
14 |
Effets de la croissance des capacités respiratoires sur la longueur des énoncés et sur la diversité lexicale
|
|
|
|
BASE
|
|
Show details
|
|
16 |
Vers un outil d'évaluation du langage préscolaire et détecteur de préalables pour l'éducation de base au Cameroun en cas de retard de langage
|
|
|
|
BASE
|
|
Show details
|
|
19 |
Effets des facteurs biologiques hormonaux sur la performance langagière
|
|
|
|
BASE
|
|
Show details
|
|
|
|