Home Catalogue search

eng

Refine your search:

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2

Hits 1 – 20 of 38

1	OOV Proper Name Retrieval using Topic and Lexical Context Model
	Sheikh, Imran; Illina, Irina; Fohr, Dominique...
	In: IEEE International Conference on Acoustics, Speech and Signal Processing ; https://hal.archives-ouvertes.fr/hal-01184963 ; IEEE International Conference on Acoustics, Speech and Signal Processing, 2015, Brisbane, Australia (2015)
	BASE
	Show details

2	Continuous Word Representation using Neural Networks for Proper Name Retrieval from Diachronic Documents
	Fohr, Dominique; Illina, Irina
	In: Interspeech 2015 ; https://hal.archives-ouvertes.fr/hal-01184951 ; Interspeech 2015, Sep 2015, Dresden, Germany (2015)
	BASE
	Show details

3	Study of Entity-Topic Models for OOV Proper Name Retrieval
	Sheikh, Imran; Illina, Irina; Fohr, Dominique
	In: Interspeech 2015 ; https://hal.archives-ouvertes.fr/hal-01184955 ; Interspeech 2015, Sep 2015, Dresden, Germany (2015)
	BASE
	Show details

4	Proper Name Retrieval from Diachronic Documents for Automatic Speech Transcription using Lexical and Temporal Context
	Illina, Irina; Fohr, Dominique; Linarès, Georges
	In: Workshop on Speech, Language and Audio in Multimedia ; https://hal.inria.fr/hal-01092224 ; Workshop on Speech, Language and Audio in Multimedia, Sep 2014, Penang, Malaysia (2014)
	BASE
	Show details

5	Ajout de nouveaux noms propres au vocabulaire d’un système de transcription en utilisant un corpus diachronique
	Illina, Irina; Fohr, Dominique; Linarès, Georges
	In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://hal.archives-ouvertes.fr/hal-01184950 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2014, 55 (2), pp.47-72 (2014)
	BASE
	Show details

6	3D Visual Speech Animation from Image Sequences
	Musti, Utpala; Ouni, Slim; Ziheng, Zhou
	In: Indian Conference on Computer Vision, Graphics and Image Processing (ICVGIP) ; https://hal.archives-ouvertes.fr/hal-01086073 ; Indian Conference on Computer Vision, Graphics and Image Processing (ICVGIP), Dec 2014, Bangalore, India (2014)
	BASE
	Show details

7	CoALT: A Software for Comparing Automatic Labelling Tools
	Fohr, Dominique; Mella, Odile
	In: proceedings of Language Resources and Evaluation LREC ; Language Resources and Evaluation LREC 2012 ; https://hal.archives-ouvertes.fr/hal-00761781 ; Language Resources and Evaluation LREC 2012, May 2012, Istanbul, Turkey. pp.325-328 (2012)
	BASE
	Show details

8	Multilingual Recognition of Non-Native Speech using Acoustic Model Transformation and Pronunciation Modeling
	Bouselmi, Ghazi; Fohr, Dominique; Illina, Irina
	In: ISSN: 1381-2416 ; EISSN: 1572-8110 ; International Journal of Speech Technology ; https://hal.archives-ouvertes.fr/hal-00764626 ; International Journal of Speech Technology, Springer Verlag, 2012, 15 (2), pp.203 - 213 (2012)
	BASE
	Show details

9	Impact of Pronunciation Variant Frequency on Automatic Non-Native Speech Segmentation
	Jouvet, Denis; Mesbahi, Larbi; Bonneau, Anne...
	In: Language & Technology Conference - LTC'11 ; 5th Language & Technology Conference - LTC'11 ; https://hal.archives-ouvertes.fr/hal-00639118 ; 5th Language & Technology Conference - LTC'11, Nov 2011, Poznan, Poland. pp.145-148 (2011)
	BASE
	Show details

10	Weight Optimization for Bimodal Unit-Selection Talking Head Synthesis
	Toutios, Asterios; Musti, Utpala; Ouni, Slim...
	In: 12thAnnual Conference of the International Speech Communication Association - Interspeech 2011 ; https://hal.inria.fr/inria-00602407 ; 12thAnnual Conference of the International Speech Communication Association - Interspeech 2011, Aug 2011, Florence, Italy (2011)
	BASE
	Show details

11	Quelques contributions en reconnaissance automatique de la parole robuste
	Cerisara, Christophe. - : HAL CCSD, 2010
	In: https://tel.archives-ouvertes.fr/tel-00579816 ; Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2010 (2010)
	Abstract: La reconnaissance automatique de la parole est un domaine de recherche très actif depuis de nombreuses années. Bien que les performances des systèmes de transcription automatique aient considérablement progressé depuis tout ce temps, les erreurs commises par ces systèmes ne sont toujours pas acceptables du point de vue des utilisateurs, probablement du fait du référentiel humain qui reste largement inégalé, en particulier en ce qui concerne la robustesse des transcriptions aux conditions d'utilisation dégradées. J'étudie dans ce mémoire l'état de l'art du domaine pour la période allant de 1995 à 2010, en me concentrant sur les aspects liés à la robustesse des modèles acoustiques avec un seul microphone. J'y décris également mes principales contributions, en les classant selon les différents étages composant un système de reconnaissance automatique: paramétrisation, modèle acoustique et algorithme de décodage. Dans le domaine de la paramétrisation, mes deux contributions principales concernent une étude du domaine de l'analyse computationnelle de scènes auditives, ainsi qu'une nouvelle approche de débruitage de la parole s'appuyant sur une modélisation bayésienne des espaces bruités et non-bruités et de leur inter-dépendances. Mes travaux sur les modèles acoustiques ont débuté pendant ma thèse de doctorat, qui concernait l'étude des modèles multi-bandes, dans lesquels le spectre du signal de parole est décomposé en bandes de fréquences indépendantes. Dans ce cadre, j'ai notamment proposé un algorithme d'apprentissage discriminant global et la conception de nouvelles unités phonétiques adaptées à l'information phonétique présente dans les bandes. Une autre contribution importante est l'amélioration de l'adaptation jacobienne, qui est une approximation linéaire de la méthode PMC (Parallel Model Combination) dans le domaine cepstral. J'ai notamment proposé une approche permettant de choisir le compromis précision / complexité souhaité, et étendu l'approche au bruit convolutif. Une partie conséquente de mes travaux a ensuite concerné la reconnaissance avec données manquantes, qui, par ses aspects de marginalisation, peut être interprétée comme une modification de l'algorithme de reconnaissance. Cette modification exploite une nouvelle source d'information concernant la localisation spectro-temporelle du bruit afin de concentrer le décodage sur les observations acoustiques les moins corrompues. J'ai ainsi travaillé sur l'adaptation de cette approche au domaine cepstral, notamment en proposant un nouveau formalisme de calcul des masques minimisant directement le taux d'erreur de reconnaissance. Une autre contribution concerne le développement de modèles bayésiens originaux qui discrétisent l'espace de recherche pour estimer les masques, ou encore d'une nouvelle méthode minimisant la largeur de l'intervalle de marginalisation. Cette première partie du mémoire est guidée par une analyse des progrès réalisés en fonction d'un critère, celui de l'information prise en compte par les différentes méthodes proposées. Ce critère est en effet très important, car il a une grande influence sur les évaluations expérimentales et sur les capacités de généralisation des approches. De plus, alors que d'innombrables modèles théoriques d'apprentissage ont été proposés et testés depuis vingt ans, toutes ces approches exploitent quasiment exclusivement l'information acoustique et lexicale. Je soupçonne les limites des paradigmes actuels d'être en bien plus grande partie dus au déficit d'information et de connaissance qu'aux capacités des modèles eux-mêmes. J'ai donc commencé à m'intéresser depuis 2004 aux autres sources d'information qui pourraient servir en reconnaissance de la parole, notamment au contexte et plus particulièrement aux connaissances syntaxiques et sémantiques. Ce mémoire développe ces aspects essentiellement dans une deuxième partie consacrée à la reconnaissance des actes de dialogue, à la segmentation en phrases, à la sémantique lexicale par le biais de la détection automatique du thème, et enfin à l'analyse syntaxique des transcriptions automatiques de l'oral. Mon ambition est tout d'abord d'étudier et d'adapter les approches en linguistique computationnelle permettant d'extraire ces indices du flux de parole afin de prendre en compte les spécificités des transcriptions automatiques, puis d'exploiter en retour ces nouvelles informations afin d'améliorer le système de transcription automatique.
	Keyword: [INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC]; données manquantes; reconnaissance automatique de la parole; robustesse au bruit
	URL: https://tel.archives-ouvertes.fr/tel-00579816 https://tel.archives-ouvertes.fr/tel-00579816/file/habil.pdf https://tel.archives-ouvertes.fr/tel-00579816/document
	BASE
	Hide details

12	Metadata for Wicri, a network of semantic Wikis for communities in research and innovation
	Ducloy, Jacques; Daunois, Thierry; Foulonneau, Muriel...
	In: International Conference on Dublin Core and Metadata Applications - DC-2010 ; https://hal.inria.fr/inria-00535962 ; International Conference on Dublin Core and Metadata Applications - DC-2010, Oct 2010, Pittsburgh, United States (2010)
	BASE
	Show details

13	Detection of OOV words by combining acoustic confidence measures with linguistic features
	Stouten, Frederik; Fohr, Dominique; Illina, Irina
	In: proceedings of Automatic Speech Recognition and Understanding ; The eleventh biannual IEEE workshop on Automatic Speech Recognition and Understanding (ASRU) ; https://hal.archives-ouvertes.fr/hal-00435087 ; The eleventh biannual IEEE workshop on Automatic Speech Recognition and Understanding (ASRU), Dec 2009, Merano, Italy. pp.1-4 (2009)
	BASE
	Show details

14	Acquisition et modélisation de données articulatoires dans un contexte multimodal ; Acquiring and modelling multimodal articulatory data
	Aron, Michael. - : HAL CCSD, 2009
	In: https://tel.archives-ouvertes.fr/tel-00432124 ; Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2009. Français (2009)
	BASE
	Show details

15	Intelligent patents analysis using a multiview neural-based approach
	Lamirel, Jean-Charles; Al Shehabi, Shadi
	In: Conference on Recent Trends in Patinformatics ; https://hal.inria.fr/inria-00535934 ; Conference on Recent Trends in Patinformatics, Dec 2009, Puna, India (2009)
	BASE
	Show details

16	Acoustic-to-articulatory inversion with constraints ; Inversion acoustique-articulatoire avec contraintes
	Potard, Blaise. - : HAL CCSD, 2008
	In: https://tel.archives-ouvertes.fr/tel-01748423 ; Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy 1, 2008. Français. ⟨NNT : 2008NAN10085⟩ (2008)
	BASE
	Show details

17	Text-Independent Foreign Accent Classification Using Statistical Methods
	Fohr, Dominique; Illina, Irina
	In: proceedings of IEEE International Conference on Signal Processing and Communications ; International Conference on Signal Processing and Communications ; https://hal.archives-ouvertes.fr/hal-00163745 ; International Conference on Signal Processing and Communications, Nov 2007, Dubai, United Arab Emirates. pp.4 (2007)
	BASE
	Show details

18	Coordination in Interaction Grammars ; La coordination dans les grammaires d'interaction
	Le Roux, Joseph. - : HAL CCSD, 2007
	In: https://tel.archives-ouvertes.fr/tel-01752899 ; Génie logiciel [cs.SE]. Institut National Polytechnique de Lorraine - INPL, 2007. Français. ⟨NNT : 2007INPL063N⟩ (2007)
	BASE
	Show details

19	Tools devoted to the acquisition of the prosody of a foreign language
	Henry, Guillaume; Bonneau, Anne; Colotte, Vincent
	In: International Congress of Phonetic Sciences - ICPhS 2007 ; https://hal.inria.fr/inria-00184530 ; International Congress of Phonetic Sciences - ICPhS 2007, Aug 2007, Saarbrücken, Germany. pp.1593-1596 (2007)
	BASE
	Show details

20	A phonetic concatenative approach of labial coarticulation
	Robert, Vincent; Laprie, Yves; Bonneau, Anne
	In: INTERSPEECH 2007 ; https://hal.inria.fr/inria-00184252 ; INTERSPEECH 2007, ISCA, Aug 2007, Antwerp, Belgium. pp.1402-1405 (2007)
	BASE
	Show details

Page: 1 2

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern