Home Catalogue search

eng

Refine your search:
- Keyword
- Creator / Publisher:
- Year
- Medium
- Type
- BLLDB-Access:
  - free (220)
  - subject to license (1)

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2 3 4 5...11

Hits 1 – 20 of 220

1	Multitask Pointer Network for Multi-Representational Parsing
	Fernández-González, Daniel; Gómez-Rodríguez, Carlos. - : Elsevier, 2022
	BASE
	Show details

2	Joint learning of morphology and syntax with cross-level contextual information flow
	Can Buglalilar, Burcu; Aleçakır, Hüseyin; Manandhar, Suresh...
	In: 2022 ; 1 ; 33 (2022)
	BASE
	Show details

3	Analyse en dépendances du français avec des plongements contextualisés
	Grobol, Loïc; Crabbé, Benoît
	In: 28e Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-03223424 ; 28e Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2021, Lille (virtuel), France (2021)
	BASE
	Show details

4	To be or not to be adultlike in syntax: An experimental study of language acquisition and processing in children ...
	Lassotta, Romy. - : Université de Genève, 2021
	BASE
	Show details

5	IWPT 2021 Shared Task Data and System Outputs
	Zeman, Daniel; Bouma, Gosse; Seddah, Djamé. - : Universal Dependencies Consortium, 2021
	BASE
	Show details

6	Training corpus ssj500k 2.3
	Krek, Simon; Dobrovoljc, Kaja; Erjavec, Tomaž. - : Centre for Language Resources and Technologies, University of Ljubljana, 2021
	BASE
	Show details

7	PLPrepare: A Grammar Checker for Challenging Cases
	Hoyos, Jacob
	In: Electronic Theses and Dissertations (2021)
	BASE
	Show details

8	To be or not to be adultlike in syntax: An experimental study of language acquisition and processing in children
	Lassotta, Romy. - : Université de Genève, 2021
	BASE
	Show details

9	Resourceful at Any Size: A Predictive Methodology Using Linguistic Corpus Metrics for Multi-Source Training in Neural Dependency Parsing
	Gokcen, Ajda. - 2021
	BASE
	Show details

10	Treebank embedding vectors for out-of-domain dependency parsing
	Wagner, Joachim; Barry, James; Foster, Jennifer
	In: Wagner, Joachim orcid:0000-0002-8290-3849 , Barry, James orcid:0000-0003-3051-585X and Foster, Jennifer orcid:0000-0002-7789-4853 (2020) Treebank embedding vectors for out-of-domain dependency parsing. In: 58th Annual Meeting of the Association for Computational Linguistics (ACL 2020), 05-10 Jul 2020, Online (virtual conference). (2020)
	BASE
	Show details

11	Bootstrap methods for multi-task dependency parsing in low-resource conditions ; Méthodes d’amorçage pour l’analyse en dépendances de langues peu dotées
	Lim, Kyungtae. - : HAL CCSD, 2020
	In: https://tel.archives-ouvertes.fr/tel-03477961 ; Linguistics. Université Paris sciences et lettres, 2020. English. ⟨NNT : 2020UPSLE027⟩ (2020)
	Abstract: Dependency parsing is an essential component of several NLP applications owing its ability to capture complex relational information in a sentence. Due to the wider availability of dependency treebanks, most dependency parsing systems are built using supervised learning techniques. These systems require a significant amount of annotated data and are thus targeted toward specific languages for which this type of data are available. Unfortunately, producing sufficient annotated data for low-resource languages is time- and resource-consuming. To address the aforementioned issue, the present study investigates three bootstrapping methods, namely, (1) multi-lingual transfer learning, (2) deep contextualized embedding, and (3) Co-training. Multi-lingual transfer learning is a typical supervised learning approach that can transfer dependency knowledge using multi-lingual training data based on multi-lingual lexical representations. Deep contextualized embedding maximizes the use of lexical features during supervised learning based on enhanced sub-word representations and language model (LM). Lastly, co-training is a semi-supervised learning method that leverages parsing accuracies using unlabeled data. Our approaches have the advantage of requiring only a small bilingual dictionary or easily obtainable unlabeled resources (e.g., Wikipedia) to improve parsing accuracy in low-resource conditions. We evaluated our parser on 57 official CoNLL shared task languages as well as on Komi, which is a language we developed as a training and evaluation corpora for low-resource scenarios. The evaluation results demonstrated outstanding performances of our approaches in both low- and high-resource dependency parsing in the 2017 and 2018 CoNLL shared tasks. A survey of both model transfer learning and semi-supervised methods for low-resource dependency parsing was conducted, where the effect of each method under different conditions was extensively investigated. ; L'analyse en dépendances est une composante essentielle de nombreuses applications de TAL (Traitement Automatique des Langues), dans la mesure où il s'agit de fournir une analyse des relations entre les principaux éléments de la phrase. La plupart des systèmes d'analyse en dépendances sont issus de techniques d'apprentissage supervisées, à partir de grands corpus annotés. Ce type d'analyse est dès lors limité à quelques langues seulement, qui disposent des ressources adéquates. Pour les langues peu dotées, la production de données annotées est une tâche impossible le plus souvent, faute de moyens et d'annotateurs disponibles. Afin de résoudre ce problème, la thèse examine trois méthodes d’amorçage, à savoir (1) l’apprentissage par transfert multilingue, (2) les plongements vectoriels contextualisés profonds et (3) le co-entrainement. La première idée, l'apprentissage par transfert multilingue, permet de transférer des connaissances d'une langue pour laquelle on dispose de nombreuses ressources, et donc de traitements efficaces, vers une langue peu dotée. Les plongements vectoriels contextualisés profonds, quant à eux, permettent une représentation optimale du sens des mots en contexte, grâce à la notion de modèle de langage. Enfin, le co-entrainement est une méthode d'apprentissage semi-supervisée, qui permet d'améliorer les performances des systèmes en utilisant les grandes quantités de données non annotées souvent disponibles pour les différentes langues visées. Nos approches ne nécessitent qu'un petit dictionnaire bilingue ou des ressources non étiquetées faciles à obtenir (à partir de Wikipedia par exemple) pour améliorer la précision de l'analyse pour des langues où les ressources disponibles sont insuffisantes. Nous avons évalué notre analyseur syntaxique sur 57 langues à travers la participation aux campagnes d'évaluation proposées dans le cadre de la conférence CoNLL. Nous avons également mené des expériences sur d'autres langues, comme le komi, une langue finno-ougrienne parlée en Russie : le komi offre un scénario réaliste pour tester les idées mises en avant dans la thèse. Notre système a obtenu des résultats très compétitifs lors de campagnes d'évaluation officielles, notamment lors des campagnes CoNLL 2017 et 2018. Cette thèse offre donc des perspectives intéressantes pour le traitement automatique des langues peu dotées, un enjeu majeur pour le TAL dans les années à venir.
	Keyword: [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Analyse en dépendances; Dependency Parsing; Multilingual word representation; Représentations lexicales multilingues; Transfer learning; Transfert de connaissances
	URL: https://tel.archives-ouvertes.fr/tel-03477961/file/Lim_2020_These.pdf https://tel.archives-ouvertes.fr/tel-03477961 https://tel.archives-ouvertes.fr/tel-03477961/document
	BASE
	Hide details

12	Extrinsic Evaluation of French Dependency Parsers on a Specialized Corpus: Comparison of Distributional Thesauri
	Tanguy, Ludovic; Brunet, Pauline; Ferret, Olivier
	In: 12th Language Resources and Evaluation Conference ; https://hal.archives-ouvertes.fr/hal-02611042 ; 12th Language Resources and Evaluation Conference, May 2020, Marseille, France. pp.5822-5830 (2020)
	BASE
	Show details

13	IWPT 2020 Shared Task Data and System Outputs
	Zeman, Daniel; Bouma, Gosse; Seddah, Djamé. - : Universal Dependencies Consortium, 2020
	BASE
	Show details

14	On understanding character-level models for representing morphology ...
	Vania, Clara. - : The University of Edinburgh, 2020
	BASE
	Show details

15	Linguatec Tolosa Treebank ...
	Miletic, Aleksandra; Bras, Myriam; Esher, Louise. - : Zenodo, 2020
	BASE
	Show details

16	Linguatec Tolosa Treebank ...
	Miletic, Aleksandra; Bras, Myriam; Esher, Louise. - : Zenodo, 2020
	BASE
	Show details

17	Demographic-Aware Natural Language Processing
	Garimella, Aparna. - 2020
	BASE
	Show details

18	On understanding character-level models for representing morphology
	Vania, Clara. - : The University of Edinburgh, 2020
	BASE
	Show details

19	Self attended stack pointer networks for learning long term dependencies
	Can, Burcu; Tuç, Salih. - : Association for Computational Linguistics, 2020
	BASE
	Show details

20	Annotation syntaxique automatique de la partie orale du ORFÉO
	Nasr, Alexis; Dary, Franck; Béchet, Frédéric...
	In: Langages, N 219, 3, 2020-08-11, pp.87-102 (2020)
	BASE
	Show details

Page: 1 2 3 4 5...11

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern