DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...11
Hits 1 – 20 of 220

1
Multitask Pointer Network for Multi-Representational Parsing
BASE
Show details
2
Joint learning of morphology and syntax with cross-level contextual information flow
In: 2022 ; 1 ; 33 (2022)
BASE
Show details
3
Analyse en dépendances du français avec des plongements contextualisés
In: 28e Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-03223424 ; 28e Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2021, Lille (virtuel), France (2021)
BASE
Show details
4
To be or not to be adultlike in syntax: An experimental study of language acquisition and processing in children ...
Lassotta, Romy. - : Université de Genève, 2021
BASE
Show details
5
IWPT 2021 Shared Task Data and System Outputs
Zeman, Daniel; Bouma, Gosse; Seddah, Djamé. - : Universal Dependencies Consortium, 2021
BASE
Show details
6
Training corpus ssj500k 2.3
Krek, Simon; Dobrovoljc, Kaja; Erjavec, Tomaž. - : Centre for Language Resources and Technologies, University of Ljubljana, 2021
BASE
Show details
7
PLPrepare: A Grammar Checker for Challenging Cases
In: Electronic Theses and Dissertations (2021)
BASE
Show details
8
To be or not to be adultlike in syntax: An experimental study of language acquisition and processing in children
Lassotta, Romy. - : Université de Genève, 2021
BASE
Show details
9
Resourceful at Any Size: A Predictive Methodology Using Linguistic Corpus Metrics for Multi-Source Training in Neural Dependency Parsing
Gokcen, Ajda. - 2021
BASE
Show details
10
Treebank embedding vectors for out-of-domain dependency parsing
In: Wagner, Joachim orcid:0000-0002-8290-3849 , Barry, James orcid:0000-0003-3051-585X and Foster, Jennifer orcid:0000-0002-7789-4853 (2020) Treebank embedding vectors for out-of-domain dependency parsing. In: 58th Annual Meeting of the Association for Computational Linguistics (ACL 2020), 05-10 Jul 2020, Online (virtual conference). (2020)
BASE
Show details
11
Bootstrap methods for multi-task dependency parsing in low-resource conditions ; Méthodes d’amorçage pour l’analyse en dépendances de langues peu dotées
Lim, Kyungtae. - : HAL CCSD, 2020
In: https://tel.archives-ouvertes.fr/tel-03477961 ; Linguistics. Université Paris sciences et lettres, 2020. English. ⟨NNT : 2020UPSLE027⟩ (2020)
Abstract: Dependency parsing is an essential component of several NLP applications owing its ability to capture complex relational information in a sentence. Due to the wider availability of dependency treebanks, most dependency parsing systems are built using supervised learning techniques. These systems require a significant amount of annotated data and are thus targeted toward specific languages for which this type of data are available. Unfortunately, producing sufficient annotated data for low-resource languages is time- and resource-consuming. To address the aforementioned issue, the present study investigates three bootstrapping methods, namely, (1) multi-lingual transfer learning, (2) deep contextualized embedding, and (3) Co-training. Multi-lingual transfer learning is a typical supervised learning approach that can transfer dependency knowledge using multi-lingual training data based on multi-lingual lexical representations. Deep contextualized embedding maximizes the use of lexical features during supervised learning based on enhanced sub-word representations and language model (LM). Lastly, co-training is a semi-supervised learning method that leverages parsing accuracies using unlabeled data. Our approaches have the advantage of requiring only a small bilingual dictionary or easily obtainable unlabeled resources (e.g., Wikipedia) to improve parsing accuracy in low-resource conditions. We evaluated our parser on 57 official CoNLL shared task languages as well as on Komi, which is a language we developed as a training and evaluation corpora for low-resource scenarios. The evaluation results demonstrated outstanding performances of our approaches in both low- and high-resource dependency parsing in the 2017 and 2018 CoNLL shared tasks. A survey of both model transfer learning and semi-supervised methods for low-resource dependency parsing was conducted, where the effect of each method under different conditions was extensively investigated. ; L'analyse en dépendances est une composante essentielle de nombreuses applications de TAL (Traitement Automatique des Langues), dans la mesure où il s'agit de fournir une analyse des relations entre les principaux éléments de la phrase. La plupart des systèmes d'analyse en dépendances sont issus de techniques d'apprentissage supervisées, à partir de grands corpus annotés. Ce type d'analyse est dès lors limité à quelques langues seulement, qui disposent des ressources adéquates. Pour les langues peu dotées, la production de données annotées est une tâche impossible le plus souvent, faute de moyens et d'annotateurs disponibles. Afin de résoudre ce problème, la thèse examine trois méthodes d’amorçage, à savoir (1) l’apprentissage par transfert multilingue, (2) les plongements vectoriels contextualisés profonds et (3) le co-entrainement. La première idée, l'apprentissage par transfert multilingue, permet de transférer des connaissances d'une langue pour laquelle on dispose de nombreuses ressources, et donc de traitements efficaces, vers une langue peu dotée. Les plongements vectoriels contextualisés profonds, quant à eux, permettent une représentation optimale du sens des mots en contexte, grâce à la notion de modèle de langage. Enfin, le co-entrainement est une méthode d'apprentissage semi-supervisée, qui permet d'améliorer les performances des systèmes en utilisant les grandes quantités de données non annotées souvent disponibles pour les différentes langues visées. Nos approches ne nécessitent qu'un petit dictionnaire bilingue ou des ressources non étiquetées faciles à obtenir (à partir de Wikipedia par exemple) pour améliorer la précision de l'analyse pour des langues où les ressources disponibles sont insuffisantes. Nous avons évalué notre analyseur syntaxique sur 57 langues à travers la participation aux campagnes d'évaluation proposées dans le cadre de la conférence CoNLL. Nous avons également mené des expériences sur d'autres langues, comme le komi, une langue finno-ougrienne parlée en Russie : le komi offre un scénario réaliste pour tester les idées mises en avant dans la thèse. Notre système a obtenu des résultats très compétitifs lors de campagnes d'évaluation officielles, notamment lors des campagnes CoNLL 2017 et 2018. Cette thèse offre donc des perspectives intéressantes pour le traitement automatique des langues peu dotées, un enjeu majeur pour le TAL dans les années à venir.
Keyword: [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Analyse en dépendances; Dependency Parsing; Multilingual word representation; Représentations lexicales multilingues; Transfer learning; Transfert de connaissances
URL: https://tel.archives-ouvertes.fr/tel-03477961/file/Lim_2020_These.pdf
https://tel.archives-ouvertes.fr/tel-03477961
https://tel.archives-ouvertes.fr/tel-03477961/document
BASE
Hide details
12
Extrinsic Evaluation of French Dependency Parsers on a Specialized Corpus: Comparison of Distributional Thesauri
In: 12th Language Resources and Evaluation Conference ; https://hal.archives-ouvertes.fr/hal-02611042 ; 12th Language Resources and Evaluation Conference, May 2020, Marseille, France. pp.5822-5830 (2020)
BASE
Show details
13
IWPT 2020 Shared Task Data and System Outputs
Zeman, Daniel; Bouma, Gosse; Seddah, Djamé. - : Universal Dependencies Consortium, 2020
BASE
Show details
14
On understanding character-level models for representing morphology ...
Vania, Clara. - : The University of Edinburgh, 2020
BASE
Show details
15
Linguatec Tolosa Treebank ...
BASE
Show details
16
Linguatec Tolosa Treebank ...
BASE
Show details
17
Demographic-Aware Natural Language Processing
BASE
Show details
18
On understanding character-level models for representing morphology
Vania, Clara. - : The University of Edinburgh, 2020
BASE
Show details
19
Self attended stack pointer networks for learning long term dependencies
Can, Burcu; Tuç, Salih. - : Association for Computational Linguistics, 2020
BASE
Show details
20
Annotation syntaxique automatique de la partie orale du ORFÉO
In: Langages, N 219, 3, 2020-08-11, pp.87-102 (2020)
BASE
Show details

Page: 1 2 3 4 5...11

Catalogues
6
0
12
0
0
0
0
Bibliographies
51
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
5
0
0
0
Open access documents
164
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern