2 |
Joint learning of morphology and syntax with cross-level contextual information flow
|
|
|
|
In: 2022 ; 1 ; 33 (2022)
|
|
BASE
|
|
Show details
|
|
3 |
Developing Core Technologies for Resource-Scarce Nguni Languages
|
|
|
|
In: Information; Volume 12; Issue 12; Pages: 520 (2021)
|
|
BASE
|
|
Show details
|
|
4 |
Incorporating word embeddings in unsupervised morphological segmentation
|
|
|
|
In: 2020 ; 1 ; 21 (2020)
|
|
BASE
|
|
Show details
|
|
5 |
Extending adaptor grammars to learn phonological alternations
|
|
|
|
In: Proceedings of the Society for Computation in Linguistics (2020)
|
|
BASE
|
|
Show details
|
|
6 |
Script Independent Morphological Segmentation for Arabic Maghrebi Dialects: An Application to Machine Translation
|
|
|
|
In: ISSN: 1405-5546 ; EISSN: 2007-9737 ; Computación y sistemas ; https://hal.archives-ouvertes.fr/hal-02274533 ; Computación y sistemas, Instituto Politécnico Nacional IPN Centro de Investigación en Computación, In press, 23 (3), pp.979-989. ⟨10.13053/cys-23-3-3267⟩ (2019)
|
|
BASE
|
|
Show details
|
|
7 |
LSTM Ağları ile Türkçe Kök Bulma ; Stemming Turkish Words with LSTM Networks
|
|
|
|
In: 12 ; 3 ; 183 ; 193 (2019)
|
|
BASE
|
|
Show details
|
|
8 |
When is a corner like corn? Morpho-orthographic segmenting skills in children who struggle with reading
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Data-Driven Identification of German Phrasal Compounds
|
|
|
|
In: Text, Speech, and Dialogue ; https://hal.archives-ouvertes.fr/hal-01575651 ; Kamil Ekštein; Václav Matoušek. Text, Speech, and Dialogue, 10415, Springer International Publishing, pp.192-200, 2017, Lecture Notes in Computer Science, 978-3-319-64205-5. ⟨10.1007/978-3-319-64206-2_22⟩ ; https://link.springer.com/bookseries/558 (2017)
|
|
BASE
|
|
Show details
|
|
10 |
Modeling morpheme triplets with a three-level hierarchical Dirichlet process
|
|
|
|
In: 366 ; 369 (2017)
|
|
BASE
|
|
Show details
|
|
11 |
Automatic processing of Tunisian dialect: construction of linguistic resources ; TRAITEMENT AUTOMATIQUE DU DIALECTE TUNISIEN : CONSTRUCTION DE RESSOURCES LINGUISTIQUES
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-02869866 ; Informatique et langage [cs.CL]. Université de Sfax (Tunisie), 2016. Français (2016)
|
|
Abstract:
This thesis deals with the linguistic resources creation of spoken Tunisian Arabic. First, we described a method for creating the STAC corpus (Spoken Tunisian Arabic Corpus). Our method started with the definition of two orthographic transcription conventions for writing dialectal words and annotating spontaneous oral phenomena. Then, we proposed a method for creating a Tunisian Arabic lexicon based on the STAC corpus and a modern standard Arabic lexicon. This lexicon was exploited to morphological analyze the Tunisian Arabic. To solve the ambiguity caused by the morphological analysis, we proposed a statistical method that is able to choose one correct analysis for a word in a given sentence. We proposed a hybrid method based on a set of contextual rules and a statistical method in order to detect sentence boundaries. The obtained results show that the different methods proposed for resource development for the Tunisian dialect are promising and can be exploited to provide methods for the automatic detection and correction of disfluencies. ; Cette thèse s'intègre dans le cadre du traitement automatique de la langue parlée et s'intéresse à la création des ressources linguistiques pour le dialecte tunisien. D'abord, nous avons décrit une méthode pour la création du corpus STAC (Spoken Tunisian Arabic Corpus). Cette méthode commence par l'élaboration de deux conventions de transcription orthographique pour écrire les mots dialectaux et annoter les phénomènes dus au caractère spontané des productions orales. Ensuite, nous avons utilisé le corpus STAC et un lexique « racine-patron » de l'arabe standard afin de créer un lexique pour le dialecte tunisien. Ce dernier a été exploité pour analyser morphologiquement le dialecte tunisien.Pour résoudre le problème d'ambiguïté causé par l'analyse morphologique, nous avons proposé une méthode statistique permettant de choisir une seule analyse correcte pour un mot dans une phrase. Enfin, nous avons proposé une méthode hybride qui se fonde sur un ensemble de règles contextuelles et une méthode statistique afin de détecter les frontières des phrases en dialecte tunisien. Les résultats d'évaluation montrent que les différentes méthodes proposées pour le développement des ressources pour le dialecte tunisien sont prometteuses et elles peuvent être exploitées pour proposer des méthodes permettant la détection et la correction automatique des disfluences.
|
|
Keyword:
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; analyse morphologique; corpus STAC; création de lexique; désambiguïsation morphosytaxique; dialecte tunisien; lexicon creation; morphological analysis; morphosytactic disambiguation; orthographic transcription; segmentation des transcriptions en des phrases; sentence boundary detection; STAC corpus; transcription orthographique; Tunisian Arabic
|
|
URL: https://hal.archives-ouvertes.fr/tel-02869866/document https://hal.archives-ouvertes.fr/tel-02869866 https://hal.archives-ouvertes.fr/tel-02869866/file/Rapport_These_Ines_Zribi.pdf
|
|
BASE
|
|
Hide details
|
|
12 |
НАЦИОНАЛЬНЫЙ КОРПУС КАЛМЫЦКОГО ЯЗЫКА: ИТОГИ РАБОТЫ И ПЕРСПЕКТИВЫ
|
|
|
|
BASE
|
|
Show details
|
|
14 |
Processing of Compound Terms: Segmentation, Translation and Variation ; Traitement automatique des termes composés : segmentation, traduction et variation
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-01116104 ; Traitement du texte et du document. Université de Nantes, 2014. Français (2014)
|
|
BASE
|
|
Show details
|
|
15 |
Methods and algorithms for unsupervised learning of morphology
|
|
|
|
In: 8403 ; 177 ; 205 (2014)
|
|
BASE
|
|
Show details
|
|
16 |
Traduction statistique vers une langue à morphologie riche : combinaison d’algorithmes de segmentation morphologique et de modèles statistiques de traduction automatique
|
|
|
|
BASE
|
|
Show details
|
|
17 |
Traduction statistique vers une langue à morphologie riche : combinaison d’algorithmes de segmentation morphologique et de modèles statistiques de traduction automatique
|
|
|
|
BASE
|
|
Show details
|
|
18 |
Inter-speaker speech variability assessment using statistical deformable models from 3.0 Tesla magnetic resonance images
|
|
|
|
BASE
|
|
Show details
|
|
19 |
'Fell' primes 'fall', but does 'bell' prime 'ball'? Masked priming with irregularly-inflected primes
|
|
|
|
In: Journal of Memory and Language, 63 (1) (2010)
|
|
BASE
|
|
Show details
|
|
20 |
Is morphological decomposition limited to low-frequency words?
|
|
|
|
In: Quarterly Journal of Experimental Psychology, 62 (9) (2009)
|
|
BASE
|
|
Show details
|
|
|
|