DE eng

Search in the Catalogues and Directories

Hits 1 – 3 of 3

1
Linguistic Analysis and Automatic Information Extraction of Semantic Relations in Arabic ; Analyse linguistique et extraction automatique de relations sémantiques des textes en arabe
MORSI, Youcef Ihab. - : HAL CCSD, 2020
In: https://hal.archives-ouvertes.fr/tel-03572307 ; Linguistique. Université Bourgogne Franche-Comté, 2020. Français (2020)
Abstract: This thesis focuses on the development of a tool for the automatic processing of Modern Standard Arabic, at the morphological and semanticlevels, with the final objective of Information Extraction on technological innovations. As far as the morphological analysis is concerned, our tool includes several successive processing stages that allow to label and disambiguate occurrences in texts : a morphological layer (Gibran 1.0), which relies on Arabic pattern as distinctive features ; a contextual layer (Gibran 2.0), which uses contextual rules ; and a third layer (Gibran 3.0), which uses a machine learning model. Our methodology is evaluated using the annotated corpus Arabic-PADT UD treebank. The evaluations obtain an F-measure of 0.92 and 0.90 for the morphological analyses. These experiments demontrate the possibility of improving such a corpus through linguistic analyses. This approach allowed us to develop a prototype of information extraction on technological innovations for the Arabic language. It is based on the morphological analysis and syntaxico-semantic patterns. This thesis is part of a doctoral-entrepreneurial course. ; Cette recherche porte sur le développement d’un outil de traitement automatique de la langue arabe standard moderne, au niveau morphologique et sémantique, avec comme objectif final l’extraction d’information dans le domaine de l’innovation technologique en entreprise. En ce qui concerne l’analyse morphologique, notre outil comprend plusieurs traitements successifs qui permettent d’étiqueter et de désambiguïser les occurrences dans les textes : une couche morphologique (Gibran 1.0), qui s’appuie sur les schèmes arabes commetraits distinctifs ; une couche contextuelle (Gibran 2.0), qui fait appel à des règles contextuelles ; et une troisième couche (Gibran 3.0) qui fait appel à un modèle d’apprentissage automatique. Notre méthodologie est évaluée sur le corpus annoté Arabic-PADT UD treebank. Les évaluations obtiennent une F-mesure de 0,92 et 0,90 pour les analyses morphologiques. Ces expérimentations montrent, entre autres, la possibilité d’améliorer une telle ressource par les analyses linguistiques. Cette approche nous a permis de développer un prototype d’extrac-tion d’information autour de l’innovation technologique pour la langue arabe. Il s’appuie sur l’analyse morphologique et des patrons syntaxico-sémantiques. Cette thèse s’inscrit dans un parcours docteur-entrepreneur.
Keyword: [INFO]Computer Science [cs]; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Analyse linguistique; arabe standard moderne; Arabic language; Arabic-PADT UD treebank; en- treprise; étiquetage morphologique; extraction d’information; Information extraction; langue arabe; Linguistic analysis; Modern Standard Arabic; morphologie; morphology; pattern; POS tagging; schème; start-up
URL: https://hal.archives-ouvertes.fr/tel-03572307
BASE
Hide details
2
Analyse morphosyntaxique de l'arabe par une approche linguisitique
In: TOTh Conferences – Terminology & Ontology: Theories and applications ; https://hal.archives-ouvertes.fr/hal-03506082 ; TOTh Conferences – Terminology & Ontology: Theories and applications, Jun 2019, Chambéry, France (2019)
BASE
Show details
3
Étude lexicale de textes arabes pour l’évaluation automatique de la complexité textuelle
In: 7 ème Colloque International en Traductologie et TAL TRADETAL 2016 ; https://hal.archives-ouvertes.fr/hal-01956613 ; 7 ème Colloque International en Traductologie et TAL TRADETAL 2016, May 2016, Oran, Algérie (2016)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
3
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern