1 |
Collecting and annotating corpora for three under-resourced languages of France: Methodological issues
|
|
|
|
In: ISSN: 1934-5275 ; EISSN: 1934-5275 ; Language Documentation & Conservation ; https://hal.archives-ouvertes.fr/hal-03273196 ; Language Documentation & Conservation, University of Hawaiʻi Press 2021, 15, pp.316-357 ; http://hdl.handle.net/10125/74645 (2021)
|
|
BASE
|
|
Show details
|
|
2 |
Towards a corpus of learner texts annotated with discourse relations ; Vers un corpus de textes d’élèves annoté en relations de discours
|
|
|
|
In: ISSN: 0023-8368 ; EISSN: 1957-7982 ; Langue française ; https://hal.archives-ouvertes.fr/hal-03484102 ; Langue française, Armand Colin, 2021, Écrire de l’école à l’université : corpus, traitements, analyses outillées, 211 (3), pp.115-129. ⟨10.3917/lf.211.0115⟩ ; https://www.cairn.info/revue-langue-francaise-2021-3-page-115.htm (2021)
|
|
BASE
|
|
Show details
|
|
3 |
Segmenter et annoter les relations de cohérence dans des textes narratifs d'élèves de 9 à 15 ans : quels apports d'une théorie de l'interface sémantique/pragmatique pour les enseignants ?
|
|
|
|
In: Connecter et segmenter à l’écrit. Ponctuation et opérateurs linguistiques : deux défis pour l’enseignement ; https://hal-univ-tlse3.archives-ouvertes.fr/hal-03487064 ; Olivia Lewi; Blandine Longhi. Connecter et segmenter à l’écrit. Ponctuation et opérateurs linguistiques : deux défis pour l’enseignement, Peter Lang, A paraître (2021)
|
|
BASE
|
|
Show details
|
|
4 |
Annotation des relations causales dans un corpus de textes d’élèves d’école et collège
|
|
|
|
In: L’expression de la causalité en langue maternelle et en langue étrangère / Expressing Causality in L1 and L2 ; Colloque international sur l’expression de la causalité en langue maternelle et en langue étrangère (CAUSALITE 2021) ; https://hal.archives-ouvertes.fr/hal-03484137 ; Colloque international sur l’expression de la causalité en langue maternelle et en langue étrangère (CAUSALITE 2021), Urszula Paprocka-Piotrowska; Claire Martinot; Tomislava Bošnjak Botica; Sonia Gerolimich, May 2021, Lublin (virtual), Pologne ; http://cause.lublin2021.com/ (2021)
|
|
BASE
|
|
Show details
|
|
5 |
Collecting and annotating corpora for three under-resourced languages of France: Methodological issues
|
|
Bernhard, Delphine; Ligozat, Anne-Laure; Bras, Myriam; Martin, Fanny; Vergez-Couret, Marianne; Erhart, Pascale; Sibille, Jean; Todirascu, Amalia; Boula de Mareüil, Philippe; Huck, Dominique. - : University of Hawaii Press, 2021
|
|
Abstract:
In contrast to French, the vast majority of regional languages of France can be considered as under-resourced. In this article, we present the results of a research project aiming to produce annotated resources for three regional languages of France: Alsatian, Occitan, and Picard. These languages cover three different language families (Germanic and two subfamilies of Romance, Oïl and Oc languages) and different sociolinguistic situations. Yet, they all face issues common to many under-resourced languages: lack of human and financial resources and presence of geolinguistic variation. The originality of this project is that it brought together researchers from different fields (sociolinguistics, descriptive linguistics, dialectology, natural language processing, digital humanities) to work together towards the common goal of developing annotated corpora for Alsatian, Occitan, and Picard. This created a favorable and stimulating working environment which could not have been achieved had different research groups worked independently, each on a single language. This article details the annotation process, with a special focus on the delimitation of the tokens and the definition of the part-of-speech tags. ; National Foreign Language Resource Center ; bernhard_et_al.pdf
|
|
Keyword:
Alsatian; annotations; corpus; Occitan; part-of-speech; Picard; tokenization
|
|
URL: http://hdl.handle.net/10125/74645
|
|
BASE
|
|
Hide details
|
|
6 |
Collecting and annotating corpora for three under-resourced languages of France: Methodological issues
|
|
|
|
BASE
|
|
Show details
|
|
7 |
Loflòc : Lexic Obert flechit occitan
|
|
|
|
In: Fidelitats e dissidéncias. Actes del XIIn Congrès de l’Associacion internacionala d’estudis occitans. Actes du XIIe Congrès de l’Association internationales d’études occitanes. Albi 10-15/07/2017 ; https://hal.archives-ouvertes.fr/hal-03082686 ; Jean-François Courouau et David Fabié. Fidelitats e dissidéncias. Actes del XIIn Congrès de l’Associacion internacionala d’estudis occitans. Actes du XIIe Congrès de l’Association internationales d’études occitanes. Albi 10-15/07/2017, Section française de l'Association internationale d'Etudes Occitanes, pp.141-156, 2020, 978-2-907673-16-7 ; http://www.aieo.org/ (2020)
|
|
BASE
|
|
Show details
|
|
8 |
Building a Universal Dependencies Treebank for Occitan
|
|
|
|
In: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020) ; 12th Language Resources and Evaluation Conference ; https://hal.archives-ouvertes.fr/hal-02892715 ; 12th Language Resources and Evaluation Conference, May 2020, Marseille, France. pp.2932-2939 (2020)
|
|
BASE
|
|
Show details
|
|
9 |
L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard
|
|
|
|
In: ISSN: 2105-0368 ; Les Cahiers du GEPE ; Colloque « Langues minoritaires » : quels acteurs pour quel avenir ? ; https://hal.archives-ouvertes.fr/hal-02378172 ; Les Cahiers du GEPE, Université de Strasbourg, 2020, Langues minoritaires : Quels acteurs pour quel avenir ? ; http://cahiersdugepe.fr/index.php?id=3662 (2020)
|
|
BASE
|
|
Show details
|
|
10 |
Lo Futur perifrastic de tipe ANAR + Infinitiu, en occitan : apròchi contrastiu ; Le futur périphrastique de type "aller" + infinitif en occitan, approche contrastive
|
|
|
|
In: Fidelitats e dissidéncias. Actes del XIIn Congrès de l’Associacion internacionala d’estudis occitans. Actes du XIIe Congrès de l’Association internationales d’études occitanes. Albi 10-15/07/2017. ; https://hal.archives-ouvertes.fr/hal-03082567 ; Jean-François Courouau et David Fabié. Fidelitats e dissidéncias. Actes del XIIn Congrès de l’Associacion internacionala d’estudis occitans. Actes du XIIe Congrès de l’Association internationales d’études occitanes. Albi 10-15/07/2017., Section française de l'Association internationale d'Etudes Occitanes, pp.157-168, 2020 ; http://www.aieo.org/ (2020)
|
|
BASE
|
|
Show details
|
|
13 |
Building a treebank for Occitan: what use for Romance UD corpora?
|
|
|
|
In: Syntax Fest ; https://hal.archives-ouvertes.fr/hal-02380554 ; Syntax Fest, Aug 2019, Paris, France (2019)
|
|
BASE
|
|
Show details
|
|
14 |
Language Technologies for Regional Languages of France: The RESTAURE Project
|
|
|
|
In: International Conference Language Technologies for All (LT4All): Enabling Linguistic Diversity and Multilingualism Worldwide ; https://hal.archives-ouvertes.fr/hal-02418928 ; International Conference Language Technologies for All (LT4All): Enabling Linguistic Diversity and Multilingualism Worldwide, Dec 2019, Paris, France. pp.272‑275 ; https://lt4all.elra.info/proceedings/lt4all2019/ (2019)
|
|
BASE
|
|
Show details
|
|
15 |
Ressources et outils de traitement automatique pour la langue occitane
|
|
|
|
In: Rekonstruktion und Erneuerung romanischer Regional- oder Minderheitensprachen im Zeitalter der Digital Humanities, XXXVI. Romanistentag ; https://hal.archives-ouvertes.fr/hal-02893128 ; Rekonstruktion und Erneuerung romanischer Regional- oder Minderheitensprachen im Zeitalter der Digital Humanities, XXXVI. Romanistentag, Oct 2019, Kassel, Allemagne (2019)
|
|
BASE
|
|
Show details
|
|
16 |
Natural Language Processing for Occitan : a few steps forward ; Tractament automatic de l'occitan : qualques piadas en abans
|
|
|
|
In: Obrador de Linguistica Occitana ; https://hal.archives-ouvertes.fr/hal-01971538 ; Obrador de Linguistica Occitana, Jul 2018, Pau, France ; http://linguistica-oc.com/?p=590 (2018)
|
|
BASE
|
|
Show details
|
|
17 |
Exploring a corpus annotated in causal discourse relations for the study of causal lexical clues
|
|
|
|
In: TextLink 2018 ; https://hal.archives-ouvertes.fr/hal-02050735 ; TextLink 2018, Mar 2018, Toulouse, France (2018)
|
|
BASE
|
|
Show details
|
|
18 |
Etude du syntagme « au départ » en discours : sur le chemin d’une évolution ?
|
|
|
|
In: 11ème édition du colloque "Les études françaises aujourd’hui" ; https://hal.archives-ouvertes.fr/hal-02050713 ; 11ème édition du colloque "Les études françaises aujourd’hui", Nov 2018, Belgrade, Serbie (2018)
|
|
BASE
|
|
Show details
|
|
19 |
Approche de la cohérence dans les textes d’élèves par les relations de discours : premières analyses du corpus RESOLCO
|
|
|
|
In: Journées d’Etude Méthodes d’analyse et de traitement des textes d’élèves : enjeux scientifiques et ressources pour la formation ; https://hal.archives-ouvertes.fr/hal-02050731 ; Journées d’Etude Méthodes d’analyse et de traitement des textes d’élèves : enjeux scientifiques et ressources pour la formation, Nov 2018, Toulouse, France (2018)
|
|
BASE
|
|
Show details
|
|
20 |
Langue de l’immersion et autres langues : quels liens ? Quels enjeux ?
|
|
|
|
In: Colloque de l’Institut Supérieur des Langues de la République Française ; https://hal.archives-ouvertes.fr/hal-02050722 ; Colloque de l’Institut Supérieur des Langues de la République Française, Mar 2018, Quimper, France (2018)
|
|
BASE
|
|
Show details
|
|
|
|