1 |
Que fait et peut faire la communauté scientifique ?
|
|
|
|
In: Les technologies pour les langues régionales de France ; https://hal.archives-ouvertes.fr/hal-01280449 ; Les technologies pour les langues régionales de France, Feb 2015, Meudon, France. DGLFLF, pp.139-145, 2016 ; http://webcast.in2p3.fr/videos-tlrf_table_ronde_1 (2016)
|
|
BASE
|
|
Show details
|
|
2 |
À la croisée des langues. Annotation et fouille de corpus plurilingues
|
|
|
|
In: ISSN: 1764-1667 ; Revue des Nouvelles Technologies de l'Information ; https://halshs.archives-ouvertes.fr/halshs-01063067 ; Revue des Nouvelles Technologies de l'Information, Editions RNTI, 2014, RNTI-SHS-2, pp.81-100 (2014)
|
|
BASE
|
|
Show details
|
|
3 |
À la croisée des langues. Annotation et fouille de corpus plurilingues
|
|
|
|
In: ISSN: 1764-1667 ; Revue des Nouvelles Technologies de l'Information ; https://halshs.archives-ouvertes.fr/halshs-01063067 ; Revue des Nouvelles Technologies de l'Information, Editions RNTI, 2014, RNTI-SHS-2, pp.81-100 (2014)
|
|
BASE
|
|
Show details
|
|
4 |
From linguistic annotation in multilingual corpora to the annotation of language contact phenomena: the Clapoty Project
|
|
|
|
In: International workshop on Multilingual Corpora annotation ; https://hal.archives-ouvertes.fr/hal-00672742 ; International workshop on Multilingual Corpora annotation, Oct 2011, Villejuif, France (2011)
|
|
BASE
|
|
Show details
|
|
5 |
From linguistic annotation in multilingual corpora to the annotation of language contact phenomena: the Clapoty Project
|
|
|
|
In: International workshop on Multilingual Corpora annotation ; https://hal.archives-ouvertes.fr/hal-00672742 ; International workshop on Multilingual Corpora annotation, Oct 2011, Villejuif, France (2011)
|
|
BASE
|
|
Show details
|
|
6 |
La tête de mort est gaie et M. Beurk est cool. Faut-il pourchasser indéfiniment l'iconicité ?
|
|
|
|
In: ISSN: 1773-0120 ; Texto ! Textes et Cultures ; https://halshs.archives-ouvertes.fr/halshs-01689896 ; Texto ! Textes et Cultures, Institut Ferdinand de Saussure, 2009, XIV (4) (2009)
|
|
BASE
|
|
Show details
|
|
7 |
Grammaires factorisées pour des dialectes apparentés
|
|
|
|
In: TALN 2008 : Actes de la 15ème conférence annuelle sur le Traitement Automatique des Langues Naturelles ; 15ème conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN 2008) ; https://hal.archives-ouvertes.fr/hal-00327572 ; 15ème conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN 2008), Jun 2008, Avignon, France. p. 159-168 (2008)
|
|
BASE
|
|
Show details
|
|
8 |
A Layered Grammar Model: Using Tree-Adjoining Grammars to Build a Common Syntactic Kernel for Related Dialects
|
|
|
|
In: TAG+9 2008: Proceedings of the Ninth International Workshop on Tree Adjoining Grammars and Related Formalisms ; 9th International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+9 2008) ; https://hal.archives-ouvertes.fr/hal-00327566 ; 9th International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+9 2008), Jun 2008, Tübingen, Germany. p. 157-164 (2008)
|
|
BASE
|
|
Show details
|
|
9 |
Interprétation des pictogrammes : genèse d'une compétence
|
|
|
|
In: Les âges de la vie : Sémiotique de la culture et du temps ; https://hal.archives-ouvertes.fr/hal-00330427 ; Ivan Darrault-Harris et Jacques Fontanille. Les âges de la vie : Sémiotique de la culture et du temps, Presses Universitaires de France, pp.251-296, 2008, Formes Sémiotiques (2008)
|
|
BASE
|
|
Show details
|
|
10 |
Grammaires factorisées pour des dialectes apparentés
|
|
|
|
In: TALN 2008 : Actes de la 15ème conférence annuelle sur le Traitement Automatique des Langues Naturelles ; 15ème conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN 2008) ; https://hal.archives-ouvertes.fr/hal-00327572 ; 15ème conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN 2008), Jun 2008, Avignon, France. p. 159-168 (2008)
|
|
BASE
|
|
Show details
|
|
11 |
Grammaires factorisées pour des dialectes apparentés
|
|
|
|
In: Université des Antilles et de la Guyane. Service commun de la documentation (2008)
|
|
BASE
|
|
Show details
|
|
12 |
Grammaires factorisées pour des dialectes apparentés
|
|
|
|
In: Université des Antilles et de la Guyane. Service commun de la documentation (2008)
|
|
BASE
|
|
Show details
|
|
13 |
Une grammaire formelle du créole martiniquais pour la génération automatique ...
|
|
|
|
BASE
|
|
Show details
|
|
14 |
A Layered Grammar Model: Using Tree-Adjoining Grammars to Build a Common Syntactic Kernel for Related Dialects ...
|
|
|
|
BASE
|
|
Show details
|
|
15 |
A Layered Grammar Model: Using Tree-Adjoining Grammars to Build a Common Syntactic Kernel for Related Dialects
|
|
|
|
In: TAG+9 2008: Proceedings of the Ninth International Workshop on Tree Adjoining Grammars and Related Formalisms ; 9th International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+9 2008) ; https://hal.archives-ouvertes.fr/hal-00327566 ; 9th International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+9 2008), Jun 2008, Tübingen, Germany. p. 157-164 (2008)
|
|
BASE
|
|
Show details
|
|
18 |
Analyse spectrale des textes: détection automatique des frontières de langue et de discours
|
|
|
|
In: Verbum ex machina : Actes de la 13ème conférence annuelle sur le Traitement Automatique des Langues Naturelles ; 13ème conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN 2006) ; https://hal.archives-ouvertes.fr/hal-00327607 ; 13ème conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN 2006), Apr 2006, Louvain (Leuven), Belgique. ISBN 2-87463-023-3, p. 619-629 (2006)
|
|
Abstract:
In French. 10 pages, 5 figures, LaTeX 2e using EPSF and custom package taln2006.sty (designed by Pierre Zweigenbaum, ATALA). Proceedings of the 13th annual French-speaking conference on Natural Language Processing: `Traitement Automatique des Langues Naturelles' (TALN 2006), Louvain (Leuven), Belgium, 10-13 April 2003 ; National audience ; We propose a theoretical framework within which information on the vocabulary of a given corpus can be inferred on the basis of statistical information gathered on that corpus. Inferences can be made on the categories of the words in the vocabulary, and on their syntactical properties within particular languages. Based on the same statistical data, it is possible to build matrices of syntagmatic similarity (bigram transition matrices) or paradigmatic similarity (probability for any pair of words to share common contexts). When clustered with respect to their syntagmatic similarity, words tend to group into sublanguage vocabularies, and when clustered with respect to their paradigmatic similarity, into syntactic or semantic classes. Experiments have explored the first of these two possibilities. Their results are interpreted in the frame of a Markov chain modelling of the corpus' generative processe(s): we show that the results of a spectral analysis of the transition matrix can be interpreted as probability distributions of words within clusters. This method yields a soft clustering of the vocabulary into sublanguages which contribute to the generation of heterogeneous corpora. As an application, we show how multilingual texts can be visually segmented into linguistically homogeneous segments. Our method is specifically useful in the case of related languages which happened to be mixed in corpora.
|
|
Keyword:
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR]; ACM H.3.3; clustering; I.2.7; language identification; multilingual corpora; soft spectral clustering; text segmentation
|
|
URL: https://hal.archives-ouvertes.fr/hal-00327607
|
|
BASE
|
|
Hide details
|
|
19 |
Soft Uncoupling of Markov Chains for Permeable Language Distinction: A New Algorithm
|
|
|
|
In: ECAI 2006: 17th European Conference on Artificial Intelligence ; 17th European Conference on Artificial Intelligence (ECAI 2006) ; https://hal.archives-ouvertes.fr/hal-00327782 ; 17th European Conference on Artificial Intelligence (ECAI 2006), Aug 2006, Riva del Garda, Italy. ISBN 1-58603-642-3, p. 823-824 (2006)
|
|
BASE
|
|
Show details
|
|
20 |
Semiotik
|
|
|
|
In: Bildwissenschaft : Disziplinen, Themen, Methoden ; https://hal.archives-ouvertes.fr/hal-00330382 ; Klaus Sachs-Hombach. Bildwissenschaft : Disziplinen, Themen, Methoden, Suhrkamp, pp.149-162, 2005, stw ("suhrkamp taschenbuch wissenschaft") (2005)
|
|
BASE
|
|
Show details
|
|
|
|