DE eng

Search in the Catalogues and Directories

Hits 1 – 2 of 2

1
Évaluation des propriétés multilingues d'un embedding contextualisé
In: EGC 2022 - Conférence francophone sur l'Extraction et la Gestion des Connaissances ; https://hal.archives-ouvertes.fr/hal-03578480 ; EGC 2022 - Conférence francophone sur l'Extraction et la Gestion des Connaissances, Jan 2022, Blois, France (2022)
BASE
Show details
2
Unsupervised Word embedding Alignment in the biomedical domain ; Alignement non supervisé d'embeddings de mots dans le domaine biomédical
In: CIFSD - Conférence Internationale Francophone sur la Science des Données ; https://hal.archives-ouvertes.fr/hal-03259987 ; CIFSD - Conférence Internationale Francophone sur la Science des Données, Jun 2021, Marseille/Virtuel, France (2021)
Abstract: International audience ; Notre objectif est de créer un alignement non supervisé et multilingue d’embeddings de mots (ou plongements lexicaux) basés sur des corpora de domaines différents. Plus précisément, nous cherchons à aligner un embedding cible anglais du domaine biomédical avec un embedding source du domaine général d’une autre langue, puisque les textes à traiter sont dans diverses langues (français, espagnol.) et que le vocabulaire du domaine biomédical est essentiellement disponible en anglais. Notre méthode pour aligner deux embeddings de domaines et langages différents repose sur un autre embedding pivot de même domaine que la source et de même langage que la cible. Notre méthode aligne d’abord les embeddings de même domaine pour créer un dictionnaire qui sert ensuite à aligner les embeddings de domaines et languages distincts. Elle est évaluée sur une tâche de traduction du domaine biomédical dans plusieurs langues. Bien que notre algorithme ne dépasse pas les méthodes d’alignement entre embeddings de même domaine, elle dépasse ces mêmes méthodes appliquées à des embeddings de domaines différents. Ce travail préliminaire montre qu’aligner des embeddings de domaines différents est possible de manière non supervisé.
Keyword: [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; apprentissage non supervisé; embeddings de mots; multilingue; traitement automatique du langage
URL: https://hal.archives-ouvertes.fr/hal-03259987/file/main.pdf
https://hal.archives-ouvertes.fr/hal-03259987/document
https://hal.archives-ouvertes.fr/hal-03259987
BASE
Hide details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
2
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern