Home Catalogue search

eng

Refine your search:
- Keyword
- Creator / Publisher
- Year
- Medium
- Type
- BLLDB-Access:
  - free (29)
  - subject to license (0)

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2

Hits 1 – 20 of 29

1	The effect of domain and diacritics in Yorùbá-English neural machine translation
	Adelani, David,; Ruiter, Dana; Alabi, Jesujoba,...
	In: 18th Biennial Machine Translation Summit ; https://hal.inria.fr/hal-03350967 ; 18th Biennial Machine Translation Summit, Aug 2021, Orlando, United States (2021)
	BASE
	Show details

2	Europarl Direct Translationese Dataset ...
	Amponsah-Kaakyire, Kwabena; Pylypenko, Daria; España-Bonet, Cristina. - : Zenodo, 2021
	BASE
	Show details

3	Europarl Direct Translationese Dataset ...
	Amponsah-Kaakyire, Kwabena; Pylypenko, Daria; España-Bonet, Cristina. - : Zenodo, 2021
	BASE
	Show details

4	Europarl Direct Translationese Dataset ...
	Amponsah-Kaakyire, Kwabena; Pylypenko, Daria; España-Bonet, Cristina. - : Zenodo, 2021
	BASE
	Show details

5	A Data Augmentation Approach for Sign-Language-To-Text Translation In-The-Wild ...
	Nunnari, Fabrizio; España-Bonet, Cristina; Avramidis, Eleftherios. - : Schloss Dagstuhl - Leibniz-Zentrum für Informatik, 2021
	BASE
	Show details

6	The Effect of Domain and Diacritics in Yorùbá-English Neural Machine Translation ...
	Adelani, David I.; Ruiter, Dana; Alabi, Jesujoba O.. - : arXiv, 2021
	BASE
	Show details

7	Integrating Unsupervised Data Generation into Self-Supervised Neural Machine Translation for Low-Resource Languages ...
	Ruiter, Dana; Klakow, Dietrich; van Genabith, Josef; España-Bonet, Cristina. - : arXiv, 2021
	Abstract: For most language combinations, parallel data is either scarce or simply unavailable. To address this, unsupervised machine translation (UMT) exploits large amounts of monolingual data by using synthetic data generation techniques such as back-translation and noising, while self-supervised NMT (SSNMT) identifies parallel sentences in smaller comparable data and trains on them. To date, the inclusion of UMT data generation techniques in SSNMT has not been investigated. We show that including UMT techniques into SSNMT significantly outperforms SSNMT and UMT on all tested language pairs, with improvements of up to +4.3 BLEU, +50.8 BLEU, +51.5 over SSNMT, statistical UMT and hybrid UMT, respectively, on Afrikaans to English. We further show that the combination of multilingual denoising autoencoding, SSNMT with backtranslation and bilingual finetuning enables us to learn machine translation even for distant language pairs for which only small amounts of monolingual data are available, e.g. yielding BLEU scores ... : 11 pages, 8 figures, accepted at MT-Summit 2021 (Research Track) ...
	Keyword: Computation and Language cs.CL; FOS Computer and information sciences
	URL: https://dx.doi.org/10.48550/arxiv.2107.08772 https://arxiv.org/abs/2107.08772
	BASE
	Hide details

8	Comparing Feature-Engineering and Feature-Learning Approaches for Multilingual Translationese Classification ...
	Pylypenko, Daria; Amponsah-Kaakyire, Kwabena; Chowdhury, Koel Dutta. - : arXiv, 2021
	BASE
	Show details

9	Comparing Feature-Engineering and Feature-Learning Approaches for Multilingual Translationese Classification ...
	The 2021 Conference on Empirical Methods in Natural Language Processing 2021; Amponsah-Kaakyire, Kwabena; Dutta Chowdhury, Koel. - : Underline Science Inc., 2021
	BASE
	Show details

10	Automatic classification of human translation and machine translation : a study from the perspective of lexical diversity
	Fu, Yingxue; Nederhof, Mark Jan. - : Linkoping University Electronic Press, 2021
	BASE
	Show details

11	Tailoring and Evaluating the Wikipedia for in-Domain Comparable Corpora Extraction ...
	España-Bonet, Cristina; Barrón-Cedeño, Alberto; Màrquez, Lluís. - : arXiv, 2020
	BASE
	Show details

12	WTC1.1 (WikiTailor corpus v. 1.1) ...
	España-Bonet, Cristina; Barrón-Cedeño, Alberto; Màrquez, Lluís. - : Zenodo, 2020
	BASE
	Show details

13	MT models for multilingual CLuBS engine (en-de-fr-es) ...
	España-Bonet, Cristina; Henning, Sophie; Ramthun, Roland. - : Zenodo, 2020
	BASE
	Show details

14	WTC1.0 (WikiTailor corpus v. 1.0) ...
	España-Bonet, Cristina; Barrón-Cedeño, Alberto; Màrquez, Lluís. - : Zenodo, 2020
	BASE
	Show details

15	WTC1.1 (WikiTailor corpus v. 1.1) ...
	España-Bonet, Cristina; Barrón-Cedeño, Alberto; Màrquez, Lluís. - : Zenodo, 2020
	BASE
	Show details

16	MT models for multilingual CLuBS engine (en-de-fr-es) ...
	España-Bonet, Cristina; Henning, Sophie; Ramthun, Roland. - : Zenodo, 2020
	BASE
	Show details

17	Multilingual and Interlingual Semantic Representations for Natural Language Processing: A Brief Introduction
	Costa-jussà, Marta R.; España-Bonet, Cristina; Fung, Pascale...
	In: Computational Linguistics, Vol 46, Iss 2, Pp 249-255 (2020) (2020)
	BASE
	Show details

18	GeBioToolkit: Automatic Extraction of Gender-Balanced Multilingual Corpus of Wikipedia Biographies ...
	Costa-jussà, Marta R.; Lin, Pau Li; España-Bonet, Cristina. - : arXiv, 2019
	BASE
	Show details

19	Massive vs. Curated Word Embeddings for Low-Resourced Languages. The Case of Yorùbá and Twi ...
	Alabi, Jesujoba O.; Amponsah-Kaakyire, Kwabena; Adelani, David I.. - : arXiv, 2019
	BASE
	Show details

20	Query Translation for Cross-lingual Search in the Academic Search Engine PubPsych ...
	España-Bonet, Cristina; Stiller, Juliane; Ramthun, Roland. - : PsychArchives, 2018
	BASE
	Show details

Page: 1 2

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern