2 |
How much context span is enough? Examining context-related issues for document-level MT
|
|
|
|
In: Castilho, Sheila orcid:0000-0002-8416-6555 (2022) How much context span is enough? Examining context-related issues for document-level MT. In: 13th Language Resources and Evaluation Conference, 21-23 June 2022, Marseille, France. (In Press) (2022)
|
|
BASE
|
|
Show details
|
|
3 |
An investigation of English-Irish machine translation and associated resources
|
|
Dowling, Meghan. - : Dublin City University. School of Computing, 2022. : Dublin City University. ADAPT, 2022
|
|
In: Dowling, Meghan orcid:0000-0003-1637-4923 (2022) An investigation of English-Irish machine translation and associated resources. PhD thesis, Dublin City University. (2022)
|
|
BASE
|
|
Show details
|
|
4 |
One model for the learning of language.
|
|
|
|
In: Proceedings of the National Academy of Sciences of the United States of America, vol 119, iss 5 (2022)
|
|
BASE
|
|
Show details
|
|
5 |
Computational Measures of Deceptive Language: Prospects and Issues
|
|
|
|
In: ISSN: 2297-900X ; EISSN: 2297-900X ; Frontiers in Communication ; https://hal.archives-ouvertes.fr/hal-03629780 ; Frontiers in Communication, Frontiers, 2022, 7, pp.792378. ⟨10.3389/fcomm.2022.792378⟩ (2022)
|
|
BASE
|
|
Show details
|
|
6 |
Animal linguistics in the making: the Urgency Principle and titi monkeys’ alarm system
|
|
|
|
In: ISSN: 0394-9370 ; Ethology Ecology and Evolution ; https://hal.inrae.fr/hal-03518874 ; Ethology Ecology and Evolution, Taylor & Francis, 2022, pp.1-17. ⟨10.1080/03949370.2021.2015452⟩ (2022)
|
|
BASE
|
|
Show details
|
|
7 |
Finding the best way to put media bias research into practice via an annotation app ...
|
|
|
|
BASE
|
|
Show details
|
|
8 |
Labour market discrimination and biases in human judgement and Artificial Intelligence ...
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Movies with imaginary worlds cluster together because of exploration-related terms in plot summaries ...
|
|
|
|
BASE
|
|
Show details
|
|
10 |
Finding the best way to put media bias research into practice through an annotation app ...
|
|
|
|
BASE
|
|
Show details
|
|
13 |
Maschinelle Übersetzung (MT) für den Notfall : Ratgeber zum Einsatz von MT Tools für die Kommunikation mit Flüchtlingen aus der Ukraine ...
|
|
|
|
BASE
|
|
Show details
|
|
14 |
Neural machine translation and language teaching : possible implications for the CEFR ...
|
|
|
|
BASE
|
|
Show details
|
|
15 |
From bag-of-words towards natural language: adapting topic models to avoid stop word removal ...
|
|
|
|
Abstract:
Topic models such as latent Dirichlet allocation (LDA) aim to identify latent topics within text corpora. However, although LDA-type models fall into the category of Natural Language Processing, the actual model input is heavily modified from the original natural language. Among other things, this is typically done by removing specific terms, which arguably might also remove information. In this paper, an extension to LDA is proposed called uLDA, which seeks to incorporate some of these formerly eliminated terms -- namely stop words -- to match natural topics more closely. After developing and evaluating the new extension on established fit measures, uLDA is then tasked with approximating human-perceived topics. For this, a ground truth for topic labels is generated using a human-based experiment. These values are then used as a reference to be matched by the model output. Results show that the new extension outperforms traditional topic models regarding out-of-sample fit across all data sets and regarding ... : Topic-Modelle wie die latente Dirichlet-Allokation (LDA) zielen darauf ab, latente Themen in Textkorpora zu identifizieren. Obwohl Modelle vom Typ LDA in die Kategorie der Verarbeitung natürlicher Sprache fallen, wird die eigentliche Modelleingabe jedoch stark von der ursprünglichen natürlichen Sprache abgewandelt. Dies geschieht u. a. durch das Entfernen bestimmter Begriffe, wodurch allerdings auch Informationen verloren gehen können. In dieser Arbeit wird eine Erweiterung von LDA vorgeschlagen, die uLDA genannt wird und versucht, einige dieser zuvor eliminierten Begriffe - sogenannte Stoppwörter - in das Modell mit einzubeziehen, um die natürlichen Themen besser abzubilden. Nach der Entwicklung und Evaluierung der neuen Erweiterung anhand etablierter Anpassungsmaße wird uLDA dann mit der Aufgabe betraut, vom Menschen wahrgenommene Themen zu approximieren. Zu diesem Zweck wird eine Grundwahrheit für die Themenmarkierung durch ein Experiment mit menschlichen Teilnehmern erzeugt. Diese Werte werden dann als ...
|
|
Keyword:
Bayes-Lernen; Unüberwachtes Lernen; Computerlinguistik; Hierarchical bayes model; Topic models LDA
|
|
URL: https://dx.doi.org/10.17904/ku.opus-726 https://opus4.kobv.de/opus4-ku-eichstaett/frontdoor/index/index/docId/726
|
|
BASE
|
|
Hide details
|
|
16 |
Linked Open Tafsir - Rekonstruktion der Entstehungsdynamik(en) des Korans mithilfe der Netzwerkmodellierung früher islamischer Überlieferungen ...
|
|
|
|
BASE
|
|
Show details
|
|
17 |
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
|
|
|
|
BASE
|
|
Show details
|
|
18 |
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
|
|
|
|
BASE
|
|
Show details
|
|
19 |
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
|
|
|
|
BASE
|
|
Show details
|
|
20 |
Linked Open Tafsir - Rekonstruktion der Entstehungsdynamik(en) des Korans mithilfe der Netzwerkmodellierung früher islamischer Überlieferungen ...
|
|
|
|
BASE
|
|
Show details
|
|
|
|