DE eng

Search in the Catalogues and Directories

Hits 1 – 15 of 15

1
Open demands for corpus analysis tools - a user-centered study ; Offene Anforderungen an Korpusanalysewerkzeuge - eine nutzerzentrierte Studie
Lyding, Verena. - 2022
Abstract: It was not before the advent of powerful computers that corpus linguistics has developed into a widely applied research methodology. Indeed, corpus linguistics heavily relies on computer-powered analysis tools. They get used on a daily basis by corpus linguists to retrieve examples and analyze authentic data from corpora of extensive sizes. Despite their indisputable importance, repetitive remarks highlight the fact that corpus analysis tools have evolved little since their early days. Concordances, frequency lists and collocation extraction still constitute the core functionalities of most corpus tools. With the aim to incentivize new functional developments, this thesis presents research on open demands in current corpus research practice and related requirements for tools support. It builds on the assumption that more user-centered research is needed to bridge the gap between mainly computationally trained tool developers and their linguistic expert users, who come with specialized domain knowledge and often sophisticated analytical needs. The research is approached by means of three user investigations that enquire about corpus research workflows and analysis activities as well as theoretical principles and methodological considerations in corpus linguistics research practice. This way a comprehensive picture of the corpus usage situation is assembled by combining insights from open ended enquiries (interviews) with quantitative results on selected aspects of the corpus analysis scenario (questionnaire) derived from enquiries with overall more than 100 corpus users. Based on the results, a range of open demands for corpus research and tools are identified and discussed. They relate to (1) corpus resources, (2) general aspects of tools, (3) corpus analysis procedures, and (4) best practices. The results show that open demands address challenges on very different operational levels, ranging from the availability of corpus resources and reliable annotations, technical requirements related to scalability and interoperability issues, usability and technical and methodological skills up to proper functional demands. The thesis discusses potential paths to address the open demands, and provides pointers to recent developments in corpus linguistics and related fields, in particular computational linguistics and natural language processing as well as linguistic information visualization. The research contribution of this thesis is twofold. On the methodological level, it elaborates on methods and challenges for user-centered research on tools for open-ended tasks and provides entrance points for further user-centered research by identifying and organizing, as reference, the basic building blocks of corpus linguistics research. On the content level, it provides first insights on user perspectives and needs related to the corpus research practice. It describes concrete demands and discusses paths to their solution. This way, it prepares the ground for further in-depths studies and user-centered developments of new corpus functionalities for specific demands. ; Mit der Verbreitung leistungsstarker Computer begann die Korpuslinguistik als Forschungsmethode erstmals weitreichende Anwendung zu finden. Tatsächlich bedient sie sich in großem Ausmaß computergestützter Analysewerkzeuge, welche tagtäglich zum Einsatz kommen, um Korpora von beachtlicher Größe zu analysieren. Trotz ihrer zentralen Position wird wiederholt herausgestellt, dass sich auf Funktionenebene seit Anbeginn wenig Neuerungen verzeichnen lassen. Konkordanzen, Frequenzlisten und Kollokationsextraktion bilden bis heute die Kernfunktionen der meisten Korpuswerkzeuge. Mit dem Ziel neue Entwicklungen anzustoßen, präsentiert diese Arbeit Forschung zu offenen Anforderung in der Korpusforschungspraxis. Unter der Annahme, dass mehr nutzerorientierte Studien erforderlich sind, um die technisch orientierten Entwicklungen von Korpuswerkzeugen mit den oft anspruchsvollen und fachbezogenen Analysebedürfnissen von KorpuslinguistInnen in Einklang zu bringen, wurde die Forschung anhand von drei Nutzerbefragungen umgesetzt, welche Informationen zu Korpusanalyseworkflows und -aktivitäten, sowie zu theoretischen und methodologischen Prinzipien sammeln. Indem Einsichten aus offenen Befragungen (Interviews) mit quantitativen Ergebnissen zu ausgewählten Aspekten des Korpusanalyseszenarios (Fragebogen) aus Befragungen mit insgesamt über 100 TeilnehmerInnen kombiniert wurden, konnte ein umfassendes Bild der Korpusnutzersituation erarbeitet werden. Es mündet in die Beschreibung einer Reihe offener Anforderungen für die korpusbasierte Forschung und Unterstützung durch Werkzeuge, welche bezogen auf vier Aspekte diskutiert werden: (1) Korpusressourcen, (2) allgemeine Aspekte von Werkzeugen, (3) Korpusanalyseprozeduren und (4) Best Practices. Die Ergebnisse zeigen, dass offene Anforderungen sich auf Herausforderungen auf unterschiedlichen operativen Ebenen beziehen. Diese reichen von der Verfügbarkeit von Korpusressourcen und verlässlichen Annotationen, über technische Anforderungen hinsichtlich Skalierbarkeit, Interoperabilität und Nutzerfreundlichkeit, bis hin zu Nutzerskills und schließlich funktionellen Aspekten. Diese Thesis diskutiert potentielle Antworten und Lösungswege und stellt Bezüge zu jüngeren Entwicklungen in der Korpuslinguistik und benachbarten Disziplinen her, insbesondere zu denen der Computerlinguistik, des Natural Language Processing und der Visualisierung linguistischer Daten. Die Arbeit leistet einen zweifachen Forschungsbeitrag. Auf methodischer Ebene erörtert die Arbeit Herausforderungen und Ansätze für die nutzerzentrierte Forschung zu Werkzeugen für offene Aufgabenstellungen. Auch bietet die Arbeit Einstiegspunkte für weitere nutzerzentrierte Forschung, indem die Grundpfeiler der korpuslinguistischen Forschung identifiziert und systematisch beschrieben werden und somit ein Referenzrahmen, der bisher fehlte, hergestellt wird. Auf inhaltlicher Ebene liefert diese Forschungsarbeit erste Einsichten zu Nutzerperspektiven in Bezug auf die tägliche Praxis der Korpusforschung und leitet daraus eine Reihe von Anforderungen ab. Die Anforderungen werden nach inhaltlichen Gruppen strukturiert beschrieben und Wege zu deren Lösung werden diskutiert. Damit bereitet diese Arbeit den Weg für weitere vertiefende Studien zu Nutzeranforderungen und ermutigt nutzerzentrierte Entwicklungen neuer Korpusfunktionalitäten in Bezug auf die diskutierten Anforderungen.
Keyword: ddc:005; ddc:410
URL: https://opus4.kobv.de/opus4-fau/frontdoor/index/index/docId/18590
https://opus4.kobv.de/opus4-fau/files/18590/DissertationVerenaLyding.pdf
https://nbn-resolving.org/urn:nbn:de:bvb:29-opus4-185908
BASE
Hide details
2
Creating Expert Knowledge by Relying on Language Learners: a Generic Approach for Mass-Producing Language Resources by Combining Implicit Crowdsourcing and Language Learning
In: LREC 2020 - Language Resources and Evaluation Conference ; https://hal.inria.fr/hal-02879883 ; LREC 2020 - Language Resources and Evaluation Conference, May 2020, Marseille, France (2020)
BASE
Show details
3
Substituto - A Synchronous Educational Language Game for Simultaneous Teaching and Crowdsourcing
In: 9th Workshop on Natural Language Processing for Computer Assisted Language Learning (NLP4CALL 2020) ; https://hal.inria.fr/hal-03114898 ; 9th Workshop on Natural Language Processing for Computer Assisted Language Learning (NLP4CALL 2020), Nov 2020, Gothenburg, Sweden. pp.1-9, ⟨10.3384/ecp201759⟩ ; https://www.aclweb.org/anthology/volumes/2020.nlp4call-1/ (2020)
BASE
Show details
4
Bridging standards development and infrastructure usage by means of concept graphs: the liaison of CLARIN and ISO TC37SC4 in practice
Suchowolec, Karolina [Verfasser]; Bański, Piotr [Verfasser]; Witt, Andreas [Verfasser]. - Mannheim : Institut für Deutsche Sprache, Bibliothek, 2018
DNB Subject Category Language
Show details
5
Introducing the European NETwork for Combining Language LEarning and Crowdsourcing Techniques (enetCollect)
In: EuroCALL ; https://hal.archives-ouvertes.fr/hal-01961788 ; EuroCALL, Aug 2018, Jyväskylä, Finland (2018)
BASE
Show details
6
PAISÀ Corpus of Italian Web Text
Lyding, Verena; Stemle, Egon; Borghetti, Claudia. - : Institute for Applied Linguistics, Eurac Research, 2018
BASE
Show details
7
MERLIN Written Learner Corpus for Czech, German, Italian 1.0
Wisniewski, Katrin; Abel, Andrea; Vodičková, Kateřina. - : Institute for Applied Linguistics, Eurac Research, 2018
BASE
Show details
8
MERLIN Written Learner Corpus for Czech, German, Italian 1.1
Wisniewski, Katrin; Abel, Andrea; Vodičková, Kateřina. - : Institute for Applied Linguistics, Eurac Research, 2018
BASE
Show details
9
Transcription Bottleneck of Speech Corpus Exploitation
Brinckmann, Caren [Verfasser]; Lyding, Verena [Herausgeber]. - Mannheim : Institut für Deutsche Sprache, Bibliothek, 2017
DNB Subject Category Language
Show details
10
Creating and working with spoken language corpora in EXMARaLDA
Schmidt, Thomas [Verfasser]; Lyding, Verena [Herausgeber]. - Mannheim : Institut für Deutsche Sprache, Bibliothek, 2014
DNB Subject Category Language
Show details
11
Proceedings of the Second Colloquium on Lesser Languages and Computer Linguistics (LULCL II)
Lyding, Verena. - Bozen : EURAC, 2009
IDS Bibliografie zur Gesprächsforschung
12
Proceedings of the Second Colloquium on Lesser Used Languages and Computer Linguistics (LULCL II) : "Combining efforts to foster computational support of minority languages" ; Bozen-Bolzano, 13th - 14th November 2008
Lyding, Verena (Hrsg.). - Bozen : Europ. Akad., 2009
IDS Mannheim
Show details
13
Aspekte der Interdisziplinarität beim Einsatz von Korpora in der Fachtextanalyse
In: Formulierungsmuster in deutscher und italienischer Fachkommunikation. Intra- und interlinguale Perspektiven (2008)
IDS Bibliografie zur deutschen Grammatik
Show details
14
The LexALP Information System: Term Bank and Corpus for Multilingual Legal Terminology Consolidated
In: Proceedings of the Workshop on Multilingual Language Resources and Interoperability ; https://hal.archives-ouvertes.fr/hal-00965693 ; Proceedings of the Workshop on Multilingual Language Resources and Interoperability, Jun 2006, Sydney, Australia. pp.25--31 (2006)
BASE
Show details
15MERLIN - Mehrsprachige Plattform für die Europäischen Referenzniveaus: Untersuchung von Lernersprache im Kontext
https://www.merlin-platform.eu/
Topic: Corpus linguistics; Grammar research; Second language acquisition / Foreign language acquisition; ...
Language: Czech; German, Standard ; Italian
Source type: Bibliographies; Corpora; Lectures / Interviews
Access: free access

Catalogues
0
1
0
0
3
0
0
Bibliographies
0
0
1
1
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
1
0
0
0
Open access documents
8
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern