DE eng

Search in the Catalogues and Directories

Hits 1 – 16 of 16

1
Quantifier scope and information structure in Greek
In: Glossa: a journal of general linguistics; Vol 5, No 1 (2020); 81 ; 2397-1835 (2020)
BASE
Show details
2
When verbs have bugs: lexical and syntactic processing costs of split particle verbs in sentence comprehension ...
Czypionka, Anna; Golcher, Felix; Błaszczak, Joanna. - : Taylor & Francis, 2018
BASE
Show details
3
When verbs have bugs: lexical and syntactic processing costs of split particle verbs in sentence comprehension ...
Czypionka, Anna; Golcher, Felix; Błaszczak, Joanna. - : Taylor & Francis, 2018
BASE
Show details
4
Bilingual lexicon development in Germany in preschool children with the home languages Russian and Turkish
In: Dynamics of linguistic diversity (2017), S. 125-142
Leibniz-Zentrum Allgemeine Sprachwissenschaft
Show details
5
Der Einfluss von Sprachfördermaßnahmen auf das Sprachverständnis bilingualer Kinder : Eine Studie des Berliner Interdisziplinären Verbundes für Mehrsprachigkeit (BIVEM)
Düsterhöft, Stefanie [Verfasser]; Posse, Dorothea [Verfasser]; Topaj, Nathalie [Verfasser]. - Potsdam : Universität Potsdam, 2016
DNB Subject Category Language
Show details
6
Spektrum Patholinguistik Band 9. Schwerpunktthema: Lauter Laute: Phonologische Verarbeitung und Lautwahrnehmung in der Sprachtherapie
Corsten, Sabine [Verfasser]; Günther, Thomas [Verfasser]; Nieslony, Julia [Verfasser]. - 2016
DNB Subject Category Language
Show details
7
Spektrum Patholinguistik Band 9. Schwerpunktthema: Lauter Laute: Phonologische Verarbeitung und Lautwahrnehmung in der Sprachtherapie ... [<Journal>]
Corsten, Sabine; Günther, Thomas; Nieslony, Julia. - : Universitätsverlag Potsdam
BASE
Show details
8
Spektrum Patholinguistik Band 9. Schwerpunktthema: Lauter Laute: Phonologische Verarbeitung und Lautwahrnehmung in der Sprachtherapie
BASE
Show details
9
Der Einfluss von Sprachfördermaßnahmen auf das Sprachverständnis bilingualer Kinder
BASE
Show details
10
Syntactic modification at early stages of L2 German writing development: A longitudinal learner corpus study
In: Journal of Second Language Writing 29 (2015), 28-50
IDS Bibliografie zur deutschen Grammatik
Show details
11
Wiederholungen in Texten : segmentieren und klassifizieren mit vollständigen Substringfrequenzen
Golcher, Felix [Verfasser]; Lüdeling, Anke [Akademischer Betreuer]; Baroni, Marco [Akademischer Betreuer]. - Berlin : Humboldt Universität zu Berlin, Philosophische Fakultät II, 2013
DNB Subject Category Language
Online dissertations
Show details
12
Wiederholungen in Texten ...
Golcher, Felix. - : Humboldt-Universität zu Berlin, Philosophische Fakultät II, 2013
BASE
Show details
13
Wiederholungen in Texten
Golcher, Felix. - : Humboldt-Universität zu Berlin, Philosophische Fakultät II, 2013
Abstract: Diese Arbeit untersucht vollständige Zeichenkettenfrequenzverteilungen natürlichsprachiger Texte auf ihren linguistischen und anwendungsbezogenen Gehalt. Im ersten Teil wird auf dieser Datengrundlage ein unüberwachtes Lernverfahren entwickelt, das Texte in Morpheme zerlegt. Die Zerlegung geht von der Satzebene aus und verwendet jegliche vorhandene Kontextinformation. Es ergibt sich ein sprachunabhängiger Algorithmus, der die gefundenen Morpheme teilweise zu Baumstrukturen zusammenordnet. Die Evaluation der Ergebnisse mit Hilfe statistischer Modelle ermöglicht die Identifizierung auch kleiner Performanzunterschiede. Diese sind einer linguistischen Interpretation zugänglich. Der zweite Teil der Arbeit besteht aus stilometrischen Untersuchungen anhand eines Textähnlichkeitsmaßes, das ebenfalls auf vollständigen Zeichenkettenfrequenzen beruht. Das Textähnlichkeitsmaß wird in verschiedenen Varianten definiert und anhand vielfältiger stilometrischer Fragestellungen und auf Grundlage unterschiedlicher Korpora ausgewertet. Dabei ist ein wiederholter Vergleich mit der Performanz bisheriger Forschungsansäzte möglich. Die Performanz moderner Maschinenlernverfahren kann mit dem hier vorgestellten konzeptuell einfacheren Verfahren reproduziert werden. Während die Segmentierung in Morpheme ein lokaler Vorgang ist, besteht Stilometrie im globalen Vergleich von Texten. Daher bietet die Untersuchung dieser zwei unverbunden scheinenden Fragestellungen sich gegenseitig ergänzende Perspektiven auf die untersuchten Häufigkeitsdaten. Darüber hinaus zeigt die Diskussion der rezipierten Literatur zu beiden Themen ihre Verbindungen durch verwandte Konzepte und Denkansätze auf. Aus der Gesamtheit der empirischen Untersuchungen zu beiden Fragestellungen kann abgeleitet werden, dass den längeren und damit selteneren Zeichenketten wesentlich mehr Informationsgehalt innewohnt, als in der bisherigen Forschung gemeinhin angenommen wird. ; This thesis investigates the linguistic and application specific content of complete character substring frequency distributions of natural language texts. The first part develops on this basis an unsupervised learning algorithm for segmenting text into morphemes. The segmentation starts from the sentence level and uses all available context information. The result is a language independent algorithm which arranges the found morphemes partly into tree like structures. The evaluation of the output using advanced statistical modelling allows for identifying even very small performance differences. These are accessible to linguistic interpretation. The second part of the thesis consists of stylometric investigations by means of a text similarity measure also rooted in complete substring frequency statistics. The similarity measure is defined in different variants and evaluated for various stylometric tasks and on the basis of diverse corpora. In most of the case studies the presented method can be compared with publicly available performance figures of previous research. The high performance of modern machine learning methods is reproduced by the considerably simpler algorithm developed in this thesis. While the segmentation into morphemes is a local process, stylometry consists in the global comparison of texts. For this reason investigating of these two seemingly unconnected problems offers complementary perspectives on the explored frequency data. The discussion of the recieved litarature concerning both subjects additionally shows their connectedness by related concepts and approaches. It can be deduced from the totality of the empirical studies on text segmentation and stylometry conducted in this thesis that the long and rare character sequences contain considerably more information then assumed in previous research.
Keyword: 430 Deutsch; 53 Deutsche Sprach- und Literaturwissenschaft; complete substring frequency distributions; ddc:430; ES 965; generalisierte lineare gemischte Modelle; generalized linear mixed models; linear mixed models; lineare gemischte Modelle; logarithmic transformation; logarithmische Transformation; Morphological Induction; Morphologische Induktion; Stilometrie; Stylometry; Vollständige Zeichenkettenfrequenzverteilungen
URN: urn:nbn:de:kobv:11-100213989
URL: http://edoc.hu-berlin.de/18452/17519
https://doi.org/10.18452/16867
BASE
Hide details
14
Stylometry and the interplay of topic and L1 in the different annotation layers in the FALKO corpus
Golcher, Felix [Verfasser]; Reznicek, Marc [Verfasser]. - Berlin : Humboldt-Universität zu Berlin, 2011
DNB Subject Category Language
Show details
15
Stylometry and the interplay of topic and L1 in the different annotation layers in the FALKO corpus ...
Golcher, Felix; Reznicek, Marc. - : Humboldt-Universität zu Berlin, 2011
BASE
Show details
16
Stylometry and the interplay of topic and L1 in the different annotation layers in the FALKO corpus
Reznicek, Marc; Golcher, Felix. - : Humboldt-Universität zu Berlin, 2011
BASE
Show details

Catalogues
0
0
0
0
4
0
1
Bibliographies
0
0
1
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
10
0
0
1
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern