DE eng

Search in the Catalogues and Directories

Hits 1 – 14 of 14

1
How to improve robustness in Kohonen maps and display additional information in Factorial Analysis: application to text mining
In: ISSN: 0925-2312 ; Neurocomputing ; https://hal.archives-ouvertes.fr/hal-01168120 ; Neurocomputing, Elsevier, 2014, 147, pp.120-135. ⟨10.1016/j.neucom.2013.12.057⟩ (2014)
BASE
Show details
2
Mesurer la similarité structurelle entre réseaux lexicaux
In: TALN-20 2014 ; https://hal.archives-ouvertes.fr/hal-01321990 ; TALN-20 2014, Jul 2014, Marseille, France (2014)
BASE
Show details
3
Yet Another Ranking Function for Automatic Multiword Term Extraction
In: 9th International Conference on Natural Language Processing (PolTAL) ; https://hal-lirmm.ccsd.cnrs.fr/lirmm-01068556 ; 9th International Conference on Natural Language Processing (PolTAL), Sep 2014, Warsaw, Poland. pp.52-64, ⟨10.1007/978-3-319-10888-9_6⟩ ; http://poltal.ipipan.waw.pl/ (2014)
BASE
Show details
4
Natural Language Semantics in Biproduct Dagger Categories
In: ISSN: 1570-8683 ; Journal of Applied Logic ; https://hal-lirmm.ccsd.cnrs.fr/lirmm-00860382 ; Journal of Applied Logic, Elsevier, 2014, 12, pp.88-108. ⟨10.1016/j.jal.2013.08.001⟩ (2014)
BASE
Show details
5
Supervised and semi-supervised statistical models for word-based sentiment analysis ... : Überwachte und halbüberwachte statistische Modelle zur wortbasierten Sentimentanalyse ...
Scheible, Christian. - : Universität Stuttgart, 2014
BASE
Show details
6
Products And Eccentric Diagraphs ...
BASE
Show details
7
Graph Analyzer Widget Closer to Agility through Sense-Making
In: DTIC (2014)
BASE
Show details
8
An Annotation Framework for Dense Event Ordering
In: DTIC (2014)
BASE
Show details
9
The Shortlist Method for Fast Computation of the Earth Mover's Distance and Finding Optimal Solutions to Transportation Problems.
BASE
Show details
10
Gromov hiperbolicity in graphs
BASE
Show details
11
Supervised and semi-supervised statistical models for word-based sentiment analysis ; Überwachte und halbüberwachte statistische Modelle zur wortbasierten Sentimentanalyse
Abstract: Ever since its inception, sentiment analysis has relied heavily on methods that use words as their basic unit. Even today, such methods deliver top performance. This way of representing data for sentiment analysis is known as the clue model. It offers practical advantages over more sophisticated approaches: It is easy to implement and statistical models can be trained efficiently even on large datasets. However, the clue model also has notable shortcomings. First, clues are highly redundant across examples, and thus training based on annotated data is potentially inefficient. Second, clues are treated context-insensitively, i.e., the sentiment expressed by a clue is assumed to be the same regardless of context. In this thesis, we address these shortcomings. We propose two approaches to reduce redundancy: First, we use active learning, a method for automatic data selection guided by the statistical model to be trained. We show that active learning can speed up the training process for document classification significantly, reducing clue redundancy. Second, we present a graph-based approach that uses annotated clue types rather than annotated documents which contain clue instances. We show that using a random-walk model, we can train a highly accurate document classifier. We next investigate the context-dependency of clues. We first introduce sentiment relevance, a novel concept that aims at identifying content that contributes to the overall sentiment of the review. We show that even when we have no annotated sentiment relevance data available, a high-accuracy sentiment relevance classifier can be trained using transfer learning and distant supervision. Second, we perform linguistically motivated analysis and simplification of a compositional sentiment analysis. We find that the model captures linguistic structures poorly. Further, it can be simplified without any loss of accuracy. ; Eine der frühesten Methoden zur automatischen Sentimentanalyse nutzt Merkmalsrepräsentationen, die auf Wortvorkommen beruhen. Dieser Ansatz zur Datenrepräsentation ist der unter dem Namen Clue-Modell bekannt, da die Terme in einer größeren Spracheinheit Schlüsselwörter (Clues) für deren Sentiment sind. Das Clue-Modell ist noch immer einer der beliebtesten und erfolgreichsten Ansätze, da es einige praktische Vorteile gegenüber anderen Verfahren bietet: Es ist einfach zu implementieren und statistische Modelle sind mit einer solchen Repräsentation auch auf großen Datensätzen effizient trainierbar. Allerdings hat das Modell auch Nachteile. Erstens treten Schlüsselwörter redundant auf und kommen in vielen Trainingsbeispielen vor, so dass überwachtes Lernen ineffizient sein kann. Zweitens werden Schlüsselwörter kontextunabhängig behandelt, d.h., das durch einen Begriff ausgedrückte Sentiment ist unabhängig vom Kontext immer gleich. In dieser Dissertation stellen wir Lösungsansätze für diese beiden Nachteile vor. Um Redundanz zu vermeiden, verwenden wir zunächst Active Learning, eine Methode des maschinellen Lernens, bei der das statistische Modell die Auswahl der Trainingsbeispiele vornimmt. Unsere Ergebnisse zeigen, dass wir durch Active Learning gleiche Klassifikationsgenauigkeit bei reduzierten Kosten erreichen, indem wir Redundanz zwischen Dokumenten vermeiden. Ein weiterer Ansatz zur Vermeidung von Redundanz beruht darauf, die Schlüsselwörter direkt zu annotieren. Annotierte Schlüsselwörter werden dann in einem graphbasierten Modell zur Dokumentenklassifikation verwendet. Wir zeigen, dass ein Random-Walk-Modell Dokumente mit hoher Genauigkeit klassifizieren kann. Um die Kontextabhängigkeit von Inhalten zu bestimmen, führen wir die Idee der Sentiment-Relevanz ein. Als sentiment-relevant bezeichnen wir Inhalt, der zum Gesamtsentiment eines Dokuments beiträgt. Wir zeigen, dass wir selbst ohne annotierte Sentiment-Relevanz-Daten mit hoher Genauigkeit sentiment-relevanten Inhalt erkennen können. Dazu nutzen wir zwei Techniken des maschinellen Lernens: Transfer Learning und Distant Supervision. Zum Schluss untersuchen wir ein kompositionelles Modell zur Sentimentanalyse auf seine linguistischen Eigenschaften. Wir zeigen, dass das Modell nur schlecht linguistische Struktur erkennt. Zudem kann das Modell ohne Genauigkeitsverlust stark vereinfacht werden.
Keyword: 004; Automatische Klassifikation; Computerlinguistik; Document Classification; Graphen; Graphs; Machine Learning; Maschinelle Sprachverarbeitung; Maschinelles Lernen; Natural Language Processing; Neuronale Netze; Sentiment Analysis; Sentimentanalyse; Sprachverarbeitung; Teilüberwachtes Lernen
URL: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-95397
https://doi.org/10.18419/opus-3404
http://elib.uni-stuttgart.de/handle/11682/3421
BASE
Hide details
12
Specifying and verifying program transformations with PTRANS
Mansky, William. - 2014
BASE
Show details
13
Construction of an ontology for intelligent Arabic QA systems leveraging the Conceptual Graphs representation
BASE
Show details
14
Detección de plagio translingüe utilizando una red semántica multilingüe
Franco Salvador, Marc. - : Universitat Politècnica de València, 2014
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
14
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern