DE eng

Search in the Catalogues and Directories

Hits 1 – 15 of 15

1
Can we predict new facts with open knowledge graph embeddings? A benchmark for open link prediction
Gashteovski, Kiril; Gemulla, Rainer; Wang, Yanjie. - : Association for Computational Linguistics, 2020
BASE
Show details
2
LibKGE – A knowledge graph embedding library for reproducible research
Broscheit, Samuel; Ruffinelli, Daniel; Kochsiek, Adrian. - : Association for Computational Linguistics (ACL), 2020
BASE
Show details
3
On aligning OpenIE extractions with Knowledge Bases: A case study
Gashteovski, Kiril; Gemulla, Rainer; Kotnis, Bhushan. - : Association for Computational Linguistics (ACL), 2020
BASE
Show details
4
OPIEC: An open information extraction corpus
Gashteovski, Kiril [Verfasser]; Wanner, Sebastian [Verfasser]; Hertling, Sven [Verfasser]. - Mannheim : Universitätsbibliothek Mannheim, 2019
DNB Subject Category Language
Show details
5
OPIEC: An open information extraction corpus
BASE
Show details
6
On evaluating embedding models for knowledge base completion
Gemulla, Rainer; Wang, Yanjie; Broscheit, Samuel. - : Association for Computational Linguistics, 2019
BASE
Show details
7
A neural autoencoder approach for document ranking and query refinement in pharmacogenomic information retrieval
Broscheit, Samuel; Pfeiffer, Jonas; Gemulla, Rainer. - : Association for Computational Linguistics, 2018
BASE
Show details
8
Learning distributional token representations from visual features
Gemulla, Rainer; Broscheit, Samuel; Keuper, Margret. - : Association for Computational Linguistics, 2018
BASE
Show details
9
MinIE: minimizing facts in open information extraction
Corro, Luciano del; Gashteovski, Kiril; Gemulla, Rainer. - : Association for Computational Linguistics, 2017
BASE
Show details
10
Methods for open information extraction and sense disambiguation on natural language text ; Methoden der Offenen Informationsextraktion und Bedeutungsdisambiguierung in Texten
Abstract: Natural language text has been the main and most comprehensive way of expressing and storing knowledge. A long standing goal in computer science is to develop systems that automatically understand textual data, making this knowledge accessible to computers and humans alike. We conceive automatic text understanding as a bottom-up approach, in which a series of interleaved tasks build upon each other. Each task achieves more understanding over the text than the previous one. In this regard, we present three methods that aim to contribute to the primary stages of this setting. Our first contribution, ClausIE, is an open information extraction method intended to recognize textual expressions of potential facts in text (e.g. “Dante wrote the Divine Comedy”) and represent them with an amenable structure for computers [(“Dante”, “wrote”, “the Divine Comedy”)]. Unlike previous approaches, ClausIE separates the recognition of the information from its representation, a process that understands the former as universal (i.e., domain-independent) and the later as application-dependent. ClausIE is a principled method that relies on properties of the English language and thereby avoids the use of manually or automatically generated training data. Once the information in text has been correctly identified, probably the most important element in a structured fact is the relation which links its arguments, a relation whose main component is usually a verbal phrase. Our second contribution, Werdy, is a word entry recognition and disambiguation method. It aims to recognize words or multi-word expressions (e.g., “Divine Comedy” is a multi-word expression) in a fact and disambiguate verbs (e.g., what does “write” mean?). Werdy is also an unsupervised approach, mainly relying on the syntactic and semantic relation established between a verb sense and its arguments. The other key components in a structured fact are the named entities (e.g., “Dante”) that often appear in the arguments. FINET, our last contribution, is a named entity typing method. It aims to understand the types or classes of those names entities (e.g., “Dante” refers to a writer). FINET is focused on typing named entities in short inputs (like facts). Unlike previous systems, it is designed to find the types that match the entity mention context (e.g., the fact in which it appears). It uses the most comprehensive type system of any entity typing method to date with more than 16k classes for persons, organizations and locations. These contributions are intended to constitute constructive building blocks for deeper understanding tasks in a bottom-up automatic text understanding setting. ; Das Schreiben von Texten ist die wichtigste und reichhaltigste Art und Weise, Wissen aus- zudrücken und zu speichern. Schon lange verfolgt die Informatik das Ziel, Systeme zu entwickeln, die Texte automatisch verstehen, um dieses Wissen sowohl Maschinen als auch Menschen zugänglich zu machen. In dieser Arbeit verstehen wir das Automatische Textver- stehen als bottom-up Aufgabe, in der eine Reihe ineinandergreifender Bausteine aufeinander aufbauen. Jeder Baustein erlangt dabei ein tieferes Textverständnis als der vorhergehende. In diesem Sinne präsentieren wir drei Methoden, die alle zu den fundamentalen Stufen dieses Prozesses beizutragen. Unser erster Beitrag, ClausIE, ist eine Methode der Offenen Informationsextraktion, die textuelle Ausdrücke von Faktekandidaten (z.B. “Dante schrieb die Göttliche Kommödie”) erkennt, und diese in einer maschinenlesbaren Struktur repräsentiert [(“Dante”, “schrieb”, “die Göttliche Kommödie”)]. Im Gegensatz zu vorherigen Ansätzen trennt ClausIE die Erkennung der faktischen Information von der Repräsentation, in einem Prozess der ersters als universell (d.h. domänenunabhängig), letzteres als streng anwendungsabhängig versteht. ClausIE löst diese Aufgabe in einer grundsätzlichen, auf den Prinzipien der englischen Sprache aufbauenden Weise und vermeidet damit den Gebrauch manueller oder automatisch generierter Trainingsdaten. Wurde diese Art der Information korrekt identifiziert, ist das wahrscheinlich wich- tigste Element eines strukturierten Fakts die Relation, welche die verschiedenen Argu- mente miteinander verbindet. Hauptbestandteil einer solchen Relation ist üblicherweise eine Verbalphrase. Unser zweiter Beitrag, Werdy, ist eine Worteintrag-Erkennungs und -Disambiguierungsmethode. Es erkennt Wörter oder Mehrwortausdrücke (z.B. ist die “Göttli- che Kommdödie” ein Mehrwortausdruck) in einem Fakt und disambiguiert Verben (z.B. was “schreiben” bedeutet). Werdy ist auch ein nichtüberwachtes Verfahren, das hauptsächlich auf der semantischen Beziehung zwischen einer Verbbedeutung und dessen Argumenten beruht. Die anderen Schlüsselkomponenten eines strukturierten Fakts sind Eigennamen (z.B. “Dante”), die häufig als Argument auftreten. FINET, unser letzer Beitrag, ist eine Methode zur Typisierung von Eigennamen. Sie versteht die Typen oder Klassen solcher Eigennamen (z.B. ist “Dante” ein “Schriftsteller”). FINETs Fokus ist die Typisierung von Eigennamen in kurzen Eingaben, beispielsweise Fakten. Im Gegensatz zu vorherigen Systemen ist es so konzipiert, dass es Typen findet, die dem Kontext der Eigennamen entspricht (z.B. dem Fakt in dem er auftritt). FINET verwendet mit mehr als 16.000 Typen für Personen, Organisationen und Orten das reichhaltigste Typsystem aller bisherigen Typisierungsmethoden. Alle Beiträge stellen Bausteine für das tiefere Verständnis in einem bottom-up Verfahren zum automatischen Textverstehen dar.
Keyword: automatic text understanding; ddc:004; Information Extraction; machine reading; named entity tTyping; Natürliche Sprache; open information extraction; Textverstehendes System; word sense disambiguation
URL: https://doi.org/10.22028/D291-26641
http://nbn-resolving.org/urn:nbn:de:bsz:291-scidok-63465
BASE
Hide details
11
FINET: context-aware fine-grained named entity typing
Abujabal, Abdalghani; Corro, Luciano del; Gemulla, Rainer. - : Assoc. for Computational Linguistics, 2015
BASE
Show details
12
CORE: Context-aware open relation extraction with factorization machines
Corro, Luciano del; Petroni, Fabio; Gemulla, Rainer. - : Assoc. for Computational Linguistics, 2015
BASE
Show details
13
Werdy: Recognition and disambiguation of verbs and verb phrases with syntactic and semantic pruning
Corro, Luciano del [Verfasser]; Gemulla, Rainer [Verfasser]; Weikum, Gerhard [Verfasser]. - Mannheim : Universitätsbibliothek Mannheim, 2014
DNB Subject Category Language
Show details
14
Senti-LSSVM: Sentiment-oriented multi-relation extraction with latent structural SVM
Weikum, Gerhard; Gemulla, Rainer; Zhang, Yi. - : Assoc. for Computational Linguistics, 2014
BASE
Show details
15
Werdy: Recognition and disambiguation of verbs and verb phrases with syntactic and semantic pruning
Corro, Luciano del; Gemulla, Rainer; Weikum, Gerhard. - : Assoc. for Computational Linguistics, 2014
BASE
Show details

Catalogues
0
0
0
0
2
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
13
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern