2 |
Automatic music analysis and "Musée de l'Homme" sound archives ; L'analyse automatique de la musique et les archives sonores du "Musée de l'Homme"
|
|
|
|
In: Analytical Approaches To World Music 2020-2021 ; https://halshs.archives-ouvertes.fr/halshs-03472999 ; Analytical Approaches To World Music 2020-2021, Jun 2021, Paris, France. 2021 (2021)
|
|
BASE
|
|
Show details
|
|
3 |
Automatic music analysis and "Musée de l'Homme" sound archives ; L'analyse automatique de la musique et les archives sonores du "Musée de l'Homme"
|
|
|
|
In: Analytical Approaches To World Music ; https://halshs.archives-ouvertes.fr/halshs-03472999 ; Analytical Approaches To World Music, Jun 2021, Paris, France. 2021 (2021)
|
|
BASE
|
|
Show details
|
|
11 |
ANNIS: A graph-based query system for deeply annotated text corpora ...
|
|
|
|
BASE
|
|
Show details
|
|
12 |
ANNIS: A graph-based query system for deeply annotated text corpora
|
|
|
|
Abstract:
Diese Dissertation beschreibt das Design und die Implementierung eines effizienten Suchsystems für linguistische Korpora. Das bestehende und auf einer relationalen Datenbank basierende System ANNIS ist spezialisiert darin, Korpora mit verschiedenen Arten von Annotationen zu unterstützen und nutzt Graphen als einheitliche Repräsentation der verschiedener Annotationen. Für diese Dissertation wurde eine Hauptspeicher-Datenbank, die rein auf Graphen basiert, als Nachfolger für ANNIS entwickelt. Die Korpora werden in Kantenkomponenten partitioniert und für verschiedene Typen von Subgraphen werden unterschiedliche Implementationen zur Darstellung und Suche in diesen Komponenten genutzt. Operationen der Anfragesprache AQL (ANNIS Query Language) werden als Kombination von Erreichbarkeitsanfragen auf diesen verschiedenen Komponenten implementiert und jede Implementierung hat optimierte Funktionen für diese Art von Anfragen. Dieser Ansatz nutzt die verschiedenen Strukturen der unterschiedlichen Annotationsarten aus, ohne die einheitliche Darstellung als Graph zu verlieren. Zusätzliche Optimierungen, wie die parallele Ausführung von Teilen der Anfragen, wurden ebenfalls implementiert und evaluiert. Da AQL eine bestehende Implementierung besitzt und diese für Forscher offen als webbasierter Service zu Verfügung steht, konnten echte AQL-Anfragen aufgenommen werden. Diese dienten als Grundlage für einen Benchmark der neuen Implementierung. Mehr als 4000 Anfragen über 18 Korpora wurden zu einem realistischen Workload zusammengetragen, der sehr unterschiedliche Arten von Korpora und Anfragen mit einem breitem Spektrum von Komplexität enthält. Die neue graphbasierte Implementierung wurde mit der existierenden, die eine relationale Datenbank nutzt, verglichen. Sie führt den Anfragen im Workload im Vergleich ~10 schneller aus und die Experimente zeigen auch, dass die verschiedenen Implementierungen für die Kantenkomponenten daran einen großen Anteil haben. ; This dissertation describes the design and implementation of an efficient system for linguistic corpus queries. The existing system ANNIS is based on a relational database and is focused on providing support for corpora with very different kinds of annotations and uses graphs as unified representations of the different annotations. For this dissertation, a main memory and solely graph-based successor of ANNIS has been developed. Corpora are divided into edge components and different implementations for representation and search of these components are used for different types of subgraphs. AQL operations are interpreted as a set of reachability queries on the different components and each component implementation has optimized functions for this type of queries. This approach allows exploiting the different structures of the different kinds of annotations without losing the common representation as a graph. Additional optimizations, like parallel executions of parts of the query, are also implemented and evaluated. Since AQL has an existing implementation and is already provided as a web-based service for researchers, real-life AQL queries have been recorded and thus can be used as a base for benchmarking the new implementation. More than 4000 queries from 18 corpora (from which most are available under an open-access license) have been compiled into a realistic workload that includes very different types of corpora and queries with a wide range of complexity. The new graph-based implementation was compared against the existing one, which uses a relational database. It executes the workload ~10 faster than the baseline and experiments show that the different graph storage implementations had a major effect in this improvement.
|
|
Keyword:
004 Datenverarbeitung; Corpus linguistics; ddc:004; Graph database; Graphdatenbank; Hauptspeicher-Datenbank; In-memory database; Informatik; Korpuslinguistik; Search engine; ST 306; Suchmaschine
|
|
URN:
urn:nbn:de:kobv:11-110-18452/20436-5
|
|
URL: https://doi.org/10.18452/19659 http://edoc.hu-berlin.de/18452/20436
|
|
BASE
|
|
Hide details
|
|
13 |
Query Flattening and the Nested Data Parallelism Paradigm ...
|
|
|
|
BASE
|
|
Show details
|
|
14 |
AMEND: open source and data-driven oversight of water quality in New England
|
|
|
|
In: Media and Communication ; 7 ; 3 ; 91-103 ; civic organizations in an age of distrust (2019)
|
|
BASE
|
|
Show details
|
|
15 |
The Manifesto Corpus: a new resource for research on political parties and quantitative text analysis
|
|
|
|
In: Research and Politics ; 3 ; 2 ; 1-8 (2019)
|
|
BASE
|
|
Show details
|
|
16 |
Wörterbücher zur Sprach- und Kommunikationswissenschaft (WSK) Online
|
|
|
|
BASE
|
|
Show details
|
|
17 |
On the way to the problem of "Semantic Web – Data Base" ; На пути к решению проблемы "Semantic Web – Data Base" ; На шляху до вирішення проблеми "Semantic Web – Data Base"
|
|
|
|
In: Системні дослідження та інформаційні технології; № 2 (2019); 115-140 ; Системные исследования и информационные технологии; № 2 (2019); 115-140 ; System research and information technologies; № 2 (2019); 115-140 ; 2308-8893 ; 1681-6048 (2019)
|
|
BASE
|
|
Show details
|
|
19 |
A Frame-semantic Approach to Co-occurrence Patterns: A Lexicographic Study of English and Greek Motion Verbs
|
|
|
|
In: International Journal of Lexicography 31 (2018) 4, 420-451
|
|
IDS OBELEX meta
|
|
Show details
|
|
20 |
Corpus-driven Bantu Lexicography Part 1: Organic Corpus Building for Lusoga
|
|
|
|
In: Lexikos. Journal of the African Association for Lexicography 28 (2018), 32-78
|
|
IDS OBELEX meta
|
|
Show details
|
|
|
|