1 |
Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora ...
|
|
|
|
Abstract:
Die Korpuserstellung ist einer der essenziellsten Schritte um ein Forschungsvorhaben im Bereich der Digital Humanities durchzuführen. Vor allem für speziellere Domänen (etwa bei der Analyse von Subgenres oder Dialekten) ist allerdings häufig nicht genügend Material verfügbar, um Methoden aus dem NLP Bereich nachnutzen zu können, da diese Gigabytes an Text verlangen. Dieser Aufsatz zeigt wie Wissensgraphen, welche zum Beispiel aus Wörterbüchern erstellt werden können, helfen, kleinere Textkorpora aufzuwerten. In dem hier durchgeführten Experiment wird ein auf 20 Megabytes trainiertes FastText Modell mit den Informationen aus GermaNet angereichert. Das resultierende Modell weist die selbe Performanz auf wie ein einfaches FastText Modell, welches auf etwa dreimal soviel Daten trainiert wurde. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses. ...
|
|
Keyword:
Bewertung; DHd2022; Knowledge Graphen; Korpuserstellung; Methoden; Modellierung; Text; Word Embeddings
|
|
URL: https://dx.doi.org/10.5281/zenodo.6328009 https://zenodo.org/record/6328009
|
|
BASE
|
|
Hide details
|
|
2 |
Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora ...
|
|
|
|
BASE
|
|
Show details
|
|
4 |
Twenty-two historical encyclopedias encoded in TEI: a new resource for the Digital Humanities [Online resource]
|
|
|
|
IDS-Repository
|
|
Show details
|
|
|
|