Würz M (2025)
Publication Language: German
Publication Type: Other publication type
Publication year: 2025
Series: Berichte aus den DH-Förderprogrammen der Deutschen Nationalbibliothek
URI: https://d-nb.info/1384378278/34
Die vorliegende Forschungsstudie untersucht, inwiefern sich der bibliografische Gesamtbestand der Deutschen Nationalbibliothek (DNB) als Ausgangspunkt eines Prozesses zur Identifikation, Extraktion und Weiterverarbeitung gattungsspezifischer Metadaten eignet. Unter Einbezug des Fallbeispiels der ›kurzen Erzählformen‹ wurde die Maßgabe formuliert, möglichst alle genuin deutschsprachigen Titel, die kurze narrative Prosagattungen enthalten und in einem bestimmten Beobachtungszeitraum (2008-2023) publiziert wurden zu identifizieren, die dazugehörigen Metadaten in einer festgelegten Form zu exportieren und in ein differentes Zielsystem (postgreSQL-Datenbank) zu integrieren. Der herausgearbeitete, technisch dokumentierte Arbeitsprozess umfasst im Wesentlichen drei Schritte: die Identifikation und Extraktion, die Bereinigung sowie die Anreicherung mit anschließendem Import der relevanten Datensätze. Im Zuge der Identifikation und Extraktion geraten verschiedene Online-Schnittstellen und Exportformate in den Fokus, wobei der Bezug gattungsspezifischer Metadaten im Export-format MARC21-xml über die SRU-Schnittstelle als besonders nutzbringend erkannt wurde. Die Bereinigung widmet sich notwendigen formalen und inhaltlichen Anpassungen der exportierten Metadaten. Über die Kodierung und Ausführung mehrerer Python-Skripte werden die einzelnen Bereini-gungsschritte umgesetzt und die dabei entfernten Datensätze zur weiteren Reflexion technisch in Exporttabellen dokumentiert. Wie sich zeigt, haben die von der DNB genutzten Gattungsbegriffe einen hohen Mehrwert als Instrument zur gattungsbezogenen Filterung, auch wenn aufgrund der abweichenden Konkretheit zwischen bibliografischer Klassifizierung und dem literaturwissenschaftlichen Gattungsverständnis manuelle Nacharbeiten erforderlich sein können. Im letzten Prozessschritt werden die in den bereinigten Metadaten enthaltenen Personen- und Körperschaftsnamen mit den Normdaten der GND abgeglichen, mit weiteren Daten angereichert und in das Zielsystem importiert. Abschließend erfolgt eine Generalisierung der im Zuge der Prozessreflexion erarbeiteten Erkenntnisse.
APA:
Würz, M. (2025). Gattungsspezifische Metadaten identifizieren, extrahieren und weiterverarbeiten: Der bibliografische Gesamtbestand der DNB als Datenquelle am Beispiel der ›kurzen Erzählformen‹.
MLA:
Würz, Maximilian. Gattungsspezifische Metadaten identifizieren, extrahieren und weiterverarbeiten: Der bibliografische Gesamtbestand der DNB als Datenquelle am Beispiel der ›kurzen Erzählformen‹. 2025.
BibTeX: Download