Zum Hauptinhalt springen

Abgleich und Anreicherung eigener Datenbestände mit der Gemeinsamen Normdatei in OpenRefine

Am 7.10.2021 findet von 12:30-16:00 Uhr der Workshop "Abgleich und Anreicherung eigener Datenbestände mit der Gemeinsamen Normdatei in OpenRefine" der DINI-AG Kompetenzzentrum Interoperable Metadaten (KIM) online statt.

Dieser Workshop führt in den Abgleich und die Anreicherung eigener Datenbestände mit der Gemeinsamen Normdatei (GND) ein. Dazu verwenden wir das verbreitete tabellenorientierte Open-Source-Werkzeug OpenRefine.

Als generisches Werkzeug zur Bereinigung und Transformation von Daten ermöglicht OpenRefine auch die Verknüpfung mit verschiedenen Normdatenquellen und die darauf folgende Anreicherung aus den verknüpften Normdaten. Voraussetzung dafür ist eine datenspezifische Implementierung des offenen, von OpenRefine verwendeten Reconciliation-Protokolls. Einen solchen Dienst für die GND stellt lobid-gnd mit seinen offenen Programmierschnittstellen (APIs) bereit: https://lobid.org/gnd/reconcile

Der Workshop beginnt mit einem Überblick zu den Datenquellen und der Rechercheoberfläche von lobid-gnd. Die Oberfläche dient uns zum Erkunden der Daten, deren Verständnis eine wichtige Grundlage für einen erfolgreichen Abgleich darstellt. Im Anschluss werden wir in praktischen Übungen zunächst das grundsätzliche Vorgehen beim Datenabgleich in OpenRefine kennenlernen, sowie die Anreicherung auf Basis der abgeglichenen GND-Einträge. Schließlich werden wir anhand konkreter Anwendungfälle verschiedene Strategien zur Verbesserung der Qualität des Abgleichs ausprobieren, insbesondere bei der Verwendung zusätzlicher lokaler Daten zur Disambiguierung (z.B. Lebensdaten und Berufe).

Workshopleitung: Fabian Steeg, Adrian Pohl

Zielgruppe: Menschen, etwa in Bibliotheken, Archiven, Museen oder in den Digital Humanities, die ihre Daten mit der GND verknüpfen möchten.

Vorbereitung: Für den Workshop sollten Teilnehmer*innen eine lokale Installation von OpenRefine haben: https://openrefine.org/download.html

Max. Teilnehmer*innenzahl: 40