DINI e.V.
DINI e.V.
               

DINI / Projekte / OA-Statistik / Die Technik

Die Technik

Wie funktioniert OA-Statistik?

Für das Erfassen, den Austausch, die Aggregation und das Bereitstellen von Nutzungsstatistiken für digitale Objekte ist eine technische Infrastruktur notwendig. Die OA-Statistik-Infrastruktur besteht aus zwei Kernkomponenten: Auf der Seite des jeweiligen Repositoriums ist der OA-Statistik-Data-Provider (OAS-Data-Provider) installiert. Dieser wird durch den Betreiber des Repositoriums bereitgestellt. Zur Installation kann die Software von OA-Statistik genutzt werden, die im Anschluss an die spezifischen Anforderungen des eigenen Repositoriums angepasst werden muss. Auf der anderen Seite steht der OA-Statistik-Service-Provider (OAS-Service-Provider), der zentral beim Dienstanbieter läuft.

Nutzer eines Repositoriums lädt ein Dokument vom Repositorium herunter
Fordert ein Nutzer eines Repositoriums ein Dokument an, so überträgt sein Browser automatisch Daten wie seinen Useragent (inkl. Browserversion und Betriebssystem), ACCEPT-Header, bevorzugte Sprachen, Protokollversion, eigene IP-Adresse und den Namen des angeforderten Dokuments.

Repositorium speichert die Zugriffsinformationen in Logfiles

Die Zugriffe auf die Dokumente eines Repositoriums werden in Logfiles des Webservers aufgezeichnet. Aus Datenschutzrechtlichen Gründen wird vom Repositorium die Möglichkeit eines Opt-Out angeboten. Wird dieser vom Nutzer gewählt, gelangt seine IP-Adresse nicht in die Logfiles und wird dementsprechend nicht verarbeitet.

OAS-Data-Provider erfasst die Zugriffsinformationen der Logfiles und pseudonymisiert die Nutzeridentifikationen

In Deutschland ist die Speicherung von IP-Adressen, die zur Nutzeridentifikation dienen, aus Datenschutzgründen nicht abschließend geklärt. Daher werden die IP-Adressen, die bei der Dokumentennutzung Einträge in den Logfiles hinterlassen, mit einem Salt versehen und anschließend mit dem Hashverfahren SHA-256 verschlüsselt. Dieses Vorgehen dient der Pseudonymisierung und damit der Identifikation der von einer IP-Adresse erfolgten Nutzungsmuster, ohne die IP bei der Datenverarbeitung zu verwenden. Der Salt ist eine weitere Schutzmaßnahme zur Verhinderung der Rückübersetzung des Hashwertes.
Für eine spätere Berücksichtigung von Roboterzugriffen und zur Auswertung der Daten wird zusätzlich auch das C-Klasse-Netz der IP-Adresse (die ersten drei der vier Zahlen der IP-Adresse) gesalzen und gehasht.

OAS-Data-Provider verarbeitet die Zugriffsinformationen und transformiert sie in ein XML-Format, wobei eindeutige Dokument-Identifier hinzugefügt werden
Beim OAS-Data-Provider werden im Logfile-Parser die Logfiles des Webservers in OpenURL Context­Objects umgewandelt und im Datenformat XML gespeichert.
Den Informationen aus den Logfiles muss ein Identifier des jeweiligen Dokuments mitgegeben werden. In den meisten Fällen erfolgt das auf Grundlage der abgerufenen URL oder der individuellen Identifikationsnummer des Repositoriums. Dies funktioniert für alle Repositorien unterschiedlich und muss bei der Installation im LogfileParser des OAS-Data-Providers angepasst werden.
Das Datenformat OpenURL ContextObjects wurde von OA-Statistik angepasst, mit anderen europäischen Projekten abgestimmt und dokumentiert. Es ist komplexer als das Minimalset von OpenURL ContextObjects, aber vollständig kompatibel.

OAS-Data-Provider stellt die Zugriffsinformationen mittels OAI-Schnittstelle bereit
Der OAS-Data-Provider liest die OpenURL Context­Objects aus einer Datenbank und stellt sie über das OAI-Protokoll dem OAS-Service-Provider zur Verfügung. Der OAS-Data-Provider ist ein eigenständiges Programm, welcher sich von anderen OAI-Data-Providern unterscheidet und seperat installiert werden muss.

OAS-Service-Provider ruft die anonymisierten Zugriffsinformationen mittels OAI-Schnittstelle ab
Der OAS-Service-Provider holt die Daten vom OAS-Data-Provider mittels einer OAI-Schnittstelle. Im Anschluss müssen die Daten aus Datenschutzgründen auf dem OAS-Data-Provider gelöscht werden.

OAS-Service-Provider bereitet die Zugriffsinformationen nach internationalen Standards auf

Die Zugriffsinformationen werden nach dem Standard COUNTER ausgewertet. Dazu werden Doppelklicks von Nutzern sowie Roboterzugriffe herausgefiltert.

OAS-Service-Provider stellt die aggregierten und standardisierten Nutzungsdaten bereit
Die Nutzungsdaten werden dem Repositorium und weiteren Interessierten nach den Lizenzvorgaben bereitgestellt. Die Schnittstelle und das Format werden zuvor gemeinsam mit den Repositorienbetreibern festgelegt.

Repositorium stellt die international standardisierten Zugriffsstatistiken zur Verfügung
Den teilnehmenden Repositorien werden für die einzelnen Dokumente tagesgenaue Zugriffszahlen bereitgestellt. Dies können zum einen gesamte Auszüge aus der Datenbank des OAS-Service-Providers sein, die über eine Schnittstelle abrufbar sind. Zum anderen wird von OA-Statistik ein iFrame angeboten, das in das Repositorium eingebunden werden kann. In diesem Fall muss der Identifier des Dokuments als Parameter mitgegeben werden.