Am 25. September 2012 trafen sich Vertreter aus Bayern, Bremen, Berlin, Baden-Württemberg und Hamburg als auch vom PortalU und von GDI-DE an unserem Institut Fraunhofer FOKUS in Berlin, um mit uns über die Metadaten-Struktur für OGDP zu diskutieren. Zudem wurde besprochen, wie bestehende Datenangebote in die OGDP überführt werden können.

Unter Harvesting versteht man das Zusammenführen von Metadaten aus verschiedenen Katalogen. Im Rahmen der OGPD werden die Metadaten der genannten Workshop-Teilnehmer sowie von DESTATIS geharvestet, insoweit sie den Minimalkriterien für Open Data entsprechen: Es werden nur solche Datensätze, Dokumente oder Applikationen übernommen, die eine frei zugängliche elektronische Ressource, eine Beschreibung und eine wohl definierte Lizenz haben.

Dazu habe ich die vorgeschlagene Metadatenstruktur erläutert. Sie wurde insbesondere bzgl. eindeutiger Bezeichner zur eindeutigen Rückverfolgung der Herkunft und zur Erkennung von Dubletten, des Umgangs mit Kontaktangaben, der Erkennung offener Lizenzen als auch der geographischen Abdeckung nachjustiert. Zudem wurden die Hauptkategorien zur Einordnung der Datensätze, Dokumente und Applikationen diskutiert und in die folgenden 14 Hauptkategorien zusammengefasst:

  • Wirtschaft und Arbeit
  • Transport und Verkehr
  • Umwelt und Klima
  • Geographie, Geologie und Geobasisdaten
  • Gesundheit
  • Verbraucherschutz
  • Infrastruktur, Bauen und Wohnen
  • Bildung und Wissenschaft
  • Öffentliche Verwaltung, Haushalt und Steuern
  • Gesetze und Justiz
  • Soziales
  • Kultur, Freizeit, Sport und Tourismus
  • Bevölkerung
  • Politik und Wahlen

Diese Hauptkategorien dienen der prinzipiellen Einordnung und werden um spezifische, beispielsweise fachspezifische, Unterkategorien ergänzt. Für das Harvesten werden bestehende Kategorisierungen wie beispielsweise in INSPIRE oder EVAS auf diese 14 Kategorien abgebildet.

Nach Klärung der Metadaten-Struktur als Zielstruktur für bereitzustellende Daten, Dokumente und Applikationen wurden verschiedene Wege zur Bereitstellung/Aufbereitung der Bestände im OGPD besprochen. Im Ergebnis werden vier verschiedene Wege realisiert und angeboten werden:

  • Passives Bereitstellen per CSW, das beispielsweise für den Geodatenkatalog und  PortalU angewendet wird
  • Passives Bereitstellen per CKAN/JSON, was beispielsweise bei Berlin, Hamburg und Bremen genutzt wird
  • Aktives Bereitstellen per CKAN-API, was beispielsweise von Bayern genutzt werden wird
  • Manuelles Eintragen per Formular, das beispielsweise vom Bundesministerium der Finanzen für die Haushaltsdaten genutzt werden wird

Das Hauptergebnis unseres Harvesting-Workshops ist sicher die überarbeitete Metadaten-Struktur, die nun unter https://github.com/fraunhoferfokus/ogd-metadata, Kurzlink: http://s.fhg.de/ogd-metadata verfügbar ist.

Das Führen der Metadaten-Struktur für OGPD auf GitHub erlaubt eine transparente, kooperative Pflege durch Versionskontrolle. Änderungswünsche können veröffentlicht werden, die Historie der Metadaten-Struktur wird dokumentiert und der aktuelle Stand ist jederzeit sichtbar.

Gerade haben Florian Marienfeld und Thomas Scheel noch eine HTML-Darstellung des JSON-Schemas der Metadaten-Struktur für OGPD aufgenommen, die die Metadaten-Struktur lesbarer und einfacher verständlich macht: http://htmlpreview.github.com/?https://github.com/fraunhoferfokus/ogd-metadata/blob/master/OGPD_JSON_Schema.html, Kurzlink: http://s.fhg.de/ogd-metadata-html

Wir freuen uns auf Eure Hinweise und Vorschläge zur Metadaten-Struktur und/oder zum Harvesten – gerne direkt unter GitHub, aber ebenso gerne hier.

Creative Commons Lizenzvertrag
Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

Print Friendly, PDF & Email

Über den Autor: Ina Schieferdecker

1 Kommentar

  1. Pingback: Zu den Entwicklungskosten GovData | Datenjournalist

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.