Am 7.12. trafen sich rund 20 Open Data begeisterte Entwickler, Aktivisten und Verwaltungsmitarbeiter um den Fortschritt der Open Government Plattform für Deutschland zu begutachten und die weitere Entwicklung mitzugestalten. Zu dem ganztägigen Treffen in Berlin-Charlottenburg hatten das Bundesministerium des Innern und Fraunhofer FOKUS geladen. Ziel der Veranstaltung war es, auch die Community in den Entwicklungsprozess einzubinden.

Nach einer kurzen Einführung in die Architektur der Plattform konnten die Teilnehmer selbst auf ein Live-System zugreifen und sich so ein Bild von den ersten beiden umgesetzten Komponenten verschaffen: Datenkatalog und Bibliothek. Im Hauptteil konzentrierten sich sie versammelten Open Data-Enthusiasten in getrennten Gruppen auf ausgewählteThemen, wobei jeweils die verantwortlichen FOKUS-Entwickler mit den passenden externen Experten diskutierten.

Beim Thema Suchfunktion herrschte Einigkeit darüber, dass ein einfaches Suchfeld plus Filter angemessen ist. Suchterme sollte unbedingt mit UND statt mit ODER verknüpft werden; alternativ könnte nach Relevanz sortiert werden, wodurch UND-Treffen automatisch weiter oben stehen. Unterkategorien sollten nicht wie geplant hierarchisch, sondern eher wie Schlagwörter dargestellt werden.

Vorschau auf den PrototypenHinsichtlich der Kennzeichnung von Lizenzen bzw. der Nutzungsbestimmungen betonte die Community die Wichtigkeit einer deutlichen Kennzeichnung von freien Datensätzen, also solchen, die höchstens die Nennung der Quelle vorschreiben (attribution), d.h. insbesondere nicht geldleistungspflichtig sind kommerziell genutzt werden können. Datensätze, auf die das nicht zutrifft, müssten zuverlässig als „eingeschränkt“ bezeichnet werden. Ob die Einschränkung konkret in einer Zahlungspflicht, Nutzungsbeschränkung oder etwas anderem bestehe, sei dagegen zweitrangig; d.h. möglichst genaue Angaben seien hier zwar hilfreich, können aber im Zweifelsfall dem Interessierten zur Recherche überlassen werden. Darüber hinaus müssen weitere Lizenzen in Metadaten-Struktur aufgenommen werden, z.B. die Geo-Lizenzen und die Public Domain Dedication License.

Im Bereich Social Media wurde festgestellt:

  • Es soll ein Hilfeforum je Zielgruppe entstehen (Datenbereitsteller, Entwickler, Bürger)
  • Eine Netiquette ist nötig, um klare Richtlinien für das nachträgliche Moderieren von Kommentaren und Forumsbeiträgen vorzugeben.
  • Beliebige Suchanfragen sollten einfach als RSS-Feed abonnierbar sein.
  • Die Zugriffsstatistik der Plattform sollte als Datensatz verfügbar sein.

In der Harvesting-Gruppe wurde vor allem Wissenswertes zwischen den Geodaten-Experten Hr. Weichand von opendata.bayern.de und Hr. Seiler vom BKG und den CKAN-Experten bei FOKUS ausgetauscht. Es stellte sich heraus, dass ein automatischer Import der ISO19115-Metadaten in ein Open Data-Portal häufig nicht möglich ist bzw. den Umfang des Prototypen sprengt, da zentrale Angaben wie die veröffentlichende Stelle oder die Lizenz bundesweit nicht einheitlich kodiert werden. Hier soll zunächst das erschlossen werden, was mit wenig Aufwand entdeckt werden kann, und der Import später durch Hinweise von Datenbereitstellern und Geodatenexperten verfeinert werden.

Ein Penetration Testing im engeren Sinne konnte natürlich während des Workshops nicht durchgeführt werden. Dennoch wurden verschiedene angemessen Maßnahmen zur Absicherung diskutiert, insbesondere die Möglichkeit des Auditings durch einen Dienstleister.

Community WorskshopIm abschließenden Plenum gaben die Arbeitsgruppen ihre Ergebnisse wieder. Zudem wurden umfassendere Themen diskutiert. Dabei kristallisierte sich heraus, dass für einen langfristigen Erfolg der Open Government Plattform für Deutschland neben der Umsetzung von Funktionalität zwei weitere Aspekte entscheidend sind: Erstens benötigt das Thema kontinuierliche Öffentlichkeitsarbeit und Community-Management; es wird nicht ausreichen, das Portal bereitzustellen, vielmehr muss ein redaktionelles Team Open Data in Deutschland vorantreiben. Zweitens müssen mehr Datenquellen erschlossen werden. Die bisher involvierten Bereitsteller demonstrieren zwar die Funktionen der Plattform, für ein erfolgreiches Open Government Data Portal müssten jedoch noch deutlich mehr Institutionen und Gebietskörperschaften offene Daten beisteuern.

Insgesamt bescheinigten die Teilnehmer dem Projekt einen guten Fortschritt und sehen einem weiteren Workshop und dem Launch Anfang 2013 positiv entgegen. Beteiligen auch Sie sich per Mailingliste an der Entwicklung.

Creative Commons Lizenzvertrag
Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

Am 25. September 2012 trafen sich Vertreter aus Bayern, Bremen, Berlin, Baden-Württemberg und Hamburg als auch vom PortalU und von GDI-DE an unserem Institut Fraunhofer FOKUS in Berlin, um mit uns über die Metadaten-Struktur für OGDP zu diskutieren. Zudem wurde besprochen, wie bestehende Datenangebote in die OGDP überführt werden können.

Unter Harvesting versteht man das Zusammenführen von Metadaten aus verschiedenen Katalogen. Im Rahmen der OGPD werden die Metadaten der genannten Workshop-Teilnehmer sowie von DESTATIS geharvestet, insoweit sie den Minimalkriterien für Open Data entsprechen: Es werden nur solche Datensätze, Dokumente oder Applikationen übernommen, die eine frei zugängliche elektronische Ressource, eine Beschreibung und eine wohl definierte Lizenz haben.

Dazu habe ich die vorgeschlagene Metadatenstruktur erläutert. Sie wurde insbesondere bzgl. eindeutiger Bezeichner zur eindeutigen Rückverfolgung der Herkunft und zur Erkennung von Dubletten, des Umgangs mit Kontaktangaben, der Erkennung offener Lizenzen als auch der geographischen Abdeckung nachjustiert. Zudem wurden die Hauptkategorien zur Einordnung der Datensätze, Dokumente und Applikationen diskutiert und in die folgenden 14 Hauptkategorien zusammengefasst:

  • Wirtschaft und Arbeit
  • Transport und Verkehr
  • Umwelt und Klima
  • Geographie, Geologie und Geobasisdaten
  • Gesundheit
  • Verbraucherschutz
  • Infrastruktur, Bauen und Wohnen
  • Bildung und Wissenschaft
  • Öffentliche Verwaltung, Haushalt und Steuern
  • Gesetze und Justiz
  • Soziales
  • Kultur, Freizeit, Sport und Tourismus
  • Bevölkerung
  • Politik und Wahlen

Diese Hauptkategorien dienen der prinzipiellen Einordnung und werden um spezifische, beispielsweise fachspezifische, Unterkategorien ergänzt. Für das Harvesten werden bestehende Kategorisierungen wie beispielsweise in INSPIRE oder EVAS auf diese 14 Kategorien abgebildet.

Nach Klärung der Metadaten-Struktur als Zielstruktur für bereitzustellende Daten, Dokumente und Applikationen wurden verschiedene Wege zur Bereitstellung/Aufbereitung der Bestände im OGPD besprochen. Im Ergebnis werden vier verschiedene Wege realisiert und angeboten werden:

  • Passives Bereitstellen per CSW, das beispielsweise für den Geodatenkatalog und  PortalU angewendet wird
  • Passives Bereitstellen per CKAN/JSON, was beispielsweise bei Berlin, Hamburg und Bremen genutzt wird
  • Aktives Bereitstellen per CKAN-API, was beispielsweise von Bayern genutzt werden wird
  • Manuelles Eintragen per Formular, das beispielsweise vom Bundesministerium der Finanzen für die Haushaltsdaten genutzt werden wird

Das Hauptergebnis unseres Harvesting-Workshops ist sicher die überarbeitete Metadaten-Struktur, die nun unter https://github.com/fraunhoferfokus/ogd-metadata, Kurzlink: http://s.fhg.de/ogd-metadata verfügbar ist.

Das Führen der Metadaten-Struktur für OGPD auf GitHub erlaubt eine transparente, kooperative Pflege durch Versionskontrolle. Änderungswünsche können veröffentlicht werden, die Historie der Metadaten-Struktur wird dokumentiert und der aktuelle Stand ist jederzeit sichtbar.

Gerade haben Florian Marienfeld und Thomas Scheel noch eine HTML-Darstellung des JSON-Schemas der Metadaten-Struktur für OGPD aufgenommen, die die Metadaten-Struktur lesbarer und einfacher verständlich macht: http://htmlpreview.github.com/?https://github.com/fraunhoferfokus/ogd-metadata/blob/master/OGPD_JSON_Schema.html, Kurzlink: http://s.fhg.de/ogd-metadata-html

Wir freuen uns auf Eure Hinweise und Vorschläge zur Metadaten-Struktur und/oder zum Harvesten – gerne direkt unter GitHub, aber ebenso gerne hier.

Creative Commons Lizenzvertrag
Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.