Eins der Hauptziele des Prototyps GovData.de ist es, möglichst viele offene Datensätze aus Deutschland in einem Katalog zu vereinigen. Der größte Teil wird dabei automatisch durch so genannte Harvester importiert. In diesem Artikel geben wir Ihnen eine Übersicht, welche Werkzeuge dabei zum Einsatz gekommen sind, und wie diese sich bewährt haben.

In früheren Artikeln hatten wir dargestellt, dass eine auf CKAN basierende Metadaten-Struktur eingesetzt wird. Außerdem berichteten wir über einen Workshop mit Betreibern der zu erntendenen Kataloge. Dabei wurden vier verschiedene Import-Wege vorgestellt: JSON-Import, CKAN-CKAN-Harvesting, CSW-ISO19115-Harvesting und CKAN-REST-API. In der Praxis haben sich sich vor allem die ersten drei Wege bewährt.

Mähdrescher

Harvesting im großen Stil
(Foto: JSmith Photo,
Lizenz: Creative Commons keine Bearbeitung)

Beim JSON-Import nennen die Betreiber der zu integrierenden Kataloge einmalig eine HTTP-URL, unter der wir tagesaktuell eine JSON-Datei abrufen können, die alle Datensätze enthält. Dieses Verfahren wurde bei Bremen, Bayern und Moers eingesetzt. Mit wenigen Feedbackschleifen konnten die Bereitsteller ihre individuellen JSON-Export-Werkzeuge so optimieren, dass eine reibungslose Integration der Metadaten möglich ist. Zunächst wurden die Metadaten einmalig mit dem Unixprogramm wget geladen, ggf. mit einem Python-Skript minimal angepasst und abschließend mit der Python-Bibliothek ckanclient ins GovData.de-CKAN geladen. Aktuell integrieren wir diese Schritte in ein eigenes CKAN-Harvesting-Plugin, was das regelmäßige Harvesting erleichtert.

Das CKAN-CKAN-Harvesting wird in den Portalen von Hamburg, Berlin, Rostock und Rheinland-Pfalz eingesetzt. Theoretisch kann hierfür die CKAN-Harvesting-Erweiterung ckanext-harvest ohne weitere Entwicklung oder Konfiguration benutzt werden, da die Bereitsteller sich an der vorgeschlagenen Metadaten-Struktur orientieren. In der Praxis müssen jedoch viele Details beachtet werden: Das Übernehmen der Kategorien (CKAN: “groups”) etwa funktioniert nur mit kleinen Tricks, teilweise wird die Zuordnung CKAN.author ↔ “Veröffentlichende Stelle” nicht konsequent umgesetzt, der Umgang mit dem lokal eindeutigen CKAN.name und .id muss gut überlegt sein und Großbuchstaben und Sonderzeichen in den tags, also Schlagwörtern, werden nicht einwandfrei übertragen. Außerdem müssen Schlagwörter und Titel auch hier teilweise ergänzt werden, da beispielsweise der Hamburger Metadaten-Katalog natürlich nicht alle Datensätze mit “Hamburg” verschlagwortet. Technisch ist dieser Weg trotz allem sehr elegant, da unter anderem bei jeder Aktualisierung tatsächlich nur die zwischenzeitlich geänderten Datensätze übertragen werden.

Etwas komplizierter ist der Import von Geometadaten, die nach dem Standard ISO19115 kodiert sind (vgl. Seite des AK Metadaten). Das liegt meines Erachtens daran, dass Geodaten ganz anders verteilt und konsumiert werden (sollten) als bei offenen Daten üblich. Dort wird von Produkten gesprochen, häufig CDs oder Papierkarten, die zwar anhand der Metadaten erfasst und gefunden werden, es folgt dann aber üblicherweise der Abschluss eines Vertrags und die gezielte Übergabe der Daten vom Bereitsteller an den Vertragspartner. Dementsprechend erhalten die für Open Data zentralen Angaben “Online-Ressource” und “Lizenz” sowohl im Standard als auch in der Benutzung durch die Datenbereitsteller nur sehr geringe Bedeutung. Hinzu kommt, dass das sehr umfangreiche (Meta-)Datenmodell von Bundesland zu Bundesland mit unterschiedlichen Profilen eingesetzt wird, so dass es schwierig ist, z. B. die veröffentlichende Stelle in allen Datensätzen des ganz Deutschland umfassenden Geoportal.de zu identifizieren.

Aus diesem Grund wurden der Import von Geoportal.de und PortalU.de vertagt. Sehr wohl konnten aber auf dem ISO19115-Weg destatis, die Regionaldatenbank und das Open-Data-Angebot des Niedersächsischen Umweltministeriums teilweise importiert werden. Hier wurde der Standard sehr konsistent umgesetzt und die Lizenzfrage pauschal geklärt (DL-DE-BY bzw. UDL). Wir haben für das Harvesten eine Variante der CKAN-Erweiterung ckanext-spatial entwickelt. Diese passt den ansonsten üblichen CSW-Client (Catalog Service for the Web) an destatis die Regionalstatistik an: Hier werden statt CSW gezippte XML-Dateien per HTTP verteilt. Beim Niedersächsischen Umweltministerium werden die relevanten Datensätze durch eine CSW-Anfrage nach “opendataident” gefunden. Übrigens setzt Hamburg ebenfalls den CSW-Harvester ein, um Metadaten aus dem Hamburger Metadaten-Katalog in ein Hamburger CKAN zu übertragen.

Harvesting-Architektur

Harvesting-Architektur

Die ersten beiden Importer basieren nur auf der Erweiterung ckanext-harvest und wurden daher direkt im Produktiv-CKAN von GovData.de installiert. Der ISO-Harvester basiert jedoch auf der recht umfangreichen Erweiterung ckanext-spatial und wird daher auf einem getrennten Rechner betrieben. In einem weiteren Schritt werden die Datensätze dann in den eigentlichen Datenkatalog übertragen.

Beim weiteren Entwickeln von diesen und neuen Harvestern müssen nach unserer Einschätzung folgende Probleme adressiert werden:

  • Unterschiedliches Verständnis: Was genau sind Daten, Dokumente, Apps? Wie ordnen sich Dienste ein? Welche Bedeutung haben Zeitstempel, wenn Metadaten über mehrere Kataloge hinweg geharvestet werden?
  • Die Vereinheitlichung von Schlagwörter: Wie löst man mehrdeutige und unterschiedliche Bezeichnungen für identische Bedeutungen auf (Homonyme und Synonyme)? Wie fasst man ähnliche Tags zusammen (tag curation)?
  • Dubletten erkennen: Bisher bilden doppelt erfasste Daten bei GovData.de aus organisatorischen Gründen die Ausnahme. Doch je mehr Kataloge miteinander vernetzt werden, desto genauer muss darauf geachtet werden, dass anhand der Felder metadata_original_portal und metadata_original_id Dubletten zuverlässig erkannt werden.
  • Synchronisation statt Harvesting: Heute ist meist klar von wo nach wo geharvestet wird, aber auch hier sind Herausforderungen absehbar: Beispielsweise ist Berlin an den Datensätzen von destatis interessiert, die das Schlagwort Berlin enthalten; das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz) hat seine Open Data Exporte schon seit langem bei thedatahub.org registriert, sie gehören jedoch auch zu GovData.de.

Der letzte Punkt ist auch heute schon zu beobachten: Wer harvestet, wird auch geharvestet. Die GovData.de-Metadaten finden sich bei offenedaten.de. Möglicherweise wird es ein Harvesting Richtung EU und in weitere Spezialkataloge geben. Wir hoffen, dass wir durch das Freigeben der CKAN-API und das Pflegen der Metadaten-Struktur diese Prozesse unterstützen können.

Zusammenfassend lässt sich sagen, dass das Harvesting einen wesentlichen Teil der Arbeit bei GovData.de ausgemacht hat und durchaus einen entsprechenden Mehrwert bietet. Um hier kontinuierlich besser zu werden, ist viel kleinteilige Arbeit notwendig. Die Abstimmung zwischen den Bereitstellern und Katalogbetreibern sollte idealerweise zu einer nachlaufenden Standardisierung der Metadaten-Struktur und Katalog-Schnittstellen führen.

Creative Commons Lizenzvertrag
Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

17:52 · Kommentieren · Kategorien: Uncategorized

Fraunhofer FOKUS-Wissenschaftler Nikolay Tcholtchev wird auf der diesjährigen CeBIT im Rahmen des Forums „Smart Infrastructure“ einen Vortrag zum Thema Gemeinschaftliche eMobilität halten. Der Vortrag mit dem Titel „Car Sharing – was bringt die Zukunft – Fraunhofer GeMo“ befasst sich mit den Entwicklungen, die im Zuge des Fraunhofer-Projektes GeMo (Gemeinschaftliche eMobilität) durchgeführt werden. Dabei wird der Fokus der Präsentation auf die Entwicklung des Backend-Systems gesetzt, das eine Plattform für den Austausch und Aggregation mobilitätsrelevanter Daten bereitstellt. Der Vortrag findet am 8. März 15:00 bis 15:30 Uhr in Halle 11, Stand B56 statt.

05:54 · Kommentieren · Kategorien: Uncategorized

Letzte Woche war es soweit: Wir haben den Prototypen von GovData in den Pilotbetrieb gestartet, um seine erste öffentliche Vorführung auf der CeBIT 2013 technisch vorzubereiten.

GovData bietet u.a. Informationen zu online verfügbaren Datensätzen in maschinenlesbaren Formaten mit definierten Lizenzen, wobei derzeit sieben verschiedene offene Lizenzen für 1160 Datensätze und Lizenzen eingeschränkter Nutzung für acht andere Datensätze genutzt werden.

Der technische Start war mit einem so großen medialen Interesse verbunden, das den Server für den Prototypen an seine Leistungsgrenze gebracht hat. Ein Tag intensiver Arbeit folgte, um das Portal mit verstärkter Infrastruktur erneut an den Start zu geben.

Seither läuft GovData stabil, so dass es Zeit wird, nach initialen Zahlen zu den Datenangeboten des Portals einige Dinge rund um die technische Auslegung des Portals zu erläutern. Das Portal nutzt die de-facto-Standard-Infrastruktur für Open Data Portale CKAN. Vorgelagert ist ein Content Management System (CMS), da der Prototyp als Portal konzipiert ist, das neben Datensätzen weitere Elemente von Open Government abdecken könnte. So finden sich bereits heute in der Bibliothek nicht nur Informationen rund um offene Daten, sondern ebenso zu den Zielen von Open Government in Deutschland.

Sowohl CKAN als auch LifeRay (in seiner Community Edition) sind Open Source. Die Bereitstellung der Software von GovData unter GitHub ist derzeit in Klärung. Dort sind zudem die ToDo-Liste für den Prototypen als auch Vorschläge der GovData-Nutzer zu finden.

Zurückkommend auf das CKAN-Register von GovData: dieses nutzt eine CKAN-basierte Metadatenstruktur, die auf die Anforderungen eines ebenen- und fachübergreifenden Portals für Deutschland erweitert wurde. So umfassen die Metadaten beispielsweise einen Link auf den ursprünglichen Metadatensatz, falls ein Metadatum von einem anderen Portal geharvestet (damit ist das Abernten von Informationen bestehender Portale gemeint) wurde. Die Metadatenstruktur wird nicht nur für Datensätze, sondern ebenso für Dokumente (z. B.  pdf oder html) und Applikationen (z. B.  Android) genutzt. Die verwendeten Kategorien bei GovData sind eine Kombination der Kategorien bestehender Datenportale wie der Statistik, der Geodaten oder Berlins. So ist GovData kompatibel zu anderen CKAN-basierten Datenportalen, was das Harvesten dieser erleichtert. Gleichzeitig wird eine Kompatibilität der Metadaten für den deutschsprachigen Raum im Rahmen von DACHLI angestrebt, so dass die länderübergreifende Nutzung der Metadaten durch Interoperabilität der Metadaten-Strukturen unterstützt wird.

Lassen Sie mich abschließend ausgewählte Statistiken zu den ersten beiden Tagen des Portals geben: die nun verstärkte Infrastruktur hält dem derzeitig hohen Interesse am Pilotbetrieb des Prototypen für das Datenportal Deutschland von knapp 2,8 Mio Zugriffen in den ersten beiden Tagen stand:

Das Portal bindet seine Besucher im Schnitt für knapp 4 Minuten, in der Mehrzahl weniger als 30 Sekunden. Besucher werden sich wohl nach dem Auffinden eines interessanten Datensatzes zur Angebotsseite des Datensatzes begeben:

Die Anfragen kamen natürlicherweise insbesondere aus Deutschland, aber ebenso aus anderen europäischen Staaten oder von weltweit:

Darüberhinaus haben wir uns gefreut, dass die Arbeiten am Prototypen bereits im Vorfeld zur Öffnung von Daten in Deutschland beigetragen haben. So hat sich beispielsweise Moers mit eigenen, neuen Angeboten bei GovData eingebracht. Weitere Angebote sind in Vorbereitung, so dass das Ziel des kontinuierlichen Ausbaus der Datenbasis aktiv angegangen wird.

Zudem werden vom Team im BMI entlang der sogenannten „Wunschliste Verwaltungsvertreter angesprochen, um auch diese Datenangebote über GovData verfügbar zu machen. Ein erstes Häkchen ist hinter den Bundesfinanzhaushalt 2012 und 2013 mit den jeweiligen Nachträgen zu setzen – diese sind über das Portal erreichbar und stehen als amtliche Werke zur Verfügung.

Wir würden uns freuen, wenn das rege Interesse am Prototypen Bestand hat: sein Pilotbetrieb in 2013 und 2014 soll dazu dienen, Erfahrungen mit dem und Verbesserungsvorschläge zum Prototypen und den damit verbundenen Prozessen zu sammeln.

Creative Commons Lizenzvertrag

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

 

15:33 · 7 Kommentare · Kategorien: Uncategorized

Derzeit wird unter anderem über die Lizenzbestimmungen für Datensätze der öffentlichen Hand in Deutschland diskutiert. Dabei wird auf die international standardisierten Lizenzen Creative Commons verwiesen. Ich habe mir die Frage gestellt, inwieweit die Creative Commons-Lizenzen als Standard etabliert sind.

In Anwendung der Methode von Paul Miller vom 11 Juli 2012, der dort den DataHub von OKFN analysiert hat, habe ich die Methode auf das europäische Portal und andere nationale Portale angewendet bzw. anwenden wollen:

Zu den Portalen mit Ergebnissen sind jeweils die aktuellen Zahlen, Stand 12. Februar 2013 hinterlegt – zwecks Nachvollziehbarkeit und Korrektur, so nötig.

Gerne möchte ich an der Stelle dazu aufrufen, Ergebnisse für weitere Portale aufzubereiten, so dass diese Analyse ausgebaut wird. Ich selbst beabsichtige,

  • die Anaylse nach dem Start des Datenportals Deutschland um dessen Zahlen zu erweitern und
  • sie in einem Jahr zu wiederholen, um die Entwicklung bei der Öffnung von Daten insbesondere in Europa aufzuzeigen.

Eine weitere Option ist die Erarbeitung einer automatisierten Analyse des Stands verschiedener Datenportale, die in einer App aufbereitet und visualisiert wird. Sollte sich ein Interessierter/eine Interessierte finden, kann diese App beispielsweise im Rahmen einer Studienarbeit an der Freien Universität Berlin erarbeitet werden. Zudem könnten die dumps der Datenportale im Detail geprüft werden, um fehlerhafte Informationen zu identifizieren und aus der Analyse auszuschliessen.

Nun zu den Ergebnissen, Stand 12. Februar 2013. Die Analyse untermauert die Ergebnisse von Paul Miller vor einem halben Jahr: auf den Portalen, für die Ergebnisse vorliegen, sind CC-Lizenzen vertreten, aber nicht dominant. Sicher ist ein Grund, dass die neue Version v4.0 noch aussteht – diese wird u.a. offene Punkte für eine Anwendbarkeit der CC-Lizenzen auf Datensätze adressieren.

Beim Portal der EU, siehe Ergebnisse, finden sich 61% als offen lizenzierte Inhalte:

Diese stehen vor allem unter der Open Government Lizenz UK, kurz uk-ogl, die eine Eigenentwicklung in UK ist:

Abzüglich der UK-Lizenz zeigen sich 41% CC-BY-, 15% CC-Zero- und 2% CC-BY-SA-Lizenzen:

Es überrascht nicht, dass die uk-ogl-Lizenz auf DataGovUK, siehe Ergebnisse, dominant ist. Es könnte auch ein Grund für den sehr hohen Anteil an offenen Lizenzen sein:

Die Relation aller offener Lizenzen zeigt die Vorrangstellung der uk-ogl-Lizenz:

Interessant ist, dass bei den 17 anderen offenen Lizenzen die CC-Lizenzen keine Rolle spielen – sie werden nicht benutzt:

Der Zugriff auf die CKAN API des Datenportals der Niederlande, siehe Ergebnisse, ist schwer zu finden, da mein Niederländisch beschränkt ist. Dafür erhält man aber auf einen ersten Blick die verfügbaren Lizenzen in ihren Nutzungszahlen. Dabei fällt die Einordnung der Publiek Domein-Lizenz schwer -  sie ist beispielsweise von OKFN nicht bezüglich ihrer OKD-Compliance klassifiziert, aber entsprechend Wikipedia als freie Lizenz verstanden. Sollte diese Einschätzung falsch sein, sagen Sie bitte bescheid.

Die Mehrzahl der Datenangebote in den Niederlanden steht unter freien Lizenzen:

Dominant ist eine Public Domain-Kennzeichnung. CC-Lizenzen werden genutzt, aber insbesondere niederländische Varianten:

Auf Nachfrage habe ich die Zahlen des Datenportals Österreich, siehe Ergebnisse, erhalten. Es gibt zu 100% Datenangebote unter freien Lizenzen:

Die freien Angebote nutzen in Mehrzahl eine österreichische Version der CC-BY:

Nun ist auch der Prototyp des Datenportals Deutschlands, siehe Ergebnisse, online gegangen. Dort findet man mehrheitlich offene Datensätze:

Diese werden von der offenen Variante der Datenlizenz Deutschland dominiert, aber ebenso werden Creative Commons-Lizenzen verwendet:

Auf Ihre Rückmeldungen zu dieser ersten Analyse freue ich mich.

Creative Commons Lizenzvertrag

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

11:02 · Kommentieren · Kategorien: GovData · Tags: ,

Anfang Februar haben Fraunhofer FOKUS und das Bundesministerium des Innern einen zweiten Community Workshop zum Datenportal organisiert. Ziel des Workshops war es, den aktuellen Stand des in Entwicklung befindlichen Portals vorzustellen und in der Diskussion mit den Teilnehmern Rückmeldungen zur weiteren Entwicklung zu erhalten.

Mit etwas über 40 Teilnehmern aus Zivilgesellschaft, Verwaltung, Wissenschaft und Wirtschaft war das Interesse an einem Freitagnachmittag groß.

Zu Beginn stellte das BMI den neuen Namen des Portals vor: “GovData – Das Datenportal für Deutschland”. In Anlehnung an Namen von Datenportalen in anderen Ländern wird dem integrierenden, ebenen- und fachübergreifenden Ansatz des Portals Rechnung getragen. Über das Portal erhalten Nutzer einen einheitlichen Zugang zu dezentral liegenden Datensätzen der öffentlichen Verwaltung. Schwerpunkt der Datenbereitstellung sollen offene Verwaltungsdaten sein. Eingeschränkt nutzbare Datensätze als auch Dokumente und Applikationen werden ebenfalls über das Portal leichter zugreifbar gemacht. Es werden so auch Datenbereitsteller mitgenommen, die sich einbringen möchten, aber ihre Datensätze noch nicht offen zur Verfügung stellen können.

Teilnehmende Datenbereitsteller aus Kommunen, Länder und des Bundes können ihre Daten über GovData zugänglich machen. Die dezentralen Datenbereitsteller entscheiden dabei selbst über die rechtliche und technische Ausgestaltung ihrer Daten. Dabei wird empfohlen, Daten unter offener Lizenz (dies kann die Datenlizenz Deutschland in der Variante Namensnennung oder eine andere offene Lizenz sein) und technisch einfach Weiterverarbeitbar einzustellen. Im GovData-Portal werden die Eigenschaften von Datensätzen nachvollziehbar dargestellt (offene/eingeschränkte Lizenz, vorliegende Dateiformate, etc.). Es wird somit z.B. eine Filterung nur nach Datensätzen unter offenen Lizenzen möglich sein. Genauso ist es möglich, sich auch Datensätze mit eingeschränkter Lizenz anzeigen zu lassen.

Einmal im Datenkatalog von GovData verzeichnete Datensätze können von Datennutzern öffentlich kommentiert und bewertet werden. Einrichtungen von Bund, Ländern und Kommunen werden auf Kommentare zu von ihnen bereitgestellten Datensätzen hingewiesen und können darauf reagieren.

Für die Arbeitsgruppen innerhalb des Workshops wurden von den Veranstaltern vier Themen vorgeschlagen und von den Teilnehmern einhellig angenommen:

  • Benutzerfreundlichkeit von GovData,
  • Rechtliche Fragestellungen zu Nutzungsbedingungen, Lizenzen, etc.
  • IT-Sicherheit von GovData
  • FAQs für die Nutzer von GovData

Nach einer Vorstellungsrunde wurde der aktuelle Entwicklungsstand des Portals vorgestellt. Wichtige Fortentwicklungen seit der Vorstellung im 1. Community Workshop Anfang Dezember 2012 waren:

  • Möglichkeit zur Anmeldung von Apps, die Datensätze des Portals verwenden
  • Einführung von Kommentierungs- und Bewertungsmöglichkeiten zu einzelnen Datensätzen
  • Aktualisierung des Layouts des Portals
  • Fortentwicklung der Harvesting-Mechanismen für die Einbindung von Datenquellen wie PortalU, etc.

Anschließend starteten die Arbeitsgruppen.

Arbeitsgruppe “Rechtliche Fragestellungen”

  • Die AG-Teilnehmer entschieden sich nur zum Thema Lizenzen/Nutzungsbestimmungen für Daten zu diskutieren.
  • Es gab zwei wesentliche Diskussions-Bereiche: eine allgemeine Diskussion zu den grundsätzlichen Positionen zu Lizenzen/Nutzungsbestimmungen und eine Diskussion zu den beiden Varianten der Datenlizenz Deutschland.

Allgemeine Diskussion zu Lizenzen/Nutzungsbestimmungen

  • Verschiedene Teilnehmer sehen die Verwendung möglichst offener Datenlizenzen als notwendig an. Als Begründung wurden angeführt: (1) wohlwollende Nutzer wird eh den Namen des Datenbereitstellers angeben, (2) nicht wohlwollende Nutzer halten sich auch nicht an eine striktere Lizenz, (3) es sei fraglich, ob Nichteinhaltung von Vorgaben zur Nutzung nachverfolgt werden und wenn nicht, stelle sich die Frage des Zwecks von strikteren Lizenzen.
  • Auch wurde deutlich geäußert, sich stärker an internationalen Tendenzen (die sich in Entwicklung befindenden Creative Commons-Lizenzen in Version 4.0) zu orientieren. Ebenfalls angemerkt wurde aber auch, dass aktuell die CC 3.0 für Daten nicht vollständig passfähig sind.
  • Die Verwendung von NC-Lizenzen wurde von einigen Teilnehmern grundsätzlich abgelehnt.

Diskussion fokussiert auf die beiden Varianten der Datenlizenz Deutschland

Datenlizenz Deutschland – Namensnennungslizenz – V1.0:

  • Der Passus “Jede Nutzung ist gestattet” wird als zu einfach kritisiert – es sollten klar die Rechte gelistet werden.
  • Der Passus zur nachträglichen Löschung der Lizenzangaben wurde von Teilnehmern als sehr kritisch gesehen. Ein entsprechender Änderungsvorschlag wurde bereits vom BMI in den Abstimmungsprozess mit den Ländern gegeben.

Datenlizenz Deutschland – Namensnennung – nicht kommerziell – V1.0:

  • Die NC-Lizenz wird von verschiedenen Teilnehmern kritisiert. Es wird in der AG aber akzeptiert, dass dies ein Vehikel sein kann, den Kulturwandel in der Verwaltung zu begleiten.
  • Es soll sehr deutlich herausgestellt werden, dass die offene Variante der Lizenz die empfohlene ist und für Datenbereitsteller deutlich gemacht werden, wo die Nachteile bei der NC-Lizenz liegen. Das BMI hatte diesen Kritikpunkt bereits vor dem Workshop in die aktualisierten Informationen für Datenbereitsteller zu den Datenlizenzen übernommen.

Allgemeine Anmerkungen der Teilnehmer zur Datenlizenz Deutschland:

  • Die Lizenz sollte auf Englisch übersetzt werden. Die Datennutzung hört nicht an Deutschlands Grenzen auf, für eine internationale Nutzung ist ein englischer Lizenztext eine wichtige Voraussetzung.
  • Für die weitere Zusammenarbeit wurde die weitere Nutzung mit GitHub von den Teilnehmern befürwortet.

Arbeitsgruppe Benutzerfreundlichkeit von GovData
In dieser Arbeitsgruppe entstand eine rege Diskussion zwischen allen Teilnehmern mit umfangreichem Feedback zur Benutzerfreundlichkeit und Barrierefreiheit des Portals.
Einige wesentliche Kritikpunkte der Teilnehmer waren:

  • Probleme beim Session-Management in Zusammenhang mit dem eingesetzten JavaScript erschweren übliche Herangehensweisen beim „Durchstöbern“ der Such-Ergebnisse.
  • Die Nutzbarkeit des Portals bei ausgeschaltetem JavaScript sowie im Internet Explorer 8 muss erhöht werden
  • Die Gestaltung und Benutzerfreundlichkeit / Usability der Seite ist verbesserungsfähig. Dies betrifft insbesondere die Suchergebnisliste und Detailansicht von Datensätzen
  • Ein offener und deutlich kenntlich gemachter Zugang zur API des Datenkatalogs unter einer offenen Lizenz wird befürwortet. Dies ist seitens BMI und FOKUS bereits vorgesehen.

Arbeitsgruppe FAQs
Die Teilnehmer entschieden, den vorliegenden Entwurf der FAQs für das Portal gemeinsam durchzusprechen und Änderungs- und Erweiterungsvorschläge zu einzelnen Fragen & Antworten zu erarbeiten. Die Vorschläge werden derzeit in die FAQs eingearbeitet, so dass spätestens zum Start des Portals eine neue Fassung online gestellt werden kann.

Arbeitsgruppe IT-Sicherheit von GovData
Die Teilnehmer der Arbeitsgruppe entdeckten, dass das Patchen der Server-Installation nicht erfolgreich war. Automatisierte Sicherheitstests wurden angewendet, deren Ergebnisse noch zu analysieren sind.

Möglichkeiten zur Diskussion, Feedback und Informationen
Neben diesem Blog rund um die Entwicklung von GovData sind seit Herbst 2012 verschiedene weitere Möglichkeiten zur Diskussion, Feedback und Informationen eingerichtet worden:

Ausblick
Geplant ist es, das Portal GovData vor der CeBIT in seine öffentliche Beta-Phase zu starten. Diese Phase soll von Datenbereitstellern und Datennutzern genutzt werden, um das Portal zu testen und die damit verbundenen Prozesse zu evaluieren. Das Portal wird mit einem ersten, Satz an (sowohl offen als auch eingeschränkt nutzbaren) Datensätzen starten. Abhängig vom weiteren Engagement freiwilliger Datenbereitsteller auf Ebene des Bundes, der Länder und der Kommunen sollte die Anzahl der über das Portal verzeichneten Datensätze genauso wie der Funktionsumfang des Portals selbst perspektivisch weiter wachsen (siehe auch den Aufruf an Datenbereitsteller).

Creative Commons Lizenzvertrag

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

Auch 2013 zählen Open Government und Open Government Data zweifellos zu den richtungsweisenden Themen für die Modernisierung von Regierung und Verwaltung in ganz Europa. In den letzten Jahren wurden wichtige Grundsteine gelegt, um Transparenz, Beteiligung und Zusammenarbeit weiter voranzutreiben. Das es sich bei dem Thema um eine länderübergreifende Angelegenheit handelt, machte bereits die ersten OGD-D-A-CH-LI-Konferenz deutlich. Auch die zweite OGD D-A-CH-LI-Konferenz, die am 16. Mai 2013 in Berlin stattfindet, zielt auf einen Erfahrungsaustausch zwischen Politik, Verwaltung, Bürgern, Wirtschaft und Wissenschaft im D-A-CH-LI-Raum. Sie steht diesmal unter dem Motto „Open Government – Bürgernähe durch Kulturwandel“.
Wer sich am am Programm der Konferenz beteiligen möchte findet hier den Call-for-Papers, u. a. zu den Themen:

  • Lizenzmodelle für Verwaltungsdaten
  • Metadatenkataloge
  • Aufbau eines Open Government Data-Ökosystems: Wirtschaftsförderung, Gründerzentren, Kommunikationsstrategien
  • Open Government in Aus- und Weiterbildung (Data Schools)
  • Open Government Data Portale der (öffentlichen) Wirtschaft
  • Open Government Data und Datenschutz
  • Umsetzung der geplanten neuen PSI-Richtlinie
  • Linked Open Government Data

Einsendeschluss ist der 28. März 2013.

Weitere Informationen zur OGD-D-A-CH-LI-Konferenzreihe gibt es unter: www.effizienterstaat.eu und unter http://ogd.adv.at.

In Kürze wird der von Fraunhofer FOKUS im Auftrag des Bundesministeriums des Innern (BMI) entwickelte Prototyp des Open-Government-Portals Deutschland online gehen. Ziel des Portals ist es, ebenübergreifend die Datenbestände deutscher öffentlicher Stellen zentral verfügbar zu machen. Zum Start werden bereits eine Vielzahl an Datensätzen verschiedener Fachportale sowie aus mehreren Ländern und Kommunen verfügbar sein.

Bis zum Start – und natürlich auch darüber hinaus – freuen wir uns aber über jeden weiteren Teilnehmer, der seine Daten auf diesem Weg bereitstellt. Alle Datenbereitsteller, die von Anfang an dabei sind, werden im Rahmen des Portals-Starts natürlich besonders hervorgehoben; eine gute Möglichkeit, um auf die eigenen Open-Data-Aktivitäten hinzuweisen. Für eine Teilnahme ist nicht viel erforderlich. Teilnehmer müssen insbesondere nicht bereits über eine Open-Data-Infrastruktur o.ä. verfügen. Sie müssen lediglich verschiedene Informationen zu ihren Datensätze zur Verfügung stellen. Die Übernahme in das Portal übernimmt dann das Projektteam.

Interessierte Kommunen wenden sich am Besten direkt an Fraunhofer FOKUS.

Update am 15.1.2013: Ergänzung um Angabe zur CC-Lizenz des Blog-Artikels:

Creative Commons Lizenzvertrag
Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.