Derzeit wird unter anderem über die Lizenzbestimmungen für Datensätze der öffentlichen Hand in Deutschland diskutiert. Dabei wird auf die international standardisierten Lizenzen Creative Commons verwiesen. Ich habe mir die Frage gestellt, inwieweit die Creative Commons-Lizenzen als Standard etabliert sind.

In Anwendung der Methode von Paul Miller vom 11 Juli 2012, der dort den DataHub von OKFN analysiert hat, habe ich die Methode auf das europäische Portal und andere nationale Portale angewendet bzw. anwenden wollen:

Zu den Portalen mit Ergebnissen sind jeweils die aktuellen Zahlen, Stand 12. Februar 2013 hinterlegt – zwecks Nachvollziehbarkeit und Korrektur, so nötig.

Gerne möchte ich an der Stelle dazu aufrufen, Ergebnisse für weitere Portale aufzubereiten, so dass diese Analyse ausgebaut wird. Ich selbst beabsichtige,

  • die Anaylse nach dem Start des Datenportals Deutschland um dessen Zahlen zu erweitern und
  • sie in einem Jahr zu wiederholen, um die Entwicklung bei der Öffnung von Daten insbesondere in Europa aufzuzeigen.

Eine weitere Option ist die Erarbeitung einer automatisierten Analyse des Stands verschiedener Datenportale, die in einer App aufbereitet und visualisiert wird. Sollte sich ein Interessierter/eine Interessierte finden, kann diese App beispielsweise im Rahmen einer Studienarbeit an der Freien Universität Berlin erarbeitet werden. Zudem könnten die dumps der Datenportale im Detail geprüft werden, um fehlerhafte Informationen zu identifizieren und aus der Analyse auszuschliessen.

Nun zu den Ergebnissen, Stand 12. Februar 2013. Die Analyse untermauert die Ergebnisse von Paul Miller vor einem halben Jahr: auf den Portalen, für die Ergebnisse vorliegen, sind CC-Lizenzen vertreten, aber nicht dominant. Sicher ist ein Grund, dass die neue Version v4.0 noch aussteht – diese wird u.a. offene Punkte für eine Anwendbarkeit der CC-Lizenzen auf Datensätze adressieren.

Beim Portal der EU, siehe Ergebnisse, finden sich 61% als offen lizenzierte Inhalte:

Diese stehen vor allem unter der Open Government Lizenz UK, kurz uk-ogl, die eine Eigenentwicklung in UK ist:

Abzüglich der UK-Lizenz zeigen sich 41% CC-BY-, 15% CC-Zero- und 2% CC-BY-SA-Lizenzen:

Es überrascht nicht, dass die uk-ogl-Lizenz auf DataGovUK, siehe Ergebnisse, dominant ist. Es könnte auch ein Grund für den sehr hohen Anteil an offenen Lizenzen sein:

Die Relation aller offener Lizenzen zeigt die Vorrangstellung der uk-ogl-Lizenz:

Interessant ist, dass bei den 17 anderen offenen Lizenzen die CC-Lizenzen keine Rolle spielen – sie werden nicht benutzt:

Der Zugriff auf die CKAN API des Datenportals der Niederlande, siehe Ergebnisse, ist schwer zu finden, da mein Niederländisch beschränkt ist. Dafür erhält man aber auf einen ersten Blick die verfügbaren Lizenzen in ihren Nutzungszahlen. Dabei fällt die Einordnung der Publiek Domein-Lizenz schwer –  sie ist beispielsweise von OKFN nicht bezüglich ihrer OKD-Compliance klassifiziert, aber entsprechend Wikipedia als freie Lizenz verstanden. Sollte diese Einschätzung falsch sein, sagen Sie bitte bescheid.

Die Mehrzahl der Datenangebote in den Niederlanden steht unter freien Lizenzen:

 

Dominant ist eine Public Domain-Kennzeichnung. CC-Lizenzen werden genutzt, aber insbesondere niederländische Varianten:

 

Auf Nachfrage habe ich die Zahlen des Datenportals Österreich, siehe Ergebnisse, erhalten. Es gibt zu 100% Datenangebote unter freien Lizenzen:

 

Die freien Angebote nutzen in Mehrzahl eine österreichische Version der CC-BY:

 

Nun ist auch der Prototyp des Datenportals Deutschlands, siehe Ergebnisse, online gegangen. Dort findet man mehrheitlich offene Datensätze:

 

Diese werden von der offenen Variante der Datenlizenz Deutschland dominiert, aber ebenso werden Creative Commons-Lizenzen verwendet:

 

Auf Ihre Rückmeldungen zu dieser ersten Analyse freue ich mich.

Creative Commons Lizenzvertrag

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Unported Lizenz.

Print Friendly

Über den Autor: Ina Schieferdecker

7 Kommentare

  1. Danke für die Übersicht und das Hochladen der Ergebnisse. Leider ist nicht ganz klar, ob die Ergebnisse ebenfalls unter der CC-BY 3.0 stehen, wie dieser Artikel. Das Hinzufügen der Lizenz bzw. Nutzungsbedingungen auf der Seite(n) mit dem Link würde hier Klarheit schaffen.
    Bei dem Diagramm zu offenen, beschränkten und nicht spezifizierten Lizenzen in UK scheint ein Fehler unterlaufen zu sein: 9% OPEN, 91% RESTRICTED, 0% UNASSIGNED. Die Daten widersprechen dem einleitenden Text „[…] Es könnte auch ein Grund für den sehr hohen Anteil an offenen Lizenzen sein“. Eine Rechnung anhand der bereitgestellten Ergebnisse (http://open-data.fokus.fraunhofer.de/?attachment_id=2190) ergab: Open: 84,9 % Restricted: 1,8 % Unassigned: 13,3 %

    Antworten

  2. Und danke fuer das positive Feedback zur Statistik. Transparenz zu Open Data wird hilfreich sein, den Detailblick auf und Trendanalysen zu Open Data in Government zu haben.

    Antworten

  3. Schönes Statistik! Doch was ist die Aussage? Weil andere Nationen Datensilos bauen, ist es eine gute Idee das auch in Deutschland zu machen? Es geht ganz schlicht und einfach um Interoperabilität! Und nationale Lizenzlösungen sind da schlicht und einfach der falsche Weg. Das wissen alle die sich mit Lizenzen befassen.

    Das in den diversen Datenportalen teilweise auch Kraut und Rüben herrscht, kann doch nicht den Maßstab für Deutschland setzen! Wir brauchen folgendes: a) qualitativ hochwertige Daten die für potentielle Nachnutzer tatsächlich interessant sind, diese Daten müssen b) in maschinenlesbaren Formaten vorliegen (technische Offenheit/Interoperabilität) und c) unter Lizenzen stehen die die Nachnutzung auch zu kommerziellen Zwecken ermöglicht (rechtliche Offenheit/Interoperabilität).

    Die für das Bund-Länder-Portal govdata.de vorgeschlagenen Lizenzen (https://github.com/fraunhoferfokus/ogd-metadata/tree/master/lizenzen) sind 100% unbrauchbar! Selbst die vermeintlich offene „Attributions-Variante“ führen dazu, dass deutsche Verwaltungsdaten nicht mit anderen Daten die offen Lizensiert sind (z.B. Creative Commons CC-0 oder CC-BY) kombiniert werden können. Warum das so ist haben wir hier wie an anderer Stelle ausführlich erklärt: http://not-your-govdata.de/

    Die einzig sinnvolle Lösung ist die Verwendung von Public Domain (was nach §5 Urheberrecht für den Großteil von PSI (Public Sector Information) gelten könnte) oder offenen Lizenzen, die eine hohe Interoperabilität mit anderen offenen und international anerkannten Lizenzen aufweisen. Eine Liste solcher Lizenzen gibt es hier: http://opendefinition.org/licenses/

    Man sieht auf den ersten Blick, dass weder die nationale Lizenz aus Großbritannien noch die aus Frankreich, oder aus anderen Ländern dort auftauchen. Wieso? Weil solche Insellösungen eben ungeeignet für offene Daten und deren Nachnutzung sind. Punkt. Daran ändern auch diese Statistiken nichts.

    Antworten

    • Hallo Daniel, das ist eine Bestandserhebung. Eine Bewertung ist aus verschiedenen Perspektiven möglich, die von den jeweiligen Experten zu ziehen wären. Dabei ist gut zu wissen, dass die CC-Lizenzen genutzt werden, aber noch grosses Potential nach oben haben. Das ist ein Beitrag, diesen Stand zu vermitteln. Eine Diskussion zu den Inhalten und der Nutzung von Lizenzen in Deutschland ist an anderer Stelle und mit anderen zu fuehren.

      Antworten

      • Die Bestandserhebung ist selektiv und kann auf diese Weise natürlich nur das gewünschte Bild wieder geben, dass im Rahmen von DataGov.de wohl gerne gesehen werden möchte.
        Dringend notwendig ist eine Ausdehnung der Basisdaten und eine weitreichende globale Erhebung, nicht etwa eine Beschränkung auf die Lizenzen aus Portalen ausgewählter europäischer Nachbarstaaten. Lizenzen machen halt vor Grenzen, offene Daten jedoch nicht!
        Creative Commons führt beispielsweise Buch über die Nutzung von CC-Lizenzen http://wiki.creativecommons.org/Government_use_of_Creative_Commons
        Da ist doch zu fragen, warum diese Beiträge zur Bestandserhebung von unerwünschten Lizenzen anderer nicht einmal erwähnt werden. Dass DataGov.de der „Lizenzeritis“ Vorschub leisten will, scheint mir eine nahe liegende Folge zu sein. Aber so auch noch ein empirische Fundament für eine Rechtfertigung finden zu wollen, das kann nicht gelingen. Alles, was dabei heraus kommen kann, ist die Bestätigung einer Hypothese in der Form „Die anderen sind genauso desensibilisiert wie wir und daher haben wir Recht.“

        Antworten

        • Haben Sie vielen Dank fuer den interessanten Link. Die im Blog wiedergegebene Bestandserfassung ist nur selektiv in Bezug auf die Verfuegbarkeit der Zahlen zum Datenbestand und der jeweils genutzten Lizenzen nationaler Datenportale – und einfach der Zeit geschuldet, die mir persönlich für die Arbeit daran zur Verfügung steht. CKAN macht es einfach, andere Technologiebasen erschweren es. Es wuerde mich jedenfalls sehr freuen, wenn die Bestandserfassung um aktuelle, verifizierbare Zahlen anderer nationaler Datenportale ergaenzt werden wuerde.

          Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.