Linked Open Data

Linked Open Data (LOD) bezeichnet im World Wide Web frei verfügbare Daten, die per Uniform Resource Identifier (URI) identifiziert sind und darüber direkt per HTTP abgerufen werden können und ebenfalls per URI auf andere Daten verweisen. Idealerweise werden zur Kodierung und Verlinkung der Daten das Resource Description Framework (RDF) und darauf aufbauende Standards wie die Web Ontology Language (OWL) und die Abfragesprache SPARQL verwendet, damit sie von Maschinen in ihrer Bedeutung richtig interpretiert werden können. Somit ist das Linked Open Data Teil des Semantic Web. Die miteinander verknüpften Daten ergeben ein weltweites Netz, das auch als „Linked [Open] Data Cloud“ oder „Giant Global Graph“ bezeichnet wird. Dort, wo der Schwerpunkt weniger auf der freien Nutzbarkeit der Daten wie bei freien Inhalten liegt (Open Data), ist auch die Bezeichnung Linked Data üblich.

Idee offener vernetzter Daten

Offene vernetzte Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht und über das World Wide Web miteinander vernetzt sind.[1] Ein Beispiel für einen Standard unter der Nutzung dieser Prinzipien ist Akoma Ntoso, auf dessen Grundlage in Deutschland offene, maschinenlesbare, vernetzte und adressierbare Rechtsetzungs- und Parlamentsdokumente veröffentlicht werden sollen.[2]

Grundkonzept

Während das WWW ein Netz aus Webseiten ist, soll mit Linked Open Data ein Netz aus Daten entstehen, die aus verschiedenen Quellen zusammen automatisch weiterverwendet werden können (Informationsintegration). Das Konzept von Linked Open Data geht im Wesentlichen auf Tim Berners Lee zurück, der auch Ende 2007 die Bezeichnung „Giant Global Graph“ (GGG) vorschlug.[3] Er prägte vier Regeln für Linked Data:[4]

  1. Use URIs as names for things
  2. Use HTTP URIs so that people can look up those names.
  3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)[5]
  4. Include links to other URIs, so that they can discover more things.
  1. Verwende zur Bezeichnung von Objekten URIs.
  2. Verwende HTTP-URIs, so dass sich die Bezeichnungen nachschlagen lassen.
  3. Stelle zweckdienliche Informationen bereit, wenn jemand eine URI nachschlägt (mittels der Standards RDF und SPARQL).
  4. Zu diesen Informationen gehören insbesondere Links auf andere URIs, über die weitere Objekte entdeckt werden können.
Verknüpfung zwischen Linked Open Data Datenbeständen (September 2011)

Eine populäre Darstellung der Linked Open Data Cloud wurde im Oktober 2007 erstellt und seitdem mehrmals aktualisiert.[6] Sie enthält beispielsweise die Datenbestände von DBpedia und GeoNames.

Siehe auch

Weblinks

Einzelnachweise

  1. Jörn von Lucke, Christian P. Geiger: Open Data Government. Frei verfügbare Daten des öffentlichen Sektors. (PDF; 500 kB) (Nicht mehr online verfügbar.) In: Zeppelin University. 3. Dezember 2010, S. 4, archiviert vom Original am 14. Dezember 2010; abgerufen am 29. Juni 2019.
  2. Amelie Flatt, Arne Langner, Olof Leps: Model-Driven Development of Akoma Ntoso Application Profiles. Hrsg.: Springer Nature. 1. Auflage. Springer Nature, Heidelberg 2022, ISBN 978-3-03114131-7 (springer.com [abgerufen am 19. August 2022]).
  3. Paul Miller: Who is afraid of the GGG? (Memento vom 1. Dezember 2007 im Internet Archive) In: Nodalities Blog, 26. November 2007.
  4. Linked Data – Design Issues. In: w3.org, abgerufen am 29. Juni 2019.
  5. Der Nachsatz „using the standards (RDF, SPARQL)“ wurde erst später eingeführt, siehe Version vom 15. November 2006.
  6. Richard Cyganiak, Anja Jentzsch: The Linked Open Data Cloud. Oktober 2007 bis September 2011.

Auf dieser Seite verwendete Medien

LOD Cloud Diagram as of September 2011.svg
Autor/Urheber:

Richard Cyganiak

Anja Jentzsch, Lizenz: CC BY-SA 3.0
The following diagram visualizes the data sets in the LOD cloud as well as their interlinkage relationships. Each node in this cloud diagram represents a distinct data set published as Linked Data. The arcs indicate that RDF links exist between items in the two connected data sets. Heavier arcs roughly correspond to a greater number of links between two data sets, while bidirectional arcs indicate the outward links to the other exist in each data set.