Interoperabilität in Datenräumen: damals, heute und in der Zukunft
9 mins read

Interoperabilität in Datenräumen: damals, heute und in der Zukunft


Das Thema Datenräume hat in Europa und darüber hinaus an Dynamik gewonnen. In diesem Blogbeitrag verraten wir es Ihnen kompakt die Geschichte des Konzepts, die aktuelle Definition und was bedeutsam Es gibt Herausforderungen bei der Umsetzung der Idee in die Praxis.

DANN

Das Konzept der Datenräume wurde 2005 eingeführt [1] und bezog sich ursprünglich auf den Datenverwaltungsansatz zur Verwaltung mehrerer Datenquellen im Kontext einer Organisation. In diesem Zusammenhang reicht die Bedeutung des Begriffs „Organisation“ von beispielsweise Unternehmen und Behörden (groß) bis hin zu Smart Homes und persönlichen Geräten (klein). Gemeinsam ist, dass diese Organisationen immer vielfältigere, umfangreichere und miteinander verbundene Datenquellen verwalten müssen, was zahlreiche Herausforderungen für das Informationsmanagement mit sich bringt, wie zum Beispiel:

  • Erholung: Wie sucht und fragt man Daten in heterogenen Datenquellen ab?
  • Regeln: Wie setzt man Richtlinien um? Wie kann Integrität sichergestellt werden? Wie gehe ich mit Namenskonventionen um?
  • Zugang: Wie kontrolliere ich den Datenzugriff? Wie kann die Verfügbarkeit sichergestellt werden?
  • Evolution: Wie verwaltet man nicht nur Daten, sondern auch Metadaten im Laufe der Zeit?

Wie die Autoren betonen, handelt es sich bei Datenräumen (damals „Dataspaces“ geschrieben) nicht um einen Datenintegrationsansatz. [1]. Datenintegrationsansätze erfordern einen hohen Vorlaufaufwand und eine semantische Integration, bevor ein Dienst bereitgestellt werden kann. Stattdessen liegt der Fokus von Datenräumen auf der Koexistenz von Daten. Daher ist weder eine vorherige Integration noch eine ausschließliche Kontrolle über Daten erforderlich, um einen Datenraum zu ermöglichen.

Die zur Implementierung von Datenräumen erforderlichen Dienste basieren auf der Kernfunktionalität für alle Datenquellen, der Unterstützung aller Datentypen im Datenraum, ausschließlich On-Demand-Integrationsbemühungen und „Best Effort“-Ergebnissen für Datenabfragen. Zu den geplanten datenraumermöglichenden Diensten gehörten beispielsweise Datenkatalogisierung, Datensuche und -abfrage, Datenerkennung, Datenverfolgung, Datenaktualisierung und Ereigniserkennung.

Ein wichtiges Merkmal der ursprünglichen Definition von Datenräumen besteht darin, dass sie auf den Anforderungen der Datenverwaltung im Kontext einer Organisation basiert. Obwohl die Autoren Beispiele für Organisationen nennen, die von mehreren (Unter-)Organisationen gebildet werden (z. B. große wissenschaftsbezogene Kooperationen, mehrere Regierungsbehörden usw.), betonen sie dies nicht. Interessanterweise sind Möglichkeiten der Zusammenarbeit zwischen Organisationen in den Mittelpunkt der Datenrauminitiativen gerückt, die wir heute sehen.

JETZT

Viele der jüngsten Initiativen, die sich mit der Implementierung von Datenräumen befassen, haben eine Definition verwendet, die die Vielfalt, Fülle und Beziehungen von Datenquellen herabsetzt, obwohl diese Merkmale immer noch gelten. Stattdessen betonen aktuelle Definitionen von Datenräumen als Ansätze zur Datenverwaltung die Existenz vieler Interessengruppen, die Daten austauschen (oder daran interessiert sind). Die Hauptakteure in einem Datenraum sind der Datenanbieter (normalerweise, aber nicht unbedingt der Dateneigentümer) und der Datenkonsument, gefolgt vom Datendienstanbieter. [2]. Datenanbieter stellen dem Datenraum über Kataloge Rohdaten zur Verfügung, und Datenkonsumenten profitieren von Rohdaten oder verarbeiteten Daten, die Datendienstanbieter einem Datenraum bereitstellen können. Datendienstleister können als Teilnehmer im Datenraum wahrgenommen werden, die Rohdaten verarbeiten und den Datenkonsumenten Analyseergebnisse liefern.

Aktuelle Forschung [2] Es organisiert die Hauptakteure des Datenraums in drei Schichten:

  • Datenanschlüsse und Infrastruktur: Es ist die unterste Ebene, die die Grundbausteine ​​für Datenräume bereitstellt. Es befasst sich mit Datenmanagement auf der Metaebene, das heißt, es geht um die Standardisierung von Methoden und Formaten zur Beschreibung von Daten und Teilnehmern in einem Datenraum, deren Auffinden, Identifizieren und Aushandeln von Verträgen auf der Grundlage vereinbarter Datennutzungsrichtlinien.
  • Dateninteroperabilität: In dieser mittleren Schicht besteht das Ziel darin, Dateninteroperabilität zu ermöglichen, also den tatsächlichen Datenaustausch (nicht den Metadatenaustausch) zwischen Teilnehmern zu unterstützen. Dazu gehören technologische Schnittstellen und Datenmodellierungsmaßnahmen. Auf dieser Ebene muss syntaktische und semantische Interoperabilität zwischen heterogenen Interessengruppen erreicht werden.
  • Datenwert: An der Spitze nutzt die Datenwertschicht die Dateninteroperabilität, um datenbezogene Dienste wie Datenanalyse und Datenqualitätsverbesserungen (Bereinigung, Feature-Auswahl, Feature-Engineering usw.) bereitzustellen.

Die meisten bestehenden Datenrauminitiativen haben sich auf Datenkonnektoren und -infrastruktur konzentriert, und dafür gibt es mindestens zwei Gründe. Da sie sich auf die unterste Schicht beziehen, bilden sie erstens die Grundlage für die oberen Schichten. Zweitens wurden Datenräume angesichts der wachsenden Besorgnis über die Datensouveränität als Möglichkeit vorgeschlagen, Vertrauen zwischen den am Datenaustausch beteiligten Teilnehmern zu schaffen. Zwei der prominentesten Initiativen im europäischen Datenraum, die den Aspekt der Datensouveränität betont haben, sind: IDS Und Thema-X. Wie auf der Gaia-X-Website erläutert, „ermöglicht und fördert Gaia-X die Schaffung von Datenräumen durch vertrauenswürdige Plattformen, die sich an gemeinsame Regeln halten, sodass Benutzer und Anbieter einander auf einer objektiven, sicheren und kostenlosen technologischen Basis vertrauen können, um sie zu teilen.“ und Austausch. Daten von verschiedenen Agenten”. [3] Insbesondere im Hinblick auf die Implementierung von Datenkonnektoren Eclipse-Datenkomponenten (EDC)-Rahmen ist eine wichtige Initiative. Sie beschreiben einen Datenraum-Connector als „logische Gatekeeper, die sich in jeden integrieren“. [data space] Infrastruktur der Teilnehmer und kommunizieren untereinander“ [4].

Interoperabilität in Datenräumen
Abbildung 1: Teilnehmer und wichtige Datenraum-Enabler (angepasst von [2])

NÄCHSTE

Die Realisierung funktionaler Datenräume hängt von der Verfügbarkeit von drei Schlüsselfaktoren ab (Datenkonnektoren und -infrastruktur, Dateninteroperabilität und Datenwert). Einerseits gab es große Initiativen zur Schaffung vertrauenswürdiger Frameworks, um die Mittel für den Datenaustausch auf Metaebene bereitzustellen (dh den Austausch über Teilnehmer und ihre Daten, nicht über die Daten). Es gibt jedoch noch viel zu tun. Das Fehlen gemeinsamer Definitionen von Datenräumen und Konnektoren kann die Interoperabilität sogar auf Metaebene verhindern. Beispielsweise wurden von verschiedenen Initiativen unterschiedliche Richtlinienimplementierungssprachen verwendet (z. B. ODRL, IDS Usage Language, LUCON), ganz zu schweigen von der Inkompatibilität zwischen verschiedenen Connector-Implementierungen.

Obwohl die Arbeit an Datenkonnektoren und Infrastruktur für Datenräume noch nicht abgeschlossen ist, warten die nächsten Herausforderungen auf Sie: Dateninteroperabilität und Datenwert. Im Hinblick auf die Dateninteroperabilität Initiativen im Zusammenhang mit semantischen Daten, einschließlich Daten im Zusammenhang mit Dienstschnittstellen der nächsten Generation. [5] und das Smart Data Models-Programm [6] Sie haben zur technologischen Grundlage neuer interoperabler Daten und Dienste beigetragen. Allerdings handelt es sich bei den meisten vorhandenen Datenquellen und zugehörigen Anwendungen um unabhängig erstellte Legacy-Systeme, bei deren Entwurf die semantische Interoperabilität nicht berücksichtigt wurde. Daher ist der Integrationsaufwand sehr hoch. Der Abgleich von Daten aus verschiedenen Datenquellen ist eine mehrstufige Herausforderung: Wie in Abschn [2], ist ein semantischer Abgleich zwischen verschiedenen Ontologien (oder Wörterbüchern), zwischen Datenschemata und Ontologien sowie zwischen Datenentitäten verschiedener Organisationen erforderlich. NEC Lab hat mit der TrioNET-Lösung ein Beispiel für Forschungsarbeit zur Bewältigung dieser Herausforderungen gesetzt [7].

Interoperabilitätsprobleme in DatenräumenInteroperabilitätsprobleme in Datenräumen
Abbildung 2: Dateninteroperabilitätsprobleme in Datenräumen (gemäß der Norm). [2]).

SAMMELN

  • Dann, Datenräume waren ein Ansatz zur Datenverwaltung, der nicht auf Datenintegration ausgerichtet war.
  • Jetzt, Datenräume beziehen sich auf die Verwaltung von Daten in einer vertrauenswürdigen Umgebung, in der viele Akteure Daten austauschen. Datenräume verfügen über drei grundlegende Ebenen: Konnektoren und Infrastruktur, Dateninteroperabilität und Datenwert. Aktuelle Entwicklungen im Datenbereich konzentrieren sich auf Konnektoren und Infrastruktur.
  • nächste, Dateninteroperabilität muss ausgearbeitet werden. Herausforderungen beziehen sich auf Bindungsmechanismen und Steckerkompatibilität.

Datenräume am IESE

Als Mitglied der International Dataspaces Association sind wir seit vielen Jahren an der Gestaltung des aktuellen Konzepts der Datenräume beteiligt. Im Jahr 2020 startete das Fraunhofer-Leuchtturmprojekt COGNAC hat die Eignung digitaler Zwillinge zur Schaffung eines Datenraums für den Agrarbereich untersucht. Kürzlich, Wir untersuchten die Anwendbarkeit der Gaia-X- und EDC-Technologien zur Bewältigung von Interoperabilitätsproblemen im Agrarbereich.. Wir haben mehrere Anwendungsfälle aus diesem Bereich extrahiert und verglichen, was Gaia-X derzeit unterstützen kann und wie dies die Interoperabilität abdeckt. Um die Herausforderung des Matchings von Entitäten weiter anzugehen, untersuchen wir derzeit den Einsatz von LLMs, um die Interoperabilität zwischen den Systemen verschiedener Organisationen im Agrarbereich zu verbessern, die unterschiedliche Standards unterstützen.

Benötigen Sie konzeptionelle oder technologische Unterstützung beim Aufbau oder der Zusammenführung eines Datenraums? Unsere Experten aus den Abteilungen Central Architecture Engineering und Security Engineering helfen Ihnen gerne weiter. Bleiben Sie mit uns in Kontakt!

Verweise:

[1] Franklin, Michael, Alon Halevy und David Maier. „Von Datenbanken zu Datenräumen: Eine neue Abstraktion für das Informationsmanagement.“ ACM Sigmod-Datensatz 34,4 (2005): 27-33.

[2] Solmaz, Gürkan et al. „Datenräume ermöglichen: Aktuelle Entwicklungen und Herausforderungen“. Vorträge des 1. Internationalen Workshops zur Datenökonomie. 2022

[3] Thema-X. „Thema-X: Föderierte sichere Dateninfrastruktur“. https://gaia-x.eu/. Zugriff am 4. März 2024.

[4] Eclipse Dataspace-Komponenten. „Eclipse Dataspace-Komponenten“. https://eclipse-edc.github.io/docs/#/README. Zugriff am 4. März 2024.

[5] ETSI Industry Specification Group (ISG). „Kontextuelles Informationsmanagement (CIM); NGSI-LD API“. Technischer Bericht. 2021 https://www.etsi.org/deliver/etsi_gs/CIM/001_099/009/01.04.01_60/gs_cim009v010401p.pdf. Zugriff am 4. März 2024.

[6] Smart Data Model-Programm. „Intelligente Datenmodelle“. https://smartdatamodels.org/. Zugriff am 4. März 2024.

[7] NEC Laboratories Europa. „Datenökosysteme und Standards“. https://www.neclab.eu/research-areas/system-platforms-for-ai-and-des/des. Zugriff am 4. März 2024.



technische Probleme auf

Leave a Reply

Your email address will not be published. Required fields are marked *