Jump to main content
Professur Datenmanagement
Research
Professur Datenmanagement 

Forschung

Open Data Week
2024-04-16
Professor Dr. Martin und die Professur waren an der Data Week Leipzig'24 aktiv beteiligt. Referenz Artikel als Audio: HIER oder als Webseite HIER

FAIR und Open Data. Im Rahmen des EU Data Act und des Forschungsdatengesetzes werden Daten zukünftig unter Einhaltung der FAIR-Prinzipien vermehrt als Open Data veröffentlicht. Das Ziel besteht darin, Daten aus Forschung und Verwaltung für relevante Interessengruppen auffindbar und nutzbar zu machen. Dies erfordert jedoch die Evaluierung neuer Technologien in verschiedenen Bereichen. Wichtige Aspekte hierbei sind die Entwicklung und Bewertung semantischer Metadatenvokabulare für DCAT-Datenkataloge, rechtliche Rahmenbedingungen und das Lifecycle-Management rund um die veröffentlichten Daten.

Wissensgraphen und Datenintegration. Wissensgraphen und die damit verbundene Integration verteilter Daten spielen zunehmend eine zentrale Rolle in der globalen Informationslandschaft des Webs. Teilaspekte dessen, wie das Semantic Web (unter Nutzung der W3C-Standards RDF/RDFS/OWL) und Linked Data sind weiterhin Gegenstand intensiver Forschung. Dabei werden Technologien aus dem Web genutzt, die den meisten Web-Entwickler:innen bekannt sind, wie beispielsweise die Protokolle HTTP sowie Identifikationskonzepte wie IRIs, URIs und URNs. Durch diese sich entwickelnde Informationsvernetzung können Daten mit konzeptuellen Beschreibungen und Kontextinformationen (Semantik) verbunden werden und darauf aufbauende Informationsbausteine organisationsübergreifend exploriert, genutzt, veredelt und revisioniert werden. Dies ermöglicht effizientere Integrationsprozesse für Daten, wodurch sich auch klassische Migrationsaufgaben verändern werden. Ein besonders wichtiger Aspekt bei der Erstellung von Wissensgraphen ist die Integration und Adaption von Daten aus Bestandssystemen. Hierbei kommen heterogene, teilweise sehr komplexe, Konvertierungsmechanismen zum Einsatz, um diverse Sprachen miteinander zu integrieren (zB. SPARQL2SQL, RDB2RDF).

Analysis and evaluation of data, support processes for data sciences. Another aspect of research in the field of data management is related to technologies from the field of artificial intelligence. Large Language Models (LLMs) are currently being investigated in order to understand their advantages and disadvantages as well as possible applications in various social areas, industrial environments and research disciplines. On the one hand, the extent to which the combination of knowledge graphs and LLMs improves the use of data (transparency, explainability, timeliness, …) is examined. On the other hand, the use of LLMs in concept and schema creation is being researched. The integration of APIs with LLMs (such as ChatGPT, BERT, LLAMA etc.) in combination with integrated development environments (IDEs) is particularly exciting. Other supporting activities come from the area of ontology evolution and repair. There is also great interest in the connection of APIs in data management tools, which enable efficient and qualitative pipelining of data and services.

Veröffentlichungen

For all current publications please visit the link HIER