Nationale Forschungsdaten-Infrastruktur

Illustration mit alten Datenträgern
Die Wissenschaft für die Zukunft fit machen

Daten sind die Grundlage einer jeden wissenschaftlichen Disziplin. Ohne ausreichende Datengrundlage sind Forschung und Erkenntnisgewinn unmöglich. Doch wie lassen sich diese technologisch für alle sichtbar und nachvollziehbar zur Verfügung stellen und zugleich rechtliche und ethische Standards einhalten? Dieser Mammutaufgabe widmet sich ein bundesweiter Zusammenschuss aus Hochschulen, Forschungseinrichtungen, Rechenzentren, Museen, Bibliotheken, Archiven und auch Akademien. Ziel ist der Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI). Mit bis zu 100 Millionen Euro jährlich fördern Bund und Länder zehn Jahre lang das Vorhaben, an dem 26 Konsortien mitarbeiten. Forschende der Hochschule Darmstadt sind unter anderem für die Geistes- und Sozialwissenschaften federführend beteiligt.

Von Astrid Ludwig, 25.2.2025

Das Dilemma kennt sicher jeder Forscher und jede Wissenschaftlerin. Wo finde ich Daten, die meine Forschungsarbeit ergänzen, untermauern oder womöglich widerlegen? Wie komme ich an diese Informationen, wie und wo wurden die Daten erhoben – und darf ich sie überhaupt nutzen? Marc Rittberger, Professor für Informationsmanagement am Fachbereich Media der Hochschule Darmstadt und Wissenschaftler am Frankfurter Leibniz-Institut für Bildungsforschung und Bildungsinformation (DIPF), erinnert sich an einen prominenten Fall und ein Beispiel, wie es aus heutiger Sicht nicht sein sollte: „Vor 20 Jahren etwa waren die Daten der PISA-Studie nicht für alle zugänglich“, berichtet er. Obwohl es sich dabei um eine internationale Studie der OECD handelte, die das Leistungs- und Bildungsniveau an Schulen in ihren Mitgliedsstaaten untersuchte. Inzwischen hat sich das in diesem Fall natürlich geändert, aber noch immer gleicht die bundesweite und internationale Welt der Forschungsdaten oftmals einem unübersichtlichen Dickicht, in dem sich die Suche und Nutzung wichtiger Wissensbausteine eher schwierig und intransparent gestaltet.

26 Konsortien mit über 1500 Mitarbeitenden

Eine Situation, die das Konsortium für die Nationale Forschungsdateninfrastruktur sowie Forschende der h_da zumindest auf bundesdeutscher Ebene ändern wollen. „Bessere Infrastruktur bedeutet auch einen besseren Zugriff auf Forschung“, fasst Stefan Schmunk, h_da-Professor für Informationswissenschaft und Digitale Bibliothek, das Anliegen zusammen. „In allen wissenschaftlichen Disziplinen sind Daten von virulenter Bedeutung. Wie gehe ich mit Daten um und wie entwickele ich Standards für ihre Erhebung und Nutzung, das sind Fragen, die uns seit Jahrzehnten umtreiben“, betont er. Das gilt nicht nur für Hochschulen, wissenschaftliche Institute oder Bildungseinrichtungen, auch für Rechenzentren, Museen, Archive oder Bibliotheken sind das grundlegende Fragen, die seit der Digitalisierung noch drängender und komplexer geworden sind.

Seit 2014 befasst sich daher mit diesen Themen unter anderem der in Göttingen angesiedelte Rat für Informationsinfrastrukturen (RfII), der als Sachverständigengremium auch Politik und Wissenschaft berät. Seit 2019 fördern Bund und Länder den Aufbau des Mega-Projekts „Nationale Forschungsdateninfrastruktur (NFDI)“. Bis 2030 sollen jährlich hundert Millionen Euro investiert werden. Es ist eines der größten Förderprojekte des Bundesministeriums für Bildung und Forschung (BMBF). „Wir sind da weltweit führend“, sagt h_da-Professor Schmunk. 2020 wurden für den Aufbau des Netzwerkes eigens in Karlsruhe eine Geschäftsstelle und ein Verein gegründet, dem unterdessen über 300 Institutionen angehören. „Wir müssen Wissenschaft und Forschung für die Zukunft fit machen“, so Schmunk.

26 Konsortien – mit jeweils 40 bis 50 beteiligten Mitarbeitenden aus unterschiedlichen Einrichtungen – sind an dem Aufbau beteiligt. Professor Schmunk und sein Kollege Rittberger befassen sich bereits seit Jahren intensiv mit der Datenkuratierung und -vermittlung. Die Hochschule Darmstadt ist in leitender Funktion an insgesamt vier Konsortien beteiligt, die die Geisteswissenschaften, aber auch die Ingenieurwissenschaften adressieren. Laut Schmunk eine Besonderheit: „Die h_da ist eine der wenigen Hochschulen für Angewandte Wissenschaften in Deutschland, die stark vertreten ist und in einer Reihe von Konsortien als Antragsteller mitarbeitet“.

Es reicht nicht, einfach nur Daten abzulegen

Darunter sind er und auch sein Kollege Marc Rittberger. So leitet Stefan Schmunk seit 2021 das Konsortium „NFDI4Memory“ an der h_da. „Wir wollen die Geschichtswissenschaft sowie Gedächtniseinrichtungen in den Umgang und die Nutzung von Daten einbinden und bedarfsgerechte Angebote für Forschung und Lehre entwickeln“, sagt er.  Professor Rittberger ist mit seinem Team federführend für den Bereich Bildung im „KonsortSWD“ zuständig. Das Konsortium entwickelt die Infrastruktur für Forschungsdaten in der Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften deutschlandweit. Für die beiden Wissenschaftler ist Vernetzung das große Ziel. Sie wollen eine forschungsorientierte Infrastruktur für die genannten Wissenschaftsdisziplinen aufbauen helfen. „Es reicht nicht, einen Speicher zu haben und dort einfach nur Daten abzulegen. Wir müssen Wissenschaftler*innen einen analytischen Zugriff mit verschiedenen Tools und Werkzeugen ermöglichen. Und wir müssen ihnen die Fähigkeiten geben, diese dann auch zu nutzen. Dies kann nur gelingen, wenn Universitäten, Hochschulen, Bibliotheken, Archive und Museen kooperieren“, betont Schmunk.

Für Schmunk und Rittberger ist es essenziell, Forschungsdaten besser zu archivieren – und zwar so, dass diese auch nachvollziehbar und überprüfbar sind. „Wir müssen dabei inhaltlich und fachlich Grenzen überwinden“, sagt Rittberger. So müssten etwa leitfadenorientierte Interviews für eine Studie so aufbereitet werden, „dass sie auch zehn Jahre später von Menschen verstanden werden, die nicht an dem Projekt mitgearbeitet haben“. Zudem müssen Forschungsdaten auffindbarer und sichtbarer als bisher werden. Wieder gibt Rittberger ein Beispiel und verweist auf eine Studie zur Mehrsprachigkeit im Unterricht und dem Umgang mit Sprache bei Schülern und Schülerinnen. Dass es diese Studie gebe, sei bisher zu wenig bekannt.

In dem Mammutprojekt NFDI gilt es, sehr viele Aspekte zu berücksichtigen. „Datenschutz spielt eine große Rolle“, so die beiden Forscher. Gerade im Bildungsbereich etwa, wenn es um Daten von Schulkindern gehe. Dabei müsse Wert gelegt werden auf eine gewissenhafte Anonymisierung und ein hohes Maß an Sicherheit. Komplex ist auch der Datenmix. So fließen etwa in der Astrophysik gigantische Datenströme aus dem Weltall in die Speicher; in den Geistes- und Sozialwissenschaften dagegen gibt es hochkomplexe Datensätze, die beispielsweise aus unterschiedlichen Datentypen bestehen. In Zeiten der Digitalisierung kommen andere Formen wie Fotos, SMS, Ton oder Film, aber auch digitale Nutzungsdaten dazu. Stefan Schmunk hat unter anderem an dem Bestandsausbau des Liebesbriefarchives unter dem Titel „Gruß und Kuss“ mitgewirkt. „Die Heterogenität der Daten ist unerschöpflich und reicht von Graffiti über Briefe, Tonaufnahmen, WhatsApp-Nachrichten bis hin zu Emails.“ Die Frage ist hier, wie bringe ich all das zusammen und mache es zugänglich?

Wem gehören die Daten überhaupt?

Generell stellt sich die Frage, welche Daten überhaupt gespeichert werden sollen. Laut Marc Rittberger gibt es allein in den Erziehungswissenschaften rund 2.000 Professoren und Professorinnen an Hochschulen und Universitäten, die jedes Jahr tausende Bachelor- und Masterabschlüsse betreuen. Hier müssten niederschwellige Lösungen für die Datenkuratierung und Archivierung gefunden werden, sagt er. Allein daran wird die Komplexität der Aufgabe sichtbar. Ähnliche Fragen stellen sich ebenso in den anderen zwei Konsortien, an denen die h_da beteilig ist – für die Ingenieurwissenschaften sowie die Kulturwissenschaften.

Die beiden h_da-Wissenschaftler treibt aber auch noch ein anderer Aspekt um: Die gigantischen Datenmengen, die im Internet entstehen, auf Plattformen wie X, bei Instagram, TikTok oder WhatsApp, bei Apple oder Microsoft. „Diese Daten gehören meist gar nicht mehr uns, sind aber eine wunderbare Grundlage für Forschungen, beispielsweise in den Geisteswissenschaften.“ Daher ist es für Schmunk und Rittberger eine gesellschaftliche Frage, diese Daten zugänglich zu machen. „Das können wir nicht nur den kommerziellen Interessen von Megakonzernen überlassen.“

Vorhaben ist führend in Europa und auch international

Die Initiative für eine Nationale Forschungsdateninfrastruktur sucht derzeit weltweit ihresgleichen, so die h_da-Professoren. „Wir sind da führend im europäischen Kontext und andere Forschende und Länder beneiden uns oftmals um dieses Vorhaben“, berichtet Rittberger. Erste Ergebnisse können die beiden Teilprojekte der h_da-Forscher bereits zu den Kompetenzen und zum Nutzungsverhalten von Wissenschaftler*innen vorweisen. Während „NFDI4Memory“ Digitalkompetenzen historisch arbeitender Wissenschaftler*innen untersucht hat, wurde im Teilprojekt von Professor Rittberger ein Standardisierter Datenmanagementplan für die Bildungsforschung entwickelt. Beide Konsortien beteiligen sich intensiv daran, das NFDI-Netzwerk bis 2030 aufzubauen. Es werde darüber hinaus jedoch viele Jahre nötig sein, das Netzwerk zu fördern, weiterzuentwickeln und nachhaltig zu machen, sagt Schmunk. „Wir müssen eine dauerhafte Lösung finden.“ Doch schon jetzt arbeiteten viele Studierende, Doktorandinnen, Doktoranden oder auch wissenschaftliche Mitarbeitende in den Konsortien mit. „Und das ist die beste Form der Nachhaltigkeit für unser Anliegen“, findet der Professor.

Kontakt zur h_da Wissenschaftsredaktion

Christina Janssen
Wissenschaftsredakteurin
Hochschulkommunikation
Tel.: +49.6151.533-60112
E-Mail: christina.janssen@h-da.de

Illustration: Jenny Adam

Portraitfotos: Britta Hüning