BMBF call

Überblick: Rolle und Leistungen der Plattform MaterialDigital und ihre Wechselwirkung mit der aktuellen BMBF Ausschreibung MaterialDigital

Stand 06.12.2019; Bitte beachten Sie, dass die Plattform MaterialDigital aufgrund ihres Entstehungsprozesses Veränderungen unterliegt. Aktuelle Informationen finden Sie stets unter www.materialdigital.de

Disclaimer: Die folgenden Ausführungen spiegeln Sicht und Planungsstand der Plattformverantwortlichen wider. Etwaige Widersprüche gegenüber Formulierungen im Ausschreibungstext sind in jedem Falle zu Gunsten desselben auszulegen.

Ansatz Plattform

Ziel der Plattform MaterialDigital (PMD) ist der Aufbau der Strukturen für einen virtuellen Materialdatenraum und für die Systematisierung des Umgangs mit hierarchischen, prozessabhängigen Werkstoffdaten. Kernpunkte sind dabei die Erarbeitung von Übereinkünften zu Datenstrukturen und Schnittstellen, die in konkreten Software-Werkzeugen implementiert werden und Nutzerinnen und Nutzern der PMD einen einfachen Zugang und konkreten Mehrwert in eigenen Projekten bieten. Die „Befüllung“ des Frameworks mit Daten soll dabei auf dezentralen Servern durch die Anwender stattfinden, , nicht etwa durch die Plattform selbst. Die Use Cases im Rahmen der Ausschreibung sollen dazu dienen, eine einheitliche Herangehensweise zu identifizieren und zu etablieren.

Klärung Begrifflichkeiten

Plattform
Die Plattform MaterialDigital stellt die Infrastruktur dar, die für einen einheitlichen Austausch und die Verknüpfung von Daten, Softwarelösungen und Ontologien zum Umgang mit Materialien notwendig ist. Sie bildet damit die strukturelle Basis mit der Daten und Software aus verschiedenen Anwendungsfeldern miteinander verknüpft werden können. Die Plattform wird erstellt und repräsentiert durch die Plattformverantwortlichen.
Plattformverantwortliche
Das Konsortium, das die Plattform MaterialDigital seit dem Beginn einer ersten Förderperiode im Juli 2019 betreut, besteht aus der Bundesanstalt für Materialforschung und -prüfung (BAM), dem Karlsruher Institut für Technologie (KIT), dem Max-Planck-Institut für Eisenforschung (MPIE), dem Fraunhofer Institut für Werkstoffmechanik (IWM) und dem Leibniz-Institut für Werkstofforientierte Technologien (IWT).
Use Cases
Anwendungsfälle, die auf Basis der Plattform implementiert werden, sollen initial im Rahmen geförderter Projekte erzeugt und kompatibel mit der Plattform strukturiert werden.
Domänenexperten/Community:
Die Plattform möchte den Umgang mit Werkstoffen systematisieren, kann aber natürlich nicht selbst alle Teilbereiche der Disziplin abbilden. Die Experten der materialwissenschaftlichen Community sollen hierfür eine Umgebung erhalten um ihren spezifischen Wissensteil ergänzen zu können, bspw. anhand von Use Cases.

Interdependenz Ausschreibung und Plattform MaterialDigital

Zukunftsvision

Der Ansatz der Plattform zielt mittelfristig auf einen fundamental vernetzten Umgang mit Daten aus der Disziplin der Materialwissenschaft und Werkstofftechnik insbesondere in einem industriellen Kontext ab. Zu diesem Zweck sollen in Zukunft dezentrale Server mit Daten durch einheitliche, von der Plattform definierte Frameworks nicht nur abfragbar sondern auch auswertbar werden. Fragen nach der Datensicherheit sowie -souveränität stehen dazu bei sämtlichen Bemühungen der Plattform im Vordergrund. Die Plattform sowie die darin kollaborierenden Projektpartner erhoffen sich von einem geteilten Ansatz zukunftsweisende Synergien im Umgang mit erzeugten Datenschätzen, sodass Eigenschaften und Verhaltensweisen des Materials besser verstanden, Optimierungen gezielter möglich und Produktionsprozesse effizienter werden.

Ziel Ausschreibung

Der vom BMBF im Kontext der Plattform am 20.09.2019 veröffentlichte Aufruf zur Einreichung von Anträgen für die „Förderung von Zuwendungen von Vorhaben im Rahmen der Initiative zur Digitalisierung der Materialforschung in Deutschland (MaterialDigital)“ zielt dabei zunächst grundsätzlich darauf ab, “die Materialforschung, -entwicklung und -herstellung sowie die Verarbeitung von Materialien bis zum Bauteil und darüber hinaus mit innovativen digitalen Methoden, Konzepten und Verfahren [...] in Deutschland auf ein solideres Fundament zu stellen. [...] Diese Fördermaßnahme adressiert innovative Methoden der Materialforschung aus den Bereichen (skalenübergreifende) Simulation, Materialdatenerfassung, -haltung und -auswertung sowie Verknüpfung von experimentellen und simulierten Daten auf allen Ebenen der Betrachtung, vom Atom bis zum Bauteil, zur Systematisierung der Materialentwicklung und -anwendung als geschlossenen Prozess mit Fokus auf die industrielle Anwendbarkeit.“ Die Frage nach der praktikabelsten Herangehensweise an diese Herausforderung muss nach Ansicht der Plattformverantwortlichen vor allem von den entsprechenden Experten der verschiedenen materialwissenschaftlichen Forschungsdomänen im Rahmen der Förderung beantwortet werden.

Schnittstelle PMD

Explizit gewünscht ist hierbei im Rahmen der Ausschreibung der Anschluss an die Plattform MaterialDigital mit ihrer industriellen Ausrichtung. Diese bemüht sich, die Kompatibilität und die Harmonisierung der aus der Förderung resultierenden digitalen Ansätze zu gewährleisten und hat sich daher zum Ziel gesetzt, bis zu Beginn der Förderung ab vorraussichtlich Q4/2020 (nach derzeitiger Planung) eine leichtgewichtige Infrastruktur bereitzustellen, die deren Integration vereinfacht. Die konkrete Umsetzung der notwendigen Schnittstellen kann dabei aber nur in der Zusammenarbeit mit den Use Cases nach Anlaufen der Förderung geschehen. Zur besseren Strukturierung wurden die zentralen technischen Herausforderungen deshalb auf Seiten der Plattform zunächst in zwei große Aufgabenbereiche unterteilt, im Hinblick auf die notwendigen Ontologien einerseits, sowie die Workflows andererseits (s. auch Ausschreibungstext Abschnitt 2.2). Diese sollen im vorliegenden Dokument aufgezeigt und beschrieben werden. Dementsprechend resultiert die, auch in der Ausschreibung verankerte Empfehlung, dass Ansätze weiterer Zuwendungs¬empfänger die entsprechenden Teilaspekte ebenso innerhalb ihrer Anwendungsfälle beachten sollten.

Aufgabenbereich Ontologien

Eine Ontologie für die Materialwissenschaft gemäß den Prinzipien des Semantic Web soll im Rahmen des Projekts bei der einheitlichen und standardisiert-anpassbaren Datenorganisation sowie -ablage, -abfrage und -aggregation helfen. Ein daraus resultierender Wissensgraph soll ermöglichen erzeugte Datensätze einheitlich zu strukturieren, inhaltlich zu analysieren, sowie neue Erkenntnisse aus den gewonnen Logiken abzuleiten. Die mittels des Wissensgraphen erreichbare Verknüpfung von Daten kann dann deren komplexe Zusammenhänge erschließbar machen, die in einfacherer Form heute in speziellen Modellen (in Form von Lehrbuchwissen) ausgedrückt werden. Aufgrund ihrer Komplexität kann die Ontologieentwicklung kaum isoliert stattfinden, sondern muss als gemeinsame Anstrengung der materialwissenschaftli- chen Community in Angriff genommen werden.

Klärung Begrifflichkeiten

Ontologie
Explizite, formelle Strukturierung geteilter Konzepte, die eine Domäne ausmachen. Eine Ontologie enthält dabei inhaltliche Verknüpfungen, entweder deskriptiv oder formell. Sie geht über eine reine taxonomische Ka tegorisierung hinaus und kann dadurch mehr leisten als eine Standardisierung. Eine Ontologie für die Materialwissenschaft und Werkstofftechnik sollte den skalenübergreifenden Charakter der Disziplin berücksichtigen. Sie muss in sich über eine relationale Beschreibung hinaus einen logischen Mehrwert bieten.
Linked Data
Möglichkeit, Relationen zwischen direkt zusammenhängenden oder synonymen semantischen Konzepten aufzuzeigen. Linked Data ermöglicht so eine Suche in und Verknüpfung von komplexen Datenstrukturen.
Wissensgraph
Der Wissensgraph greift auf Daten zu, die gemäß Linked Data strukturiert wurden und kann dadurch große Datenmengen aggregieren und gesammelt Erkenntnisse ableiten. In Kombination mit einer Ontologie kann er darüber hinaus komplett neue Erkenntnisse erzeugen oder die Ontologie auf ihre Konsistenz überprüfen.
SemanticWeb
Das W3C-konforme Framework, das eine eindeutige Ressourcenbeschreibung und die entsprechende Abfrage auf standardisierte Weise ermöglichen soll. Das Semantic Web ist ein „Stapel“ aus mehreren zugrundeliegenden Teiltechnologien für die entsprechenden Aufgabenbereiche.

Es ist nach Ansicht der Plattformverantwortlichen zentral die folgenden, grundlegenden Prinzipien zur Entwicklung der Ontologie anzuerkennen:

Die Ontologie für die Materialwissenschaft und Werkstofftechnik muss von den Domänenexperten und somit der jeweiligen Community, den Beitragenden und letztlichen Nutzern und Nutzerinnen definiert werden. Sprich, der eigentliche Prozess muss „Bottom-Up“ ablaufen. Die Informationswissenschaften können nur die grundlegende Struktur als Fundament des benötigten Datenraums beitragen.

Die Ontologie für die Materialwissenschaft und Werkstofftechnik muss gemäß geltender Forschungsgrundsätze auf eine Weise entwickelt werden, die niemals Vollständigkeit impliziert, sondern stets Adaptivität und weiteres Wachstum ermöglicht.

Die Ontologie für die Materialwissenschaft und Werkstofftechnik muss anwendungsorientiert innerhalb erster Domänen organisch wachsen und sich erst langfristig zu einer stärker gesamtheitlichen Abbildung der kompletten wissenschaftlichen Disziplin fügen.

Die Leistungsfähigkeit eines Ontologieansatzes muss sich in erster Linie an dessen praktischem Anwendungsnutzen für die Ziele Datenstrukturierung, -zugänglichkeit / Datenwiederverwendbarkeit und -auswertung bemessen. Eine Ontologie ohne Anwendungsnutzen ist irrelevant. Standardisierung ist dabei nur eine der erwarteten Nutzendimensionen der Ontologie.

Unter Beachtung dieser Aspekte befindet sich auch die materialwissenschaftliche Disziplin im Hinblick auf die entsprechende Entwicklung einer Ontologie nicht mehr am Anfang. Die Plattformverantwortlichen erkennen generalisierte Ontologiekonzepte und bestehende materialbezogene Bemühungen an, von denen mit der „Basic Formal Ontology“ und der „European Materials Modelling Ontology“ zwei im Folgenden weiter beleuchtet werden sollen. Dies sollte jedoch nicht als grundsätzliche Restriktion gegenüber anderweitigen Ansätzen zur Ontologieentwicklung verstanden werden, da die Ansätze aus Sicht der Plattformverantwortlichen ihre Leistungsfähigkeit noch nicht bewiesen haben.

Die Basic Formal Ontology (BFO) ist eine von der jeweiligen Domäne unabhängig anwendbare, prozessorientierte Ontologie die sich vor allem im Bereich der Technikwissenschaften zur einheitlichen Informationsabfrage, -analyse und -integration großer Beliebtheit erfreut. Die BFO ist eine „upper ontology“, die nicht die notwendige wissenschaftliche Tiefe der entsprechenden Domäne erreichen kann, aber die Ankopplung einer Domänenontologie an die semantische Beschreibung der Welt erlaubt.

Für die Materialwissenschaft versucht dies die European Materials Modelling Ontology (EMMO). Sie ist im Rahmen eines europaweiten Konsortiums initiiert worden und hat das Ziel die physikalische Realität von Materialverhalten wirklichkeitsgetreu abbilden zu können. Zum Beispiel basiert die grundlegende Struktur der EMMO auf dem hierarchischen Aufbau der Materialien (elektronische Bindung, atomare Bewegungen, Defektebene und Kontinuum). Damit erlaubt sie wesentlich tiefere Beschreibungen der Vorgänge in Materialien. Für den Anwendungsnutzen der angedachte Materialontologie wird mindestens eine solche Beschreibungstiefe unzweifelhaft notwendig sein. Bisher ist kein Anwendungsfall bekannt, der die EMMO in der kompletten Multiskalenbeschreibung ausnutzt.

BFO und EMMO stehen „vertikal“ zueinander: Während die BFO rein deskriptive Relationen aufzeigt, kann die EMMO oder eine andere Domänenontologie in einzelnen dieser Schritte eine ergänzende Sicht auf Zusammenhänge und Abläufe innerhalb der Mikrostruktur von Materialien ermöglichen.

Im Zusammenhang mit der Frage nach dem „richtigen“ Vorgehen im Zuge der oben beschriebenen Ausschreibung empfehlen die Plattformverantwortlichen eine sinnvolle Kopplung aus allgemeinen Ontologieansätzen wie der BFO und Elementen der EMMO. Im aktuellen Stand der Diskussion stellt dies die vielversprechendste Herangehensweise dar, um einen Wissens- graphen für die Materialwissenschaft zu erzeugen. Für interessierte Antragssteller läge es daher im Hinblick auf das zugrundeliegende gemeinsame Forschungsinteresse nahe, sich zunächst mit den genannten Ansätzen zur Ontologieentwicklung auseinanderzusetzen. Konkrete Realisierungen von Material-bezogenen Ontologien im Rahmen der Ausschreibung sind zentral um die Leistungsfähigkeit der Ontologieansätze im Anwendungsfeld der Materialwissenschaft auf die Probe zu stellen. Hier-bei können sich auch andere Ontologieprinzipien als leistungsfähiger herausstellen als die genannten. Dennoch erscheint eine Abbildung hin zu BFO oder EMMO sinnvoll, damit die In-tegration in eine einheitliche Struktur ermöglicht wird

Die Plattformverantwortlichen sehen innerhalb der angestrebten, engen Zusammenarbeit die Aufgabe für sich, eine Infrastruktur zu schaffen an die die Domänenontologien „andocken“ können. Dies betrifft insbesondere die Gewährleistung einheitlicher Schnittstellen sowie die Definition von initialen Begrifflichkeiten und Ansprüchen, auf die die Teilontologien sich beziehen können. Auch eine erste, grundsätzliche Ontologie als Ausgangsschema will die Plattform bereitstellen.

Weiterführende Links

Erläuterung zu den Angaben in der Ausschreibung

BMBF call: „In enger Abstimmung mit der Innovationsplattform zu MaterialDigital [...] sollen Software-Tools erstellt werden, um mit der Ontologie arbeiten zu können.“

Consequence Platform:

Bereitstellung einer Beispielontologie zur nachvollziehbaren Darstellung der Erwartungen an die Lösungen.

Entwicklung und Bereitstellung einer Kollaborationsumgebung zur Ontologieent- wicklung.

Ansprüche an eine Ontologie beispielhaft definieren.

Ansprüche an Metadaten und Linked Data initial definieren.

Concequence Recipient:

Entwicklung der Ontologie für die eigenen Anwendungsfälle sowie deren Integration innerhalb der erzeugten Umgebung und Anforderungen. Möglichkeit der Anwendung vorhandener Ontologieansätze überprüfen (vgl. o.)

Mapping gewährleisten, das die eigenen Datenbezeichnungen anhand der Ontolo- gie zugänglich macht, Metadatensemantik nutzen und ergänzen

Work area Workflows

Ziel ist laut Ausschreibung die Etablierung von digitalen Workflows im Sinne des dezentralen Daten- oder Simulationskonzepts durch aktive Agenten innerhalb der Software-Umgebung der Innovationsplattform. Dabei ist die Nachhaltigkeit der Software-Lösungen und der einheitliche Zugriff auf Daten und Tools entscheidend. Die Plattform wird daher von Beginn an zwei Workflowumgebungen mit den Namen „pyiron“ und „Simstack“ zur Verfügung stellen. Von den Zuwendungsempfängern wird erwartet, dass sie ihre Lösungen so gestalten, dass sie innerhalb einer dieser Workflowumgebungen lauffähig gemacht werden können.

Nähere Informationen zu den beiden unterstützten Workflowumgebungen finden Sie unter der Rubrik:

Klärung Begrifflichkeiten

Workflowumgebung
Auf dem MaterialDigital Sever installierte Software, innerhalb derer weitere Softwaretools ausgeführt und in Simulationsprotokollen kombiniert werden können. Durch Workflowumgebungen werden einheitliche Schnittstellen geregelt.
Software-Tool
Einzelnes Programm für die Bearbeitung einer bestimmten materialwissenschaftlichen Aufgabe. Es wandelt einen wohldefinierten Input in einen wohldefinierten Output um. Beispiele sind: DFT- oder FEM Codes.
Simulations-protokoll
Realisierung eines materialwissenschaftlichen Workflows in einem Computerprogramm.
MaterialDigital Server (MDS)
Am KIT eingerichteter Server, auf der die Workflowumgebungen dauerhaft laufen und auf dem alle Tools installiert und getestet werden können.

Erläuterung zu den Angaben in der Ausschreibung

Eine genauere Aufschlüsselung der resultierenden Arbeitsteilung zwischen Plattform und Zuwendungsempfängern entsprechend der Vorstellung der Plattformverantwortlichen ist im Folgenden dargestellt

BMBF call: „Etablierung von digitalen Workflows im Sinne des dezentralen Daten- oder Simulationskonzepts durch aktive Agenten innerhalb der Software-Umgebung der Innovationsplattform.“

Consequence Platform:

Es werden die Software-Umgebungen „pyiron“ und „SimStack“ zur Verfügung ge- stellt. Diese dienen der Programmierung und Ausführung von Simulationsprotokollen. Für „pyiron“ ist diese Umgebung durch ein Web-Interface und Jupyter Notebooks benutzerfreundlich sichergestellt.

Concequence Recipient:

Für jede Software-Lösung müssen die Voraussetzungen geschaffen werden, damit sie auf einer der Workflowumgebungen „pyiron“ oder „SimStack“ lauffähig ist. Es wird empfohlen, dass dies über ein Python-Interface (idealerweise Jupyter) erfolgt. Es wird nicht ausgeschlossen, dass die hier geschaffenen aktiven Agenten von weiteren Serverumgebungen außerhalb der Plattform zusätzlich unterstützt werden.

BMBF call: „Es sollen im „App-Store“ der Innovationsplattform Modelle entstehen, [um] komplexe Workflows über die zugrundeliegende Architektur auf forschungsrelevante „echte“ Daten anzuwenden.“

Consequence Platform:

Ein Server zum Teilen und Verwalten von Tools wird eingerichtet. Die Workflowum- gebungen werden im Conda Community Channel zum Download bereitgestellt, um eine reibungslose Installation auf verschiedenen Computersystemen zu ermöglichen. Die Tools werden entsprechend ihrer Abhängigkeiten integriert.

Concequence Recipient:

Software-Lösungen müssen als Conda-Paket zur Verfügung gestellt werden. Damit diese in den App-Store integriert werden können, muss es sich um open-access Software handeln. Für jedes Tool muss es ein einziges Shell-Script geben, das aus dem Input den Output generiert.

BMBF call: „Dafür muss ein dezentraler Datenserver in Betrieb genommen werden.“

Consequence Platform:

Es wird auf dem MaterialDigital-Server (MDS) ausreichend Speicherplatz für Daten geben. Der MDS stellt die Workflowumgebungen zur Verfügung, die innerhalb von Udocker Containern genutzt werden können. Die Verwendung der Umgebung stellt automatisch (ohne, dass der Anwender Details kennen muss) sicher, dass die Daten konsistent gespeichert werden und dass die dazugehörigen Berechnungen auf einem Cluster ausgeführt werden. Für letzteres werden derzeit Konzepte wie AiiDA und SLURM unterstützt.

Concequence Recipient:

Der Zuwendungsempfänger muss einen eigenen Server zur Erzeugung und Spei- cherung eigener Simulationsdaten einrichten oder dafür den MDS nutzen (Ausnahme). Mittelfristig wird angestrebt, dass lokale Datenserver als Softwarestack vom MDS geklont werden können, dann also die Softwarestruktur des MDS aufweisen.

BMBF call: „Alle Daten(-sammlungen), die im Rahmen der öffentlichen Förderung entstehen, sind in die seitens der Innovationsplattform erarbeitete Infrastruktur für verteilte Materialdaten einzupflegen.“

Consequence Platform:

Die Workflowumgebung arbeiten mit klar strukturierten Datenformaten. Im Falle von „pyiron“ wird hdf5 verwendet. Auf dem MDS werden die generischen Metadaten (insb. Erzeugungsdatum, Ablageort, Zugriffsrechte) der erzeugten Daten abgelegt.

Concequence Recipient:

Um die Einheitlichkeit sicherzustellen, müssen alle Daten (Input und Output von Tools) als Python Dictionaries oder alternativen strukturierten Dateiformaten wie hdf5, JSON verfügbar sein. Die Daten müssen vollständig in diesen Formaten vorliegen (d.h. alle Informationen müssen aus den Daten erzeugbar sein), um in die Plattform integrierbar zu sein. Die Daten müssen an eine generische Ontologie gekoppelt sein. Die Metadaten (insb. Erzeugungsdatum, Ablageort, Zugriffsrechte) werden an die Plattform zur Ablage auf den MDS übermittelt.

Aufgabenbereich Zusammenarbeit Zuwendungsempfänger und Plattform

BMBF call: „Aktuelle Fragestellungen der Materialforschung sollen durch „simulations-“ oder „daten-basierte“ Modelle exemplarisch auf Basis der Architektur für verteilten Ressourcenzugriff, die die Innovationsplattform zur Verfügung stellt, abgebildet und an konkreten Beispielen validiert werden.“

Consequence Platform:

Anwendungsnutzen der eingebrachten Beispiele gewährleisten, sowohl im Hinblick auf die Art der Datenablage, als auch den Mehrwert bei deren Analyse / automatisierter Anwendung

Concequence Recipient:

Initiale Use Cases entwickeln, um Plattform- und Digitalisierungsnutzen insgesamt aufzuzeigen.

BMBF call: „Werkzeuge, Methoden und Standards, die die Innovationsplattform erarbeitet hat, sind soweit möglich im Rahmen des Vorhabens zu verwenden.“

Consequence Platform:

Formate und Tools der Plattform auf den eigenen Use Case anwenden.

Concequence Recipient:

Formate und Tools der Plattform definieren und bereitstellen.

BMBF call: „Eigene Erkenntnisse sind mit der Innovationsplattform zu teilen“

Concequence/Platform/Recipient:

Erzeugte Ontologien und ergänzende Frameworks sind nachhaltig der Plattform zur Verfügung zu stellen. Gemein-same Lerneffekte, die erst durch den Austausch entstehen, fließen in die Plattform ein. Darüber ergibt sich auch die übergeordnete Aufgabe, sich aktiv in die Zusammenarbeit und Abstimmung einzubringen.

BMBF call: „Die Vorhaben [...] sind inhaltlich und bzgl. der genauen Zielsetzung fortlaufend mit der Innovationsplattform abzustimmen.“

Consequence Platform:

Informationsbeschaffung proaktiv nach dem „Pull“-Prinzip, Verantwortung liegt bei den Use Cases.

Concequence Recipient:

Bereitstellung einer zugänglichen und zuverlässigen Kommunikations- und Beratungsumgebung.

BMBF call: „Die Empfehlungen des Managementkreises [sind] zu berücksichtigen.“

Consequence Platform:

Notwendigkeit entsprechende Anpassungen im Arbeitsplan der geförderten Projektei zu gewährleisten, z.B. über entsprechende agile Arbeitsweisen.

Concequence Recipient:

Grundsätzlich muss die Plattform die Industriebedarfe zentral berücksichtigen.

BMBF call: „Im Rahmen der Aktivitäten der Innovationsplattform MaterialDigital sind zahlreiche Veranstaltungen [...] geplant.“

Consequence Platform:

Teilnahme an entsprechenden Veranstaltungen, sowie inhaltliche Beteiligung.

Concequence Recipient:

Kommunikation der Veranstaltungen, Zugang sicherstellen.