Sie sind hier: Startseite Artikel Nachrichten Aktivitäten in der laufenden …

Aktivitäten in der laufenden eScience-Initiative des Landes

erstellt von Dirk von Suchodoletz Veröffentlicht 16.02.2016 12:15, zuletzt verändert: 30.08.2016 17:24
Bericht aus eScience-Abteilung des Rechenzentrums zur Initiative des Landes Baden-Württemberg

Der Lehrstuhl für Kommunikationssysteme und die vor anderthalb Jahren eingerichtete Abteilung eScience am Rechenzentrum befassen sich mit innerhalb einer neu aufgelegten Projektlinie des Landes Baden-Württemberg mit den zukünftigen Herausforderungen der zunehmenden Digitalisierung der Wissenschaft und den daraus resultierenden Anforderungen eines wissenschaftlichen Rechenzentrums einer großen Forschungsuniversität. Hierzu zählen Themen, wie die Begleitung und Beratung zu Strategien im Forschungsdatenmanagement, der Umgang mit digitalen Forschungsdaten und den mit ihnen verknüpften Workflows oder der Entwurf zukünftiger betrieblicher Strukturen für Services zur Unterstützung von Virtuellen Forschungsumgebungen auf verschiedenen Infrastruktren. Zwei Projekte wurden bewilligt, die über zwei bzw. drei Jahre Laufzeit die Fragestellungen gemeinsam mit verschiedenen Kooperationspartnern bearbeiten und in den nächsten Monaten starten sollen.

eScience: Zitierbare Wissenschaftliche Methoden

Die Digitalisierung wissenschaftlicher Arbeitsplätze stellt die wissenschaftliche Praxis vor neue Herausforderungen. Dank moderner (digitaler) Technologien (z.B. neuartiger Sensoren oder Messgeräte) und Verfahren (Simulationen, Algorithmen) hat sowohl die Menge als auch die Heterogenität (automatisch) gemessener oder digital generierter Daten, sogenannter Born Digital Datasets, stark zugenommen. Während sich die institutionelle Einführung von Infrastruktur zur Erfassung und Erhaltung von wissenschaftlichen Primärdaten derzeit im Aufbau befindet oder teilweise schon existiert, entsteht parallel ein Problembewusstsein für die dazugehörigen Modelle und Methoden, insbesondere zur Datenauswertung. Für die Nachvollziehbarkeit und Transparenz von wissenschaftlichen Ergebnissen sind somit neue Werkzeuge und geeignete Dienstleistungen notwendig.

Das hier beantragte Vorhaben hat das Ziel, einen kooperativen, disziplinübergreifenden technisch-organisatorischen Dienst zu entwickeln, um Lehre und Forschung in der Weiterentwicklung „guter wissenschaftlicher Praxis” zu unterstützen, Daten und wissenschaftliche Methoden gemeinsam zitierfähig und reproduzierbar allgemein bereitzustellen, so dass beispielsweise die Anforderungen moderner Wissenschaftsjournale erfüllt werden können und die Nachnutzbarkeit von Forschungsdaten und Langzeitverfügbarkeit im Sinne eines modernen Forschungsdatenmanagements gesichert ist. Zur Erreichung der Projektziele haben sich drei der vier bwFor-HPC-Betreiber zusammengeschlossen, um prototypisch eine größere Breite in den Naturwissenschaften, insbesondere der rechen- und datenintensiven Wissenschaftsdisziplinen, abzudecken. Das Projekt greift hier bewusst auf bereits bestehende gemeinsame Erfahrungen und Lösungsansätze zurück und wird diese disziplinunabhängig weiterentwickeln.

 

Im Projekt kooperieren unter der Federführung des Lehrstuhls für Kommunikationssysteme am Rechenzentrum, das Kommunikations- und Informationszentrum in Ulm gemeinsam mit Wissenschaftlern der Elementarteilchenphysik und der Bio-Informatik aus Karlsruhe und Ulm für drei Jahre. Das Projekt startete zum 1. Februar und wird Anfang 2019 beendet sein.

 

Projektziele

Um der Datenflut und der Komplexität Herr zu werden, müssen den Forschenden, um erheblichen Arbeitsaufwand beim Umgang mit den Daten zu vermeiden, im Zuge der (Weiter-)Entwicklung digitaler Datenverarbeitungsmethoden einfach nutzbare und auf deren Bedürfnisse abgestimmte Dienstleistungen angeboten werden. Bisher existieren kaum nutzbare Infrastruktur- und Dienstangebote an den Forschungseinrichtungen. In den DFG-Empfehlungen zur „guten wissenschaftlichen Praxis” wird derzeit zwar nur die Aufbewahrung der wissenschaftlichen Primärdaten empfohlen (Empfehlung 7), in den weiteren Erläuterungen der Empfehlung wird allerdings auf „obligatorische” Aufzeichnungen der „Materialien und Methoden” verwiesen, die nicht nur für nachvollziehbare Ergebnisse notwendig sind, sondern „schon aus Gründen der Arbeitsökonomie in einer Gruppe ein zwingendes Gebot” sind. Sofern wissenschaftliche Ergebnisse reproduzierbar sein sollen, beispielsweise für eine unabhängige Verifikation, ist eine Rekonstruktion des „Versuchsaufbaus” notwendig. Im digitalen Zeitalter mit seiner äußerst kurzen Lebensdauer (und Verfügbarkeit) von Hardware- und Software-Komponenten kann jedoch ein Nachbau eines in allen Komponenten identischen Datenverarbeitungsprozesses lediglich auf Grundlage von Aufzeichnungen nicht erreicht werden.

Für die Nachvollziehbarkeit und Transparenz von wissenschaftlichen Ergebnissen sind somit auch Methoden und Datenverarbeitungsprozesse in das institutionalisierte Datenmanagement von Hochschulen und Forschungseinrichtungen zu integrieren. Da zudem Modelle und Prozesse, die im Zeitalter von Big Data entwickelt werden, als eigenständige wissenschaftliche Beiträge angesehen werden, bedürfen sie auch einer unabhängigen, zitierfähigen Erhaltung.

 

Ergebnis dieses Projekts ist ein dezentral koordinierter Dienst, der eine gemeinsame Abstraktionsschicht für Nachweis und Langzeitverfügbarkeit von Software-Umgebungen für verlässliche Reproduktion von Forschungsergebnissen in den „Computational Sciences“ schafft. Dazu wird ein Cloud-basierter technischer Rahmen entwickelt, der durch variable Ressourcenallokation eine günstige Kostenstruktur schafft, so dass für die langfristige Erhaltung von Forschungsumgebungen im Wesentlichen nur Kosten durch tatsächliche Nachfrage bzw. Zugriffe entstehen.

Aus der Kooperation von vier Fachdisziplinen mit Informationszentren entstehen abgestimmte Workflows und Best-Practice-Guides für das Forschungsdatenmanagement (FDM), die später auf weitere Gebiete in den Natur- und Geisteswissenschaften ausgedehnt werden können. Hierzu zählen die Unterstützung und Infrastrukturangebote in Richtung „guter wissenschaftlicher Praxis" und der Aufbau von Weiterbildungsangeboten im Bereich FDM insbesondere für den wissenschaftlichen Nachwuchs.

 

ViCE - Virtual Open Science Collaboration Environment

Die zunehmende Nutzung von Virtuellen Forschungsumgebungen (VFU) erlaubt eine einrichtungs- und fächerübergreifende Kollaboration, eine bessere Integration des wiss. Nachwuchses und den Einsatz in der Lehre. In einigen Fachdisziplinen sind die Herausforderungen zur Nutzung von VFUs bereits gelöst, andere wollen den Schritt in diese Richtung vollziehen. Die notwendigen technischen Infrastrukturen sind in der Regel vorhanden. Jedoch ist noch keine standardisierte und breit verfügbare Lösung vorhanden, die Forschenden mit Bedarf an digitalen Workflows einfach zur Verfügung stehen. Diese Lücke soll von zwei Seiten, einmal „von oben” aus Anwendersicht mit ganz konkreten Bedarfen und zum anderen „von unten” aus Rechenzentrumssicht mit passgenauen Angeboten geschlossen werden. Das Projekt verhilft den wissenschaftlichen Rechenzentren zu einem klaren Verständnis der Bedarfe der Communities zur besseren Unterstützung heterogener Anforderungen seitens ausgewählter Fachwissenschaften. Indem die Rechenzentren mit den Fachdisziplinen gemeinsame Vorstellungen entwickeln und daraus Planung und Organisation der Infrastrukturen für wissenschaftliche Projekte ableiten, können sie mit beherrschbarem Aufwand wichtige Basisinfrastrukturen und IT-Prozesse bereitstellen. Das bildet die Grundlage für zukünftige Organisationsstrukturen an Rechenzentren für einen dauerhaften Betrieb, nachhaltige Geschäftsmodelle und proaktive Beratung neuer Communities.

 

Virtuelle Forschungsumgebungen1 (VFU) beginnen sich als Antwort auf diese Herausforderungen in den verschiedenen Wissenschaftsdisziplinen zu etablieren. Sie schaffen (virtuelle) Arbeitsplattformen, die eine kooperative Forschungstätigkeit durch mehrere Wissenschaftlerinnen und Wissenschaftler an unterschiedlichen Orten zu gleicher Zeit ohne Einschränkungen ermöglicht. Eine VFU unterstützt Forschende in verschiedenen Phasen des Forschungsprozesses und kann je nach Disziplin von der Erhebung, Berechnung oder Verarbeitung von Eingangsdaten, der Simulation von Prozessen bis hin zur Generierung von Ergebnissen reichen. Vielfach sind Werkzeuge für Recherche, Bearbeitung von Texten und Referenzen zur Erstellung der finalen Publikation enthalten. VFUs konzentrieren sich vor allem auf die Softwareseite, technologisch basieren sie vielfach auf Virtualisierung oder Containerisierung. Sie können damit die gesamte Breite von virtuellen Desktops über Cloud-Instanzen bis hin zu abgeschotteten Umgebungen im High-Performance-Computing abdecken.

Jedoch erfordert die Nutzung von VFUs eine hohe Flexibilität der Wissenschaftlerinnen und Wissenschaftler, sich auf neue Methoden und Arbeitsmittel einzustellen. Die Breite und Komplexität digitaler Arbeitsumgebungen mit den einhergehenden Anforderungen an technischem Fachwissen wird für Forschende zunehmend zum Problem. Statt sich auf ihre zentralen fachlichen Fragestellungen konzentrieren zu können, sind sie in erheblichem Maße mit administrativen und technischen Aufgaben belastet. Insbesondere der wissenschaftliche Nachwuchs verliert viel Zeit bei Aufbau und Einrichtung der eigenen Forschungsumgebung. Gleichfalls leiden die Nachhaltigkeit und Reproduzierbarkeit der Umgebungen nach Abschluss des Projekts oder bei Beendigung des Arbeitsverhältnisses des Forschenden.

Das Projekt umfasst für die geplante Laufzeit von April 2016 bis März 2018 die zentrale Infrastrukturbetreiber der Universitäten Mannheim, Ulm, Karlsruhe und Freiburg und ausgewählte wissenschaftliche Communities, wie die Teilchenphysik, Bio-Informatik, Anglistik oder Wirtschaftswissenschaften an den Partner-Unis.

 

Erwartete Ergebnisse von ViCE

Das Projekt ViCE entwickelt nachhaltige Geschäfts- und Steuerungsmodelle für die Kooperation von unterschiedlichsten Fach-Communities mit Rechenzentren auf Basis von VFUs, die dem dynamischen Charakter der Wissenschaften und ihren wechselnden Anforderungen angepasst sind. Es schafft hierzu eine RZ-übergreifende Kollaborations- und Austauschplattform für Virtuelle Forschungsumgebungen, die versioniert, annotiert und einfach geteilt werden können. Die Beschreibung der enthaltenen Tools und Workflows erlaubt die einfache Nachnutzung für neue Forschungsfragestellungen, eine schnelle Einbindung des wissenschaftlichen Nachwuchses und den Einsatz in der Lehre. Notwendige Basisinfrastrukturen der RZs werden so aufbereitet, dass sie abstrakt von verschiedenen Disziplinen, einfach und ohne Startverzögerung eingebunden und verwendet werden können. Hierzu wird Beratungskapazität aufgebaut, die die Wissenschaft in ihren Bedürfnissen unterstützt und eine einfache Ausdehnung auf weitere Communities erlaubt.

 

Kontakt/Projektkoordination für die Zitierbaren Methoden

Dr. Klaus Rechert, klaus . rechert AT rz . uni-freiburg . de

 

Projektkoordination für ViCE

Dr. Dirk von Suchodoletz, dirk . von . suchodoletz AT rz . uni-freiburg . de

 

Weitere Ansprechpartner an der Universität Freiburg

Prof. Dr. Markus Schumacher / Physik

Dr. Michael Heinrich / ZBSA

 

Update 7.6.2016:

Korrekturen an Stilistik und Rechtschreibung

abgelegt unter: ,