Presseportal

Sonderforschungsbereich FONDA eingerichtet

Einfachere und wiederverwendbare Datenanalyse für die Naturwissenschaften

Neue Methoden zur Analyse gro?er Datens?tze erforscht der kürzlich eingerichtete Sonderforschungsbereich ?FONDA – Foundations of Workflows for Large-Scale Scientific Data Analysis“ (Grundlagen von Workflows für die Analyse gro?er naturwissenschaftlicher Daten). Solche Daten entstehen bei Experimenten in allen Bereichen der modernen Naturwissenschaften und ihre zeitnahe Analyse erfordert den Einsatz komplexer und schwer programmierbarer rechnergestützter Infrastruktur.

Das Hauptziel des Sonderforschungsbereichs ist es, den Aufwand für die Entwicklung solcher Programme zu reduzieren. Daran arbeitet im Sonderforschungsbereich ein h?chst interdisziplin?res Team von Forscherinnen und Forschern aus den Bereichen Informatik, Biowissenschaften, Materialwissenschaften und Fernerkundung. Es umfasst alle Berliner Universit?ten und eine Reihe weiterer Forschungsinstitute aus Berlin und Brandenburg.

Ein exemplarisches Problem, das FONDA untersuchen wird, sind Workflows für die Analyse sehr gro?er Satellitenbilds?tze. Prof. Patrick Hostert, Experte für Fernerkundung an der Humboldt-Universit?t zu Berlin, erkl?rt:

?Moderne Satelliten erfassen kontinuierlich rund um den Erdball hochaufl?sende Bilder. Wir analysieren umfangreiche Serien solcher Bilder, um beispielsweise Brennpunkte der Entwaldung oder Wüstenbildung auf der ganzen Welt aufzuspüren. Dazu programmieren wir unter Verwendung von Methoden des maschinellen Lernens komplexe Workflows, die aus mehreren Schritten der Bildvorverarbeitung, Registrierung, Filterung und Klassifizierung bestehen.“

Für gr??ere geografische Regionen wie etwa L?nder oder Kontinente ist die Ausführung dieser Workflows jedoch nur auf gro?en Rechenclustern realisierbar, was den Code zus?tzlich komplexer macht. Gemeinsam mit Prof. Ulf Leser, ebenfalls von der Humboldt-Universit?t zu Berlin, erforscht Patrick Hostert, wie sich die Komplexit?t bei der Programmierung dieser Workflows reduzieren l?sst. Prof. Leser, der auch Sprecher von FONDA ist:

?Ein einzigartiges Merkmal von FONDA ist dieser Fokus auf die Verkürzung von Entwicklungszeiten. Wir haben beobachtet, dass Wissenschaftler oft Wochen oder Monate ben?tigen, um nur einen für eine einzelne Maschine vorgesehenen Workflow so anzupassen, dass er auch auf einem Compute-Cluster ausführbar ist. Dies ist ein viel st?rkeres Hemmnis für wissenschaftliche Fortschritte als die eigentliche Laufzeit der Workflows.“

In einem weiteren Projekt untersucht Prof. Kerstin Ritter von der Charité Berlin verwandte Probleme bei der biomedizinischen Bildanalyse. Sie erkl?rt:

?Wir arbeiten an der Vorhersage der Alzheimer-Krankheit anhand von Hirnscans, einem hochgradig explorativen Forschungsgebiet, das interaktive Methoden zur Datenanalyse erfordert – w?hrend wir gleichzeitig sehr gro?e Bildsammlungen für die Ausbildung moderner Methoden des maschinellen Lernens berücksichtigen müssen. Dies erfordert derzeit viel zeitaufwendiges Programmieren auf niedrigem Niveau."

Gemeinsam mit Dr. Dagmar Kainmüller vom MDC Berlin verfolgt sie innerhalb von FONDA das Ziel, eine neuartige, intuitive Programmiersprache zur Spezifikation solcher Bildanalyse-Workflows zu entwickeln. Dagmar Kainmüller:

?Unser Traum ist es, medizinischen Beratern oder Forschern, die keine Experten auf dem Gebiet der Bildverarbeitung sind, zu erm?glichen, einen Workflow einfach und interaktiv an ihre Daten und ihre Bedürfnisse anzupassen, w?hrend er bereits auf einem gro?en Compute-Cluster l?uft."

Solche Probleme lassen sich nur durch eine enge Zusammenarbeit von Informatikern und Informatikerinnen sowie Forschern und Forscherinnen aus den Naturwissenschaften angehen. Deshalb besteht die H?lfte der FONDA-Projekte aus solchen Teams. Sie untersuchen nicht nur Probleme der Bildanalyse, sondern auch Workflows für die Genomdatenanalyse oder für die Materialwissenschaft. Die andere H?lfte sind reine Informatikprojekte, die von theoretischen Untersuchungen über Eigenschaften von Workflow-Systemen bis hin zu verteilten Dateisystemen und neuen Scheduling-Algorithmen reichen. Prof. Matthias Weidlich, stellvertretender Sprecher des Sonderforschungsbereichs:

?Eines unserer ehrgeizigsten Forschungsprojekte befasst sich mit der Echtzeitanalyse von hochdichten Messstr?men aus Elektronenmikroskopen. Gegenw?rtig kann eine solche Analyse nur offline durchgeführt werden, mit einer strikten Trennung von Mess- und Analysephase. Wir zielen darauf ab, neue Methoden zur Beseitigung dieser Einschr?nkung zu entwickeln, die es erlauben würden, den Verlauf einer Messung auf der Grundlage laufender Beobachtungen in Echtzeit anzupassen.“

Dieses Projekt leiten der Physiker Prof. Christoph Koch und Prof. Peter Eisert, ein Informatiker. Die L?sung solch anspruchsvoller Probleme erfordert den Input vieler weiterer Experten und Expertinnen, wie z.B. Prof. Volker Markl von der Technischen Universit?t Berlin, der ein Experte für Workflows über Streaming-Daten ist, oder Prof. Tilmann Rabl vom Hasso-Plattner-Institut der Universit?t Potsdam, Fachmann für verteilte Systeme.

Berlin ist der ideale Ort für solche Forschungen. Die hohe Dichte an Universit?ten und Forschungsinstituten, die alle wissenschaftlichen Disziplinen umfassen, bildet die Grundlage, auf der Kooperationsprojekte wie FONDA m?glich werden. Die Bündelung dieser St?rken steht auch im Mittelpunkt der Berlin University Alliance (BUA), deren Mitglieder sich alle an FONDA beteiligen.

?Wir betrachten FONDA mit seinem integrativen Ansatz der institutionen- und disziplinübergreifenden Forschung, der nahtlosen gemeinsamen Nutzung von Ressourcen und der Fokussierung auf hochkar?tige, reproduzierbare Wissenschaft fast schon als Blaupause für die BUA“,

sagt Prof. Peter Frensch, Vizepr?sident für Forschung der Humboldt-Universit?t zu Berlin.

?Natürlich stellen wir uns vor, dass der Erfolg von FONDA auch andere hochschulübergreifende Initiativen f?rdern wird.“

?

Weitere 三亿体育·(中国)官方网站

FONDA ist ein gemeinsames Forschungsprojekt der Humboldt-Universit?t zu Berlin, der Technischen Universit?t zu Berlin, der Freien Universit?t Berlin, der Universit?t Potsdam, der Charité Berlin, des Max-Delbrück-Centrums für Molekulare Medizin und des Zuse-Instituts Berlin.

Zum Sonderforschungsbereich FONDA ?

三亿体育·(中国)官方网站

Prof. Dr. Ulf Leser

Institut für Informatik

Humboldt-Universit?t zu Berlin

https://informatik.hu-berlin.de/wbi