Data Science und Machine Learning am D-BAUG

Eine stetig wachsende Anzahl von Forschern am D-BAUG hat das Potenzial der Anwendung und Weiterentwicklung von Data Science und Machine Learning (DSML) in ihrer Forschung erkannt. Dies hat zu einer Initiative zur Gründung einer Kollaborationsplattform für Data Science and Machine Learning @ DBAUG geführt, in der Forscher ihre Bemühungen bei der Anwendung und Weiterentwicklung von DSML-Tools bündeln können.

DSML Room

Am 4. September 2020 trafen sich mehr als 50 Forscher des D-BAUG zu einem Kick-off-Meeting, um die laufende DSML-bezogene Forschung am D-BAUG vorzustellen und das Potenzial der Kollaborationsplattform zu diskutieren.

Die vorgestellten Arbeiten umfassten Beispiele aus den Bereichen Fernerkundung, Geodatenanalyse, Bau- und Umwelttechnik, Asset Management, Zustandsüberwachung und intelligenter Instandhaltung, Simulationsmodellierung und Transportmodellierung, die die grosse Vielfalt der möglichen Anwendungen von DSML-Algorithmen im Bauwesen, in der Geomatik und in der Umwelttechnik veranschaulichten. Wie einer der Teilnehmer erklärte: "DSML ist ein computergestütztes Schweizer Sackmesser!"

Die Teilnehmer des Kick-off-Meetings diskutierten und teilten ihre Sichtweise darüber, wie sie die Herausforderungen und die potenzielle Anwendung von DSML-Algorithmen in ihren Forschungsgebieten sehen.

Es wurde festgestellt, dass einige der jüngsten Entwicklungen im DSML-Bereich von zunehmendem gemeinsamen Interesse sind, darunter Graphische Neuronale Netze und Physik-informierte Neuronale Netze. Auch die Interpretierbarkeit von DSML-Modellen und die Fähigkeit, mit verschiedenen Datentypen und begrenzten Datensätzen zu arbeiten, wurden als wichtig erachtet.

DSML ist ein computergestütztes Schweizer Sackmesser!  

Die Forscherinnen und Forscher des D-BAUG interessieren sich für die Anwendung der DSML-Algorithmen auf räumliche und zeitliche Daten, für die Handhabung grosser Datensätze sowie für die Bewältigung von Naturgefahren und die optimale Entscheidungsfindung bei spezifischen technischen Problemen. Diese ingenieurwissenschaftlich getriebenen Themen stehen nicht notwendigerweise im Fokus der breiteren DSML-Forschungsgemeinschaft, welche eher auf rechnerisch effizientere Algorithmen oder theoretische Weiterentwicklungen fokussiert sein könnte. In diesem Sinne müssen Forscher aus bestimmten Bereichen die Sache selbst in die Hand nehmen und das DSML-Feld aus der Sicht der Anwendung weiterentwickeln.

Aber sie sind nicht allein, es gibt ein grosses Potenzial für die Zusammenarbeit zwischen D-BAUG-Angehörigen aus verschiedenen Forschungsgruppen. Erkannte Überschneidungen bei der Anwendung von DSML-Tools am D-BAUG bestehen darin, dass viele Probleme den Umgang mit unterschiedlichen zeitlichen und räumlichen Skalen in grossen Datensätzen erfordern, sowie auch die Quantifizierung von Unsicherheiten, die Reduzierung der Modelldimensionalität, Sensitivitätsanalysen, eine Erhöhung der Interpretierbarkeit von DSML-Modellen, die Integration von physikalisch-basiertem Wissen in rein datengetriebene Modelle, die Entfernung von Expertenverzerrungen aus den Daten, die Verwendung ähnlicher Datentypen und die Techniken zur Überwindung von Datenmangel oder schlechter Datenqualität.

Wie bei allem Neuen und Unerforschten gibt es viele Herausforderungen, die bewältigt werden müssen, bevor die Gesellschaft von der Forschung am D-BAUG profitieren kann. Die Forscher wiesen bereits auf die Schwierigkeit hin, den Überblick auf einem so grossen und sich schnell entwickelnden Gebiet zu behalten - wöchentlich werden neue DSML-Algorithmen vorgeschlagen. Man kann sich schnell von der grossen Anzahl der Möglichkeiten überwältigt fühlen. Daher könnte es gar nicht so einfach sein, das richtige Tool für die Aufgabe zu finden. Darüber hinaus ist der Mangel und die Qualität der Daten ein grosses Hindernis und ohne gute Daten kann es kein Data Science geben! Darüber hinaus erfordert die Anwendung von DSML technische Fähigkeiten, wie z.B. Programmieren und das Erlernen des Umgangs mit bestehenden DSML-Bibliotheken (z.B. PyTorch, TensorFlow). Auch wenn es viele Tutorials und Online-Lernressourcen gibt, erfordert die Beherrschung dieser Tools Zeit, zumal die meisten Forscher keine ausgebildeten Programmierer, sondern Ingenieure sind.

An diesem Punkt kann die DSML Kollaborationsplattform helfen. Indem sich Forscherinnen und Forscher zusammentun, können sie sich gegenseitig helfen, diese Hindernisse zu überwinden und dabei sogar neue Ideen erhalten! Die Teilnehmer des Kick-off-Meetings schlugen zahlreiche Formen der Vernetzung innerhalb und ausserhalb des D-BAUG vor. Brainstorming-Sitzungen bei Mittagessen oder Kaffee Pausen können helfen, Wissen in einer informellen Umgebung auszutauschen, während Summer Schools oder Vorträge von DSML-Experten in einem etwas formelleren Rahmen den gleichen Nutzen bieten können. Als Alternative zu den Kaggle-Wettbewerben können interne Hackathons und ML-Challenges organisiert werden. Alternativ könnten sich Teams, die sich aus D-BAUG-Forschern zusammensetzen, bei externen DSML-Wettbewerben anmelden und so die Präsenz des Departementes in der DSML-Gemeinschaft erhöhen. Eine Datenplattform, auf der Gruppen ihre Datensätze gemeinsam nutzen können, wurde ebenfalls vorgeschlagen. Um die technische Seite des Themas in Angriff zu nehmen, könnten Workshops und Übungen von erfahrenen D-BAUG-Forschern im DSML-Bereich oder von externen Experten organisiert werden. Ein Experten-Rat, der sich aus erfahreneren D-BAUG-Mitgliedern zusammensetzt, wurde ebenfalls vorgeschlagen, um Forschern zu helfen, die DSML-Tools anwenden möchten, aber noch keinen Überblick über das DSML-Gebiet haben und daher die richtigen Tools nicht finden können. Ein DSML-Gitlab/GitHub-Repository könnte alle DSML-bezogenen Projekte beim D-BAUG speichern, um das Wissen und die Ressourcen zu teilen. Journalclubs, Slack-Channels, Online-Foren oder Doktorandentage sind ebenfalls Gelegenheiten, um die jüngsten Entwicklungen im Bereich DSML auszutauschen. Podcasts und ein DSML@DBAUG YouTube-Kanal, der für die breitere Gemeinschaft zugänglich ist, können genutzt werden, um die DSML-bezogene Forschung am D-BAUG zu fördern und die Präsentationen zur späteren Verwendung zu speichern. Schliesslich können Forscher durch die Bündelung ihrer Bemühungen ihre Chancen bei der Beantragung von Fördermitteln erhöhen.

Die Ideen der Forscher waren sehr vielfältig und gingen in viele verschiedene Richtungen.

Der zum Ausdruck gebrachte Enthusiasmus in Bezug auf das DSML Thema ist zwar wichtig, muss aber zum Nutzen aller koordiniert und gelenkt werden. Dies wird die Hauptherausforderung bei der Bildung der Kollaborationsplattform für Data Science and Machine Learning @ DBAUG sein.

Die ersten Schritte sind bereits unternommen worden, und zwei neue Vorlesungen für Doktoranden am D-BAUG haben in diesem Semester begonnen, die von 10 Professor/innen und Dozenten aus verschiedenen Disziplinen betreut werden. Weitere Schritte werden auf der Grundlage der Vielzahl der im ersten Kick-off-Meeting vorgeschlagenen Ideen unternommen.

Die Hauptprinzipien der Plattform sind die Fokussierung auf den wissenschaftlichen Nachwuchs, die Zusammenarbeit und die Bottom-up-Initiative.

Da das erste Treffen nicht genügend Zeit bot, um einen Überblick über alle Themen im Zusammenhang mit DSML @ DBAUG zu geben, ist am 14.10. um 13-15h ein zweiter Workshop geplant.
 

JavaScript wurde auf Ihrem Browser deaktiviert