Ohne Software geht Forschung nicht
10.04.2018Gleich zwei Wissenschaftler der Universität Würzburg sind Mitglied der Arbeitsgemeinschaft „Digitale Werkzeuge“. Die Einrichtung der Allianzinitiative „Digitale Information“ will die Arbeit von Forschern erleichtern.
40.000 fehlerhafte Studien wegen eines Software-Fehlers: Mit dieser Aussage hatten schwedische Wissenschaftler vor gut zwei Jahren für gehörigen Wirbel unter Hirnforschern gesorgt. Sie hatten Daten, die in zahlreichen Experimenten mithilfe der funktionellen Magnetresonanztomografie (fMRI) gewonnen worden waren, durch acht gängige Software-Pakete laufen lassen und dabei festgestellt, dass drei dieser Pakete falsche Ergebnisse lieferten. Die Zahl 40.000 ließ sich in der Folge zwar nicht bestätigen; ein paar tausend fehlerhafte Studien blieben dennoch übrig.
Software: Ein Werkzeug der Wissenschaft
Das Beispiel zeigt: Software spielt in der heutigen Wissenschaft eine ähnliche Rolle wie das Teleskop in den Anfängen der Astronomie oder das Mikroskop in der Zellforschung. Aus diesem Grund hat die Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen – ein Zusammenschluss großer Forschungseinrichtungen, wie beispielsweise der Max-Planck- und der Helmholtz-Gesellschaft, der Leopoldina und der Deutschen Forschungsgemeinschaft – die Arbeitsgemeinschaft „Digitale Werkzeuge – Software und Dienste“ ins Leben gerufen.
Die Gruppe war schon seit 2016 im ad-hoc-Modus aktiv und hat unter anderem eine Handreichung verfasst, die deutschlandweit und international viel Aufmerksamkeit bekommen hat. Jetzt ist die Schwerpunktinitiative und mit ihr die Arbeitsgemeinschaft in eine neue Runde gestartet. Einer von zwei Sprechern ist der Würzburger Bioinformatiker Dr. Konrad U. Förstner, der über die Hochschulrektorenkonferenz die Universitäten in dem Gremium vertritt.
Förstner hat Biochemie und Informatik studiert und leitet die „Core Unit Systemmedizin“, eine Gemeinschaftseinrichtung der Universität und des Klinikums Würzburg, die vor allem für die Bereiche Medizin und die Lebenswissenschaften Hochdurchsatzsequenzierungen und bioinformatische Analysen durchführt sowie Wissenschaftler berät. Ein zweiter Würzburger ist seit diesem Jahr ebenfalls Mitglied der Arbeitsgemeinschaft: Professor Thomas Dandekar, Inhaber des Lehrstuhls für Bioinformatik am Biozentrum der Uni.
Wichtiger Baustein und kritischer Punkt
„Software ist heute ein wichtiger Baustein im Forschungskreislauf und ein kritischer Punkt. Fehler an dieser Stelle produzieren falsche Ergebnisse; fehlende Informationen über die verwendete Software erschweren die Überprüfung und Reproduzierbarkeit von Studien“, schildert Förstner das Problem, mit dem sich die Mitglieder der Arbeitsgemeinschaft „Digitale Werkzeuge“ beschäftigen. Dabei zeigt die genauere Betrachtung, dass die Schwierigkeiten an vielen Stellen auftauchen.
Beispielsweise beim Einsatz kommerzieller Software-Produkte: „Bei diesen ist der Quellcode in der Regel nicht einsehbar. Man weiß also nicht genau, wie die jeweilige Software die Daten bearbeitet und interpretiert“, erklärt Förstner. Dazu komme, dass gängige Programme, wie etwa Excel, kaum noch in der Lage dazu sind, die gewaltigen Datenmengen adäquat zu verarbeiten, die etwa ein moderner Hochdurchsatzsequenzierer produziert.
Der Quellcode muss offenliegen
Anders ist das im Fall von maßgeschneiderten Skripten, die ein Wissenschaftler für seine Arbeit selbst programmiert. Bei ihnen liegt der Quellcode in der Regel offen. Trotzdem kann auch diese Software-Lösung Probleme bereiten: „Wissenschaftler, die bestimmte Studienergebnisse überprüfen wollen, müssen dafür die gleiche Software verwenden wie die ursprünglichen Autoren“, sagt Konrad Förstner. Die sei allerdings häufig nicht bereitgestellt und müsse erst mühselig besorgt werden. Besser sei es deshalb, wenn das jeweilige Skript gleich mit der Studie in der Fachzeitschrift veröffentlicht werde. Das sei heute allerdings selten der Fall.
Kritisches Hinterfragen sei auch dann gefragt, wenn Wissenschaftler spezielle Webseiten nutzen, auf denen sie ihre Daten hochladen und im Anschluss analysieren, formatieren und visualisieren lassen können. Und das möglicherweise auch noch so, dass Ko-Autoren darauf zugreifen und alle Beteiligten im Team an der Publikation arbeiten können. „Dann kommt sehr schnell die Frage nach der Datenhoheit und der Datensicherheit ins Spiel, die sich gar nicht so leicht beantworten lässt – je nachdem in welchem Land der Anbieter dieser Seite seinen Geschäftssitz hat“, so Förstner.
Eine Vielzahl von Problemen
Viele offene Fragen bestimmen also das Feld der digitalen Werkzeuge momentan, und dementsprechend viel Arbeit liegt vor den Mitgliedern der Arbeitsgemeinschaft. Zumal Deutschland, wie Konrad Förstner sagt, in der Entwicklung ziemlich weit zurück liegt, verglichen mit anderen Ländern.
Das fängt an bei befristeten Arbeitsverträgen, fehlendem Fachpersonal und einem hohen Zeitdruck – alles Aspekte, die eine professionelle und nachhaltige Software-Entwicklung erschweren. Es geht weiter über die fehlende Anerkennung von Software-Entwicklung und –Dokumentation als akademische Leistung, obwohl diese häufig Schlüsselkomponenten einer Publikation darstellen. Ein weiteres großes Problem sind fehlende Finanzmittel für Qualifizierungsmaßnahmen, den Ausbau der technischen Infrastruktur und eine Förderung akademischer Forschungssoftware.
Nachhaltigkeit von Forschungssoftware
Wie relevant dieses Thema ist, zeigt nicht zuletzt die Tatsache, dass die Deutsche Forschungsgemeinschaft vor nicht allzu langer Zeit das Programm „Nachhaltigkeit von Forschungssoftware“ ins Leben gerufen hat, das sehr viel Zuspruch und Anträge erhalten hat. Unter anderem hat die Gruppe von Professor Fakher Assaad vom Institut für Theoretische Physik und Astrophysik der JMU einen erfolgreichen Antrag gestellt; er erhält jetzt Mittel für die Weiterentwicklung eines Software-Frameworks für die numerische Behandlung von fermionischen Modellen der Festkörperphysik mit Hilfe der „Auxiliary-Field-Quantum-Monte-Carlo-Methode“.
Vier Jahre haben die Mitglieder der Arbeitsgemeinschaft „Digitale Werkzeuge“ jetzt Zeit, diese Probleme anzupacken. „Ich bin optimistisch, dass es uns in dieser Zeit gelingt, signifikante Verbesserungen zu erreichen“, sagt Konrad Förstner. Das liege auch im Interesse der gesamten Scientific Community, schließlich gehe es dabei in erster Linie um einen Punkt: Die Arbeit von Wissenschaftlerinnen und Wissenschaftlern zu vereinfachen.
Kontakt und weitere Informationen
Dr. Konrad Förstner, Lehrstuhl für Molekulare Infektionsbiologie I, T: +49 931 31-84279, konrad.foerstner@uni-wuerzburg.de