Eine neuartige Technologie zur kooperativen Analyse von Big Data
Bonn, 26. Mai 2021. Gemeinschaften profitieren vom Wissen und Erfahrungsaustausch ihrer Mitglieder. Nach einem ähnlichen Prinzip – „Swarm Learning“ genannt – hat ein internationales Forschungsteam Algorithmen der künstlichen Intelligenz darauf trainiert, in dezentral gelagerten Datenbeständen Blutkrebs, Lungenerkrankungen und COVID-19 zu erkennen. Dieser Ansatz hat gegenüber herkömmlichen Verfahren den Vorteil, dass Anforderungen des Datenschutzes auf natürliche Weise erfüllt werden – was die standortübergreifende Analyse wissenschaftlicher Daten vereinfacht. Swarm Learning könnte daher die Zusammenarbeit und den Informationsaustausch in der Forschung, insbesondere im Bereich der Medizin, maßgeblich fördern und beschleunigen. Fachleute des Deutschen Zentrums für Neurodegenerative Erkrankungen (DZNE), der Universität Bonn, des IT-Unternehmens Hewlett Packard Enterprise (HPE) und weiterer Forschungseinrichtungen berichten darüber im Wissenschaftsjournal „Nature“.
Wissenschaft und Medizin werden zunehmend digitaler. Die Analyse der dabei anfallenden Informationsmengen – „Big Data“ genannt – gilt als ein Schlüssel zu besseren Behandlungsoptionen. „Medizinische Forschungsdaten sind ein Schatz. Sie können entscheidend dazu beitragen, personalisierte Therapien zu entwickeln, die passgenauer als herkömmliche Behandlungen auf jeden Einzelnen zugeschnitten sind“, sagt Joachim Schultze, Direktor für Systemmedizin am DZNE und Professor am Life & Medical Sciences-Institut (LIMES) der Universität Bonn. „Für die Wissenschaft ist es wichtig, dass sie solche Daten so umfassend und von so vielen Quellen wie möglich nutzen kann.“
Allerdings unterliegt der Austausch medizinischer Forschungsdaten über Standorte oder gar Ländergrenzen hinweg den Anforderungen des Datenschutzes und der Datenhoheit. Diese Auflagen lassen sich in der Praxis meist nur mit erheblichem Aufwand umsetzen. Zudem gibt es technische Hürden: Etwa wenn gewaltige Datenmengen digital übermittelt werden sollen, können Datenleitungen schnell an Leistungsgrenzen stoßen. Angesichts dieser Bedingungen sind viele medizinische Studien lokal beschränkt und können Daten, die andernorts vorliegen, nicht verwerten.
Daten bleiben vor Ort
Vor diesem Hintergrund erprobte ein Forschungsverbund um Joachim Schultze eine neuartige Vorgehensweise, um dezentral gelagerte Forschungsdaten auszuwerten. Grundlage dafür war die noch junge, von HPE entwickelte Technologie des „Swarm Learning“. Neben dem IT-Unternehmen beteiligten sich an dieser Studie zahlreiche Forschungseinrichtungen aus Griechenland, den Niederlanden und Deutschland – darunter Mitglieder der „German COVID-19 OMICS Initiative“ (DeCOI).
Swarm Learning kombiniert eine spezielle Form des Informationsaustausches über verschiedene Knoten eines Netzwerkes hinweg mit Methoden aus dem Werkzeugkasten des „maschinellen Lernens“, einem Teilbereich der künstlichen Intelligenz (KI). Dreh- und Angelpunkt des maschinellen Lernens sind Algorithmen, die an Daten trainiert werden, um darin Gesetzmäßigkeiten aufzuspüren – und infolgedessen die Fähigkeit erwerben, die gelernten Muster auch in anderen Daten zu erkennen. „Swarm Learning eröffnet der Medizinforschung, aber auch der Wirtschaft, neue Möglichkeiten der Zusammenarbeit. Der Schlüssel liegt darin, dass alle Kooperationspartner voneinander lernen können, ohne vertrauliche Daten teilen zu müssen“, sagt Dr. Eng Lim Goh, Senior Vice President und Chief Technology Officer für künstliche Intelligenz bei HPE.
In der Tat: Beim Swarm Learning bleiben sämtliche Forschungsdaten vor Ort. Ausgetauscht werden nur Algorithmen und Parameter – gewissermaßen Erfahrungswerte. „Swarm Learning erfüllt die Vorgaben des Datenschutzes auf natürliche Weise“, betont Joachim Schultze.