Wir brauchen den offenen Index dringend, um europäische KI-Systeme aufzubauen

Interview mit Prof. Dr. Dieter Kranzlmüller, Leiter des Leibniz Rechenzentrums (LRZ) und des Lehrstuhls Kommunikationssysteme und Systemprogrammierung der Ludwig-Maximilians-Universität München (LMU)

Interview: Susanne Vieser

Forschungsergebnisse, die alle lesen können; Daten zu Gesellschaft, Wirtschaft, Umwelt und Technik, die alle nutzen und auswerten können: Dieter Kranzlmüller ist Forscher, von Berufswegen neugierig und aufgeschlossen für jegliche Form von Daten. Der promovierte Informatiker leitet das Leibniz-Rechenzentrum (LRZ), eines von drei Supercomputing-Zentren in Deutschland, und Projektpartner der OSF im EU-Projekt OpenWebSearch.eu.

Kranzlmüller engagierte sich erst persönlich für die Open Search Foundation, brachte aber bald die Expertise des LRZ mit ein: Dort fand 2016 das erste Open Search Symposium (Ossym) statt, außerdem beteiligen sich inzwischen viele LRZ-Spezialist:innen am Aufbau des offenen Webindexes, und auch die Cluster des LRZ rechnen für den offenen Index. – Ein Interview über die Online-Suche in Zeiten Künstlicher Intelligenz (KI), über Forschung und Lehre zu einem wertebasierten Internet.   

Wie suchen Sie persönlich und beruflich? Sind Sie immer zufrieden mit den Ergebnissen?

Prof. Dr. Dieter Kranzlmüller: Die Online-Suche ist für viele Dinge relevant – privat suche ich oft nach Freizeit- und Kulturangeboten, Buchtitel und Autor:innen oder nach Filmen. Als Informatiker recherchiere ich Expert:innen zu bestimmten Forschungsthemen oder nach interessanten, wissenschaftlichen Ergebnissen zu eigenen Fragen. Neben neuen Prozessorenkonzepten und Computerarchitekturen interessieren mich die ethischen Aspekte der Informatik sehr stark. Leider muss ich feststellen, dass mich die Suchergebnisse nicht immer zufriedenstellen. Oft wird mir Werbung vorgeschlagen, die zwar zu meiner Frage passt, aber leider die wirklich relevanten Ergebnisse nach hinten schiebt. Manchmal muss ich in den Ergebnislisten auch mehrfach weiterblättern, um endlich an die wichtigen Ergebnisse zu kommen. Und dann stelle ich mir die Frage, wie das Ranking überhaupt zustande gekommen ist. Ähnlich waren übrigens meine bisherigen Erfahrungen mit ChatGPT: Irgendwie lieferte die Künstliche Intelligenz eine Antwort, die sinnvoll erschien, aber bei genauerer Betrachtung musste ich entweder nachfragen oder meine Frage mit anderen Details stellen. Befriedigt also auch noch nicht.

Das Leibniz-Rechenzentrum und Sie persönlich haben die Open Search Foundation schon früh unterstützt – warum?

Kranzlmüller: Ich bin ein großer Befürworter von Open Science, Open Data und Open Source, also von offen zugänglichen Forschungsergebnissen und Daten sowie von Software, deren Quellcodes transparent sind und die so an unterschiedlichste Bedürfnisse angepasst oder weiterentwickelt werden kann. Nur so entstehen viele unterschiedliche Möglichkeiten und persönliche Vorteile. Die Open Search Foundation setzt sich für eine offene, transparente Online-Suche ein, die mir ebenfalls sehr wichtig ist.

Warum?

Kranzlmüller: Demokratie und persönliche Freiheit basieren auf Wissen und Information. Suchdienste unterstützen zwar die Informationsbeschaffung, um aber die gefundenen Inhalte einordnen und bewerten zu können, sollten die Suchalgorithmen transparent und die Rankings der Suchergebnissen neutral, also unbeeinflusst von irgendwelchen Kräften oder Interessen sein. Oder zumindest sollten die Kriterien, nach denen sortiert wird, bekannt gemacht werden.

Steht in der Informatik das Thema Websuche, Suchverhalten, Daten-Ethik eigentlich auf der Agenda von Lehre und Forschung, auch bei Ihnen?

Kranzlmüller: Meine Vorlesung „Rechnernetze und Verteilte Systeme“ behandelt Grundlagen, wie das Internet funktioniert und wie man es als Basis für die Suche verwenden kann. Dafür zeige ich zum Beispiel auch Bilder der ersten Google-Suchmaschine aus dem Computer History Museum in Mountain View. In der Vorlesung „Grid und Cloud Computing“ geht es dann eher um den Einsatz des Programmiermodells MapReduce von Google, mit dem gleichzeitig mehrere Berechnungen, Anweisungen oder Befehle ausgeführt werden können, um große Datenmengen zu bearbeiten. Darüber hinaus beschäftige ich mich mit Datenethik und halte im Masterstudiengang Data Science das Seminar „Data Ethics“ – da diskutieren wir rechtliche und ethische Fragen, etwa zum Umgang mit personenbezogenen Daten, zur Datensicherheit oder für die Planung von Experimenten in den Datenwissenschaften. Wie offen zugänglich können die IT-Systeme von Behörden oder Forschungseinrichten sein, zumal in Zeiten von Krieg? Wie privat oder anonym soll die Internetnutzung eines jeden Menschen angesichts von Hetze und Cyberkriminalität bleiben? Wie gehen wir gegen Fake News und Falschmeldungen vor? Und wie stark sollen wir KI-Systeme regulieren? Es ist immer wieder spannend zu beobachten, wie vielfältig Freiheit und Rechte im Seminar ausgelegt oder wo und wie Regeln oder Grenzen gefordert werden.

Was trägt das LRZ zum offenen Webindex bei?

Kranzlmüller: Während Unternehmen weltweit Serverfarmen aufbauen können, um Informationen aus dem Internet zu sammeln und zu kategorisieren, setzt der offene Webindex aus Kostengründen und für die geforderte Transparenz auf ein kollaboratives Modell, also auf Rechenzentren wie das LRZ, die freie Kapazitäten für den Aufbau und später den Einsatz des Indexes nutzen. Noch beteiligen sich vor allem wissenschaftliche Rechenzentren, das muss nicht so bleiben, auch Unternehmen können und sollen mitmachen. Daneben ist das LRZ am europäischen Forschungsprojekt OpenWebsearch.EU beteiligt und bringt hier ebenfalls technische Infrastruktur, Computerressourcen sowie Erfahrungen mit der Organisation und Koordination von Forschungsprojekten ein.

Wir lesen zurzeit viel von KI und ChatGPT, sie werden die Websuche verändern: Braucht es überhaupt noch einen offenen Webindex?

Kranzlmüller: Unbedingt! Das Problem aktueller Ansätze von generativer KI – das sind Werkzeuge, die aus Daten neue Texte, Bilder, Codes oder synthetische Daten fabrizieren – ist, dass die dazu notwendigen Daten bei einigen wenigen Providern liegen, im Falle von ChatGPT bei Microsoft und OpenAI. Wir brauchen daher den offenen Index ganz dringend, um souveräne, europäische, generative KI-Systeme aufzubauen. 

Das LRZ ist am Forschungsprojekt OpenWebSearch.EU beteiligt: Wie wichtig ist das Projekt für die Strategie des LRZ?

Kranzlmüller: Kernaufgabe des LRZ ist es, Forschung und Wissenschaft zu unterstützen, danach richten wir unsere Strategien, Technologien und IT-Services aus. Mit kommerziellen, meist geheimen Indizes können Forschende nicht arbeiten, sie können Funktionsweisen weder analysieren noch versuchsweise verändern. Falls es gelingt, einen offen zugänglichen Index für die Online-Suche anzulegen, können Wissenschaftler:innen diesen für eigene Suchansätze verwenden. Daraus werden dann hoffentlich viele unterschiedliche Möglichkeiten zur Informationsbeschaffung entstehen, die vielleicht sogar in neue, kommerzielle Dienstleistungen münden. Aus Sicht des LRZ kann ein offener Webindex zum IT-Service für Forschende werden. Analog dazu haben wir zusammen mit dem Deutschen Zentrum für Luft- und Raumfahrt terrabyte, eine Plattform für die Hochleistungs-Datenanalyse aufgebaut. Damit werden die Erdbeobachtungsdaten des DLR für Forschende offen zugänglich – samt der Techniken und Tools, mit denen sie ausgewertet werden können.

Schauen Sie doch mal in die Zukunft: Wie werden wir in fünf Jahren suchen?

Kranzlmüller: Auf jeden Fall werden wir wahrscheinlich weniger mit Stichwörtern arbeiten und mehr mit Texten oder vielleicht sogar Sprachschnittstellen, also Audio- und Sprachfiles. Die Suche wird interaktiver – wir stellen eine Frage, können nachfragen, präzisieren und mehr. Ich vermute auch, dass die Schnittstelle multimedialer wird. Online-Suchdienste werden für Antworten bald nicht mehr nur Links und Texte zur Verfügung stellen, sondern auch Bilder, Videos oder Audioformate.

Prof. Dr. Dieter Kranzlmüller, Head of the Chair of Communication Systems and Systems Programming at Ludwig-Maximilians-Universität München (LMU) and Leibniz Supercomputing Centre

Prof. Dr. Dieter Kranzlmüller

Leiter des Leibniz Rechenzentrums (LRZ) und des Lehrstuhls Kommunikationssysteme und Systemprogrammierung der Ludwig-Maximilians-Universität München (LMU)