„Als Nutzer würde ich gerne meine Suchmaschine nach meinen Vorlieben wählen, genau wie meine Zeitung“

Interview mit Prof. Dr. Michael Granitzer. Der Professor an der Universität Passau ist wissenschaftlicher Projektleiter des europäischen Projekts OpenSearchWeb.eu sowie Co-Moderator der OSF-Fachgruppe Tech.

Interview: Susanne Vieser

In Forschungsinstituten, in kommerziellen und wissenschaftlichen Rechenzentren, in Unternehmen und in vielen Gruppen arbeiten IT-Spezialist:innen an einem offenen Index fürs Internet. Diese verteilte Team-Arbeit hat bei der Open Search Foundation (OSF) System. Das dient der Datensouveränität unbd macht transparent, wie Informationen aus dem Internet registriert und ausgegeben wird. Und so entstehen Technologien und Module, die für mehr Dienste oder andere Software genutzt werden könnten.

„,Offen’ steht dabei einerseits für die nachvollziehbare und transparente Erstellung eines solchen Indexes, andererseits bedeutet es, dass der Index selbst beliebig verwendet werden kann“, erläutert Michael Granitzer. Der promovierte Informatiker erforscht, wie Informationen im Internet und in Medien erschlossen, Nutzungsdaten ausgewertet oder wie Daten für smarte Systeme von Künstlicher Intelligenz (KI) aufbereitet werden.

Bei der OSF koordiniert Granitzer mit Stefan Voigt die Tech-Arbeitsgruppe. Als Forscher an der Universität Passau leitet er zudem das europäische Projekt OpenSearchWeb.eu, das für mehr Datensouveränität in Europa den offenen Web-Index fördert.

Bei Open Source-Software liegt der Quellcode offen und kann von jedem verbessert werden. Warum machen die Anbieter von Suchmaschinen ein Geheimnis um ihre Codes und Algorithmen?

Prof. Dr. Michael Granitzer: Die Geschäftspraxis von Suchmaschinenanbieterm einzuschätzen, fällt mir schwer, da kann ich nur raten. Technische Gründe würde ich aber ausschließen, im Zentrum steht sicher der Schutz vor Konkurrenz: Wie Suchmaschinen die Ergebnisse ranken, ist einer der wesentlichsten Faktoren für die Akzeptanz von Anwender:innen und damit ein Merkmal, das vor den Wettbewerbern verborgen wird. Den dazugehörenden Source-Code oder Quelltext zu veröffentlichen, ist eher zweitrangig. Es gibt auch nicht den einen Source-Code, sondern viele verschiedene Teile machen das Gesamtsystem aus. Kerntechnologien wie beispielsweise das Hochleistungs-Datenbanksystem Bigtable von Google wurden bereits in Rahmen von Open Source-Projekten nachgebaut und sind damit frei verfügbar. Ein weiterer Grund der Verschwiegenheit liegt natürlich auch darin, dass dadurch Geschäftsprozesse und -systeme einfacher angepasst werden können. Wäre die Parametrisierung der Algorithmen transparent, müssten Entscheidungen oder Änderungen begründet werden, dadurch geht Flexibilität verloren, ähnlich sehe ich das bei der Einführung von Geschäftsprozessen und -praktiken.

Wie kamen Sie zur Open Search Foundation und warum engagieren Sie sich hier?

Granitzer: Über meinen Kollegen Professor Dr. Christian Gütl von der technischen Universität in Graz. Er forscht unter anderem im Bereich Information Retrieval und lud mich ein, 2019 das erste Open Search Symposium mit zu organisieren. Das Worldwide Web fasziniert mich seit dem Studium, es ist für mich eine Bereicherung für unsere Gesellschaft, hat sich aber leider – getrieben durch immer mehr Werbung – in den letzten Jahren von einer freien Informationsplattform zu einer relativ monopolisierten Geschäftsplattform gewandelt. Offene Suchsysteme sollen indes wieder zu der freieren Informationsplattform zurückführen, auf der Anwender:innen mehr Möglichkeiten zur Selbstbestimmung finden. Als Nutzer würde ich gerne meine Suchmaschine so wie meine Zeitung nach meinen Vorlieben wählen und nicht nur auf die Wahl von zwei sehr ähnlichen Zeitungen beschränkt sein.

Welche technischen Zutaten braucht eine offene Suche?

Granitzer: Kern ist sicherlich ein offener Web-Index, also die Datenstruktur, die auf Suchanfragen rasch eine Reihung möglichst relevanter Seiten zurückzuliefert. „Offen“ steht dabei einerseits für die nachvollziehbare und transparente Erstellung eines solchen Indexes – auch in Bezug auf die Kontrolle durch die Eigentümer von Inhalten. Andererseits bedeutet es, dass – innerhalb des rechtlichen Rahmens – der Index selbst beliebig verwendet werden kann. Unternehmen könnten dann zum Beispiel Teile des Indexes mit ihrer internen Suche kombinieren, private Nutzer:innen könnten den für sie relevanten Teil des Index einsetzen und damit auf ihren Geräten suchen. Das sind nur zwei Beispiele. Ich glaube, dass Offenheit und Transparenz viel mehr und interessantere Anwendungen bieten, vor allem auch im Bereich der Künstlichen Intelligenz. Ein offener Index ist die Voraussetzung für das Entstehen eines neuen Ökosystems für solche Such- und Discovery-Anwendungen.

Sie koordinieren die Arbeiten an der offenen Suche und experimentieren dafür mit verteiltem Crawling, also der automatisierten Indexierung von Informationen und Websites auf unterschiedlichen Computersystemen: Wie soll die offene Suche entstehen?

Granitzer: Wir wollen die klassische Pipeline einer Suchmaschine – vom Crawling bis zur eigentlichen Suche – dezentralisieren und über verschiedene Forschungsinstitutionen, Rechenzentren und anderen Infrastruktureinrichtungen verteilen. Aus unserer Sicht entsteht dabei nicht nur der offene Index, sondern die Ergebnisse von Zwischenschritten können ebenfalls Nutzen bringen. So können zum Beispiel aufbereitete HTML Dokumente in smarten Sprachmodellen, die auf KI basieren, eingesetzt werden oder aus einzelnen Verarbeitungsmodule, wie etwa die Extraktion bestimmter Informationen aus indizierten Webseiten, könnten eigene Dienste entstehen. Darüber hinaus geht es um Kontroll- und Steuermöglichkeiten für die Eigentümer von Inhalten sowie die Entwicklung innovativer Algorithmen, etwa zur Bestimmung der Informationsqualität einer Seite. Wir haben also an allen Ecken und Enden zu tun.

Wie kriegen Sie dafür die Tech Arbeitsgruppe der OSF unter einen Hut und wie koordinieren sie sich?

Granitzer: Die Tech-Arbeitsgruppe besteht aus rund 30 Mitgliedern – freie Entwickler:innen und IT Spezialist:innen sowie Forschende aus ganz Europa und versteht sich als Community zur Realisierung eines offenen Indexes. Ein Teil der Entwickler:innen arbeitet bereits in Forschungsprojekten wie OpenWebSearch.eu von der EU zusammen, andere organisieren sich frei und in kleineren Gruppen. Aktuell organisieren wir uns daher eher Bottom-up und weniger über klassische Software-Engineering Prozesse. Das wird sich ändern, wenn mehr konkrete Teile vorliegen. Dann wird die Koordination ähnlich wie in anderen Open-Source-Projekten über Führungs- oder Governance-Regeln für Infrastruktureinrichtungen erfolgen. Diese Regeln werden innerhalb von OpenWebSearch.eu entwickelt.

Mal angenommen, Sie treffen Larry Page und Sergej Brin im Biergarten – was würden Sie mit den Google-Gründern diskutieren und warum?

Granitzer: Warum sie das Motto „Dont be evil“ fallen gelassen haben.

Welche Vision verfolgen Sie in Sachen Suche – wie soll die Internetsuche in fünf, wie in zehn Jahren aussehen?

Granitzer: Offen, transparent und mit viel Wahlfreiheit für Nutzer:innen. Es soll eine einfache Nutzung der Informationsquelle „Web“ für Forschende und Innovationstreiber entstehen – mehr ist die offene Suche eigentlich nicht.

Prof. Dr. Michael Granitzer
Professor Universität Passau, Co-Moderator Fachgruppe Tech, wissenschaftlicher Leiter OpenWebSearch.eu