#ossym24 – eine Rückschau

3 Tage, 120 Teilnehmer, 4 Keynotes, 11 Sessions, 2 Workshops und ein neues Maskottchen 😀 .

Vom 9. bis 11. Oktober fand am Leibniz-Rechenzentrum das 6. Open Search Symposium #ossym24 statt. Die jährlich von der Open Search Foundation organisierte Veranstaltung versammelt Expert:innen und aktive Mitglieder der Open Search Community ebenso wie  Politiker:innen, Vertreter:innen der Digitalwirtschaft und interessierte Bürger:innen.

Der Fokus der diesjährigen Diskussionen lag auf technischen Themen wie „Crawling und Infrastruktur“, „Suchanwendungen und -technologien“, „Vorverarbeitung und ML für die Suche“ und „LLMs und RAG“.  Auch ethische Fragen zur Kuratierung und Transparenz gemeinschaftlich bereitgestellter Inhalte wurden beleuchtet. Nicht zuletzt wurden makroökonomische und rechtliche Aspekte einer offenen Websuche intensiv diskutiert und bearbeitet.

In Begleitung des stellvertretenden LRZ-Direktors Dr. Helmut Reiser und des OSF-Vorsitzenden Dr. Stefan Voigt machte Staatsminister Dr. Florian Herrmann einen Rundgang durch die Supercomputing-Räume. Der Rundgang wurde allen Teilnehmern vor Ort im Rahmen der Nachmittagsaktivitäten angeboten.

Tag eins: Auftakt mit zwei Highlights

Die Eröffnungsrede des bayerischen Staatsministers Dr. Florian Herrmann und die anschließende Keynote von Roberto Viola, Generaldirektor für Kommunikationsnetze, Inhalte und Technologie bei der Europäischen Kommission, gaben den inspirierenden Ton für den ersten #ossym24 Tag vor.

Das Open Search Symposium kehrt in die bayerische Heimat zurück

Der bayerische Staatsminister Dr. Florian Herrmann eröffnete das Symposium mit den Worten: „In Bayern sagen wir, wenn etwas zum ersten Mal passiert, ist es eine Innovation, wenn es zum zweiten Mal passiert, ist es Tradition“. Dies bezog er darauf, dass das #ossym24 – nach einigen Jahren am Standort  Genf – endlich nach München zurückgekehrt ist.

Nach einer herzlichen Begrüßung ging Dr. Herrmann auf die Entwicklung der Hightech-Forschung in Bayern ein  – die zu bahnbrechenden Innovationen in einer Vielzahl von Branchen geführt hat und dies auch weiterhin tut. Als „absolut entscheidend für Wissenschaft und Forschung“ titulierte Dr. Herrmann die Open Search Initiative und ihr Ziel, Wissenschaft und Forschung durch eine offene und freie Internetsuche zu fördern. Er bekräftigte sein persönliches Bekenntnis zu der Initiative und bestätigte die Unterstützung des bayerischen Ministerpräsidenten Dr. Markus Söder, der 2019 die sogenannte Hightech-Agenda ins Leben gerufen hat  – eine europaweit einzigartige Technologie-Initiative, die alle für das 21. Jahrhundert relevanten Technologien einschließt. Im Zuge dessen investiert der Freistaat Bayern 5,5 Milliarden Euro mit besonderem Fokus auf KI und Informationstechnologien.

Dr. Herrmann beendete seine Rede mit „einem großen Dank an alle, die sich für eine offene Suche mit transparenter und fairer Nutzung des Internets einsetzen. ‚Lasst uns jetzt dafür kämpfen!‘ “

Von Links nach rechts: Dr. Stefan Voigt, Dr. Helmut Reiser, Dr. Florian Herrmann, Dr. Megi Sharikaze

8 Milliarden Euro für den Aufbau eines Supercomputer-Netzwerks

EU-Kommissar Roberto Viola gab in seiner anschließenden Keynote einen Einblick in die digitale Agenda der EU für die kommenden Jahre.

Zunächst stellte er die ursprüngliche NGI-Idee (Next Generation Internet *) vor. NGI zielt im Wesentlichen darauf ab, das Internet wieder zu einem Raum des „offenen Wissens“ zu machen – eine deutliche Abgrenzung zu den kommerziell betriebenen, geschlossenen Ökosystemen, die heute unsere digitale Landschaft dominieren. Angesichts der Tatsache, dass KI in naher Zukunft einen großen Teil des traditionellen Webzugangs übernehmen wird, sieht Viola zahlreiche Risiken in der Vervielfachung von Bias entlang der Kette von Indexierung, Suche und Training großer Sprachmodelle. Insbesondere die oft vorherrschende kommerzielle Ausrichtung, erfordert alternative Modelle.

Viola würdigte die Arbeit der Open Search Community und sagte: „Sie haben hart gearbeitet, vor allem im Bereich der Web-Indizierung und ich bin mir dessen bewusst, dass diese Gemeinschaft Unterstützung braucht. Und ich möchte betonen, dass diese Unterstützung von unserer Seite garantiert wird, aber zugleich hoffe ich  – und die Rede des bayerischen Staatsministers hat mich darin bestärkt  –, dass wir Partner in ganz Europa haben; öffentliche Partner. Aber meine Hoffnung ist auch, dass mehr Unternehmen aufwachen und sich der Risiken bewusst werden, die damit verbunden sind, dass sie ihre gesamten Daten nur einem, zwei oder drei Akteuren überlassen“.

Er wies darauf hin, dass große Tech-Plattformen bereits in die Domäne der traditionellen Medien eingedrungen sind und Dienstleistungsangebote zerschlagen haben. Das nächste Ziel, so Viola, werden Engineering- und Herstellungsprozesse durch generative KI und andere Produkte sein – wodurch sich ein Teil der Wertschöpfung zu den Big Playern verlagert. Dies sieht Viola als Grund für das anhaltende Wachstum solcher Unternehmen an den Aktienmärkten. „ … weil die Märkte davon ausgehen, dass sie die EU von überall her beschneiden werden. Wir sollten nicht einfach nur zusehen und zulassen, dass unsere wissenschaftlich-industriellen Fähigkeiten auf diese Weise bedrängt werden, ohne dass wir eine Alternative vorbringen“, sagte er.

Viola würde es begrüßen, wenn Pharmaunternehmen, Ingenieurbüros, Robotikunternehmen und alle, die KI in großem Umfang einsetzen, diese Technologien stärker prägen würden. Und er fügte hinzu: „Außerdem müssen wir – von öffentlicher Seite – alles tun, was wir können, um zu helfen“.  

Einige Schritte sind bereits getan. Europa hat 8 Milliarden in den Aufbau eines Supercomputing-Netzes investiert, das jetzt das größte der Welt ist. Der EU-Kommissar sagte: „Wir sind sehr froh, dass es auf lokaler Ebene, wie in Bayern, Initiativen gibt, die die Idee eines vernetzten Supercomputing-Grids von Weltklasse unterstützen – und das ist erst der Anfang.“ Eine kürzlich ins Leben gerufene Initiative für KI-Factories soll Start-ups, Wissenschaftler:innen und Unternehmen zusammenbringen. Das Ziel: sie sollen das Supercomputing-Netz nutzen und so sicherstellen, dass ein offenes Ökosystem für KI und die Internet-Suche realisiert werden kann.

Viola beendete seine Rede mit einem Hinweis auf die Öffnung der Märkte zum Nutzen aller Akteure. „Das kommerzielle Web hat sich auf einzigartige Weise entwickelt. Es gab keine Regulierung. In jedem anderen Sektor, z. B. in der Luftfahrt, in der Pharmaindustrie oder im Bankwesen, gibt es Regeln. Alle wichtigen Aktivitäten der Menschen unterliegen Regeln.“ Der Digital Markets Act  hat die großen Internet-Giganten getriggert. Europa wird dafür kritisiert, dass es das Internet zu stark reguliert und so Innovationen behindert. Die Öffnung der Märkte hat sich jedoch bereits in anderen Bereichen als erfolgreich erwiesen. Beispielsweise die europäischen Energie- und Telekommunikationsmärkte  – hier hat die Regulierung sowohl den Anbietern als auch den Verbrauchern Vorteile gebracht. „Der Digital Markets Act ist vor allem eine Maßnahme, die den so genannten Gatekeepern auferlegt, ihre Services für den Wettbewerb zu öffnen – eine wesentliche Voraussetzung, damit eine Initiative wie Open Search erfolgreich sein kann“.

Der Nachmittag  war „Next Generation Internet“ gewidmet

Mit dieser ermutigenden Rede entließ Viola die Teilnehmer in die Kaffeepause und in einen Nachmittag, der gleich drei Wissenschaftstracks beinhaltete, sowie eine NGI – Next Generation Internet Session mit Projektpräsentation von „NGI Search“. NGI Search ist ein Projekt unter dem NGI Dach, welches Unternehmer:innen, Technikfreaks, Entwickler:innen und sozial engagierte Menschen fördert, die die Art und Weise, wie wir Informationen und Ressourcen im Internet suchen und finden, zu verändern wissen.

Die Sitzung mit dem Titel „Implications of an open web index for search, discovery and indexing projects“ wurde von Mirko Presser moderiert. Ziel war es, einen „Kundenblick auf den Open Web Index (OWI)“ zu geben, der derzeit von OpenWebSearch.eu  – ebenfalls ein Projekt der NGI-Initiative – entwickelt wird. Weitere, von NGI Search geförderte Projekte, präsentierten ihre Aktivitäten und nahmen die Rolle  als „Kunden/Nutzer“ des OWI ein. Diese Art der Präsentation befeuerte einen regen Dialog darüber, wie der OWI am besten den potenziellen Markt- und Nutzerbedürfnissen entsprechen kann.

Am Abend waren die Teilnehmer:innen vor Ort eingeladen, Kontakte zu knüpfen und bayerische Schmankerl zu genießen, die vom OpenWebSearch.eu-Konsortium im Rahmen eines Community-Treffens bereitgestellt wurden.

Mehr hier.

Tag Zwei : Weitere internationale Stimmen betreten die Bühne

Alternative Suchmaschinen bieten KI-Lösungen und spezialisierte Suchergebnisse

Der zweite Konferenztag begann mit einer Keynote-Präsentation aus Übersee von Richard Socher, dem ehemaligen Chefwissenschaftler von Salesforce und heutigen Gründer von you.com. Er leitete den Tag mit einem Denkanstoß über das Jevons-Paradoxon der KI ein: „Wenn KI billiger wird, sparen wir keine Kosten, wir nutzen einfach mehr davon.“ Außerdem gab er einen tiefen Einblick in you.com – einen innovativen Chat-Suchassistenten, der die Internetsuche mit „Executed Code Output“ und nachprüfbaren Quellen auf ein neues Qualitätslevel hebt.

Richard Socher of you.com at Open Search Symposium 2024

Richard Socher of you.com at Open Search Symposium 2024

Fun fact: die Ergebnisse von you.com übertrafen ChatGPT im Fakten-Check. Und ein konkretes Beispiel verdeutlichte das: Prof. Dr. Christian Geminn forderte you.com mit der folgenden Frage heraus: „Was sind die rechtlichen Herausforderungen eines offenen Web-Index?“ Die treffende Antwort: „Es ist ein komplexes Puzzle aus Datenschutz, geistigem Eigentum und ethischem Webcrawling. Aber mit dem richtigen Ansatz kann ein offener Web-Index Innovationen fördern und gleichzeitig rechtlich einwandfrei sein.“

Gemäß der #ossym-Tradition wurden zwei weitere alternative Suchmaschinen im Detail vorgestellt: Daoud Clarke präsentierte mwmbl.org – eine Community betriebene und kuratierte Suchmaschine aus UK. Mit Meta-Press.es präsentierte Simon Descarpentries eine Suchmaschine, die sich tief durch das Web gräbt und Medienartikel findet, die von anderen Suchmaschinen nicht beachtet werden. Ein weiterer Höhepunkt waren die spannenden parallel stattfindenden Sessions mit Teams des Deutschen Zentrums für Luft- und Raumfahrt und der Universität Passau, die praktische Einblicke in die Zukunft der LLM-gestützten Suche boten.

 „Big Tech must go!“

Am Nachmittag hielt der Bestsellerautor und Medienwissenschaftler Dr. Martin Andree eine lebendige Keynote unter dem Motto „Big Tech must go!“ Er stellte unter anderem seinen Atlas der digitalen Welt vor, der die Gesamtverteilung des Online-Traffics verfolgt und erfasst.

Dr. Martin Andree – courtesy of LRZ/ Susanne Todorovic

Keine große Überraschung: die fünf größten Technologieunternehmen der Welt scheinen das Internet mehr oder weniger isoliert zu betreiben. Die Plattformen verfügen nicht nur über unverhältnismäßig hohen
Traffic, sondern schalten auch die Konkurrenz praktisch aus – zum einen indem
sie ausgehende Links einschränken und selbstreferenzierende Taktiken anwenden, wenn Nutzer ihre Plattform verlassen und zum anderen mit Hilfe von vielen weiteren subtilen Manipulationen.

Das Problem? Diese Unternehmen kontrollieren damit die globalen Vertriebswege. Und nicht nur das: unsere Demokratie steht auf dem Spiel. „Meiner Meinung nach sind diese Unternehmen nicht demokratiekonform“, so Andree.

Einige seiner Lösungsvorschläge: Freiheit für die Gestaltung von Outlinks auf Plattformen, offene Standards für die Interoperabilität von Plattformen, wirtschaftliche Trennung von Übertragungsweg und Inhalt, eine Obergrenze von 30% Marktanteil, und ein Verbot der Monetarisierung krimineller Inhalte.

Diese „5 Tipps zur Befreiung des Internets“ lösten einige hitzige Diskussionen aus. Sein neuer Videovortrag „Big Tech must go“ bringt das Thema auf den Punkt.

Nach der Mittagspause widmeten sich die beiden Nachmittagsworkshops den „wirtschaftlichen Themen“ und den „rechtlichen Fragestellungen“. Beide Sessions brachten hitzige Debatten hervor, die weit über #ossym24 hinaus fortgesetzt wurden.

Tag 3: Diskussionen über ethische und gesellschaftliche Fragen und die Verwaltung eines offnen Web Index

Der letzte Tag der Konferenz verging wie im Flug und entfachte neue Diskussionen über die Index-Governance sowie über ethische und gesellschaftliche Fragen. Ein besonderes Highlight war die Keynote von Nina Leseberg, Head of Communities & Engagement bei Wikimedia Deutschland. In ihrem Vortrag „Digitaler Diskurs: Wie die Wikipedia-Community die Qualität der digitalen Enzyklopädie sichert“ gab sie Einblicke in die komplexe Thematik der gemeinschaftsbasierten Kuration von Inhalten.

Talk Nina Leseberg (Wikimedia Deutschland) at Open Search Symposium 2024

Die OSF-Arbeitsgruppe „Ethik“ stellt ihre aktuellen Arbeitsergebnisse vor

Das nachfolgende Panel zum Thema „Ethik und Gesellschaft“ wurde von der OSF-Vorsitzenden Christine Plote geleitet. Daran nahmen auch Noor Afshan Fathima vom CERN, Alexander Nussbaumer von der Universität Graz und Renée Ridgway von der Universität Aarhus/SHAPE Centre, Dänemark, teil – Sie alle berichteten über die Ergebnisse ihrer laufenden OSF-Arbeitsgruppe „Ethik“. Werte-, Risiko- und Chancenabschätzungen stehen im Mittelpunkt der Definition ethischer Richtlinien für die offene Websuche. Die freiwillige Integration von „ethischen Kennzeichnungen“ in Anwendungen, die auf dem Open Web Index basieren, war nur eines der interessanten Konzepte, die von den Diskussionsteilnehmern vorgestellt wurde.

Noor Afshan Fathima from CERN and OSF chair Christine Plote at the panel “Exploring the ethical foundations of web search – perspectives and findings from research and practice” at the Open Search Symposium 2024 #ossym24

Noor Afshan Fathima (CERN) und die OSF-Vorsitzende Christine Plote bei der Podiumsdiskussion „Erforschung der ethischen Grundlagen der Websuche – Perspektiven und Erkenntnisse aus Forschung und Praxis“

In der anschließenden wissenschaftlichen Session, die von Alexander Nussbaumer geleitet wurde, präsentierten Renée Ridgway, Rik Viergever von MURENA und Alex De Vries von Digiconomist ihre Forschungsergebnisse zu den Umweltfaktoren von KI in der Websuche, den Auswirkungen eines ethischen Smartphones im Kontext des Datenschutzes und den Werten und der Ethik einer offenen Suchinfrastruktur – von freier Software zu Open Source.

Rik Viergever von MURENA

Frische Ideen junger Wissenschaftler

Die Konferenz endete mit einem erfrischenden Beitrag der „Young Innovators“. Daphne Auer (Common Grounds Forum) teilte ihre Konzepte für „User-Driven Re-Ranking for an Adaption of the Variety in Search Results“; Felice Douglas und Susanne Krol teilten kreative „Curation Strategies for OpenWebSearch“ inklusive einiger Gamification Nuggets.

Der krönende Abschluss der Youngsters: als coole Überraschung hat die #OpenSearchCommunity nun ein neues zusätzliches Mitglied – das Maskottchen „Weebie“ wurde von Susanne Krol kreiert und am Ende der Session an den Projektleiter Stefan Voigt übergeben!

Gemeinsam für die Internetsuche der nächsten Generation!

Alles in allem war #ossym24 gefüllt mit vielen Denkanstößen und spannenden Einblicken in die vielfältigen laufenden Gemeinschaftsprojekte, die alle ein Teil des großen Ganzen sind. Vielen Dank an alle Mitwirkenden und Gäste! Das #ossym lebt von und mit den Teilnehmer:innen!

Ein bekanntes Sprichwort sagt: Nach dem #ossym ist vor dem #ossym. Merken Sie sich also bitte den Termin für #ossym25 vor, der uns vom 8. bis 10. Oktober 2025 in den Norden nach Helsinki, Finnland, führt.

*NGI – Next Generation Internet ist eine europäische Initiative im Rahmen des Programms Horizon Europe. Sie umfasst 39 finanzierte Forschungsprojekte.