5. Open Search Symposium #ossym23 – Rückblick Tag 1

Zum 5. Mal diskutierten Forscher, Tech Experten und Vertreter aus Politik und Industrie über die Grundlagen einer menschenzentrierten, transparenten und offenen Internetsuche für Europa und die Welt. Das internationale Open Search Symposium 2023 fand vom 4. bis 6. Oktober statt und brachte rund 100 Teilnehmer:innen online und vor Ort am CERN in Genf zusammen.

#ossym23 Flashback Keyvisual

Tag 1 im Überblick

Der erste Konferenztag startete mit Vorträgen rund um das Projekt OpenWebSearch.EU.

Andreas Wagner vom CERN und Stefan Voigt von der Open Search Foundation eröffneten das dreitägige Treffen mit einem Einblick in die Konferenz-Proceedings des #ossym22 (hier zu finden) sowie einen Einblick in die aktuelle multidisziplinäre vernetzte Forschungslandschaft, welche kollaborative Cloud-Infrastrukturen über verschiedene Rechenzentren in ganz Europa hinweg ermöglicht – und zugleich die Entwicklung eines europäischen Web-Indexes fordert.

Keynote über die offene KI-Kultur

In seinem Vortrag zum Thema „Democratizing AI through community organizing“ (KI demokratisieren durch Community-Organisation) plädierte Christoph Schumann von LAION e.V. für eine offene KI-Kultur, und gab Beispiele, wie eine solche Kultur es ermöglicht, mit beeindruckender Geschwindigkeit Innovationen im Bereich der KI zu entwickeln.
Ein Kernpunkt war seine Forderung nach einer EU-Initiative, um – ähnlich wie bei der Infrastruktur für Strom – eine Infrastruktur für Foundation-Models zu schaffen, in der zukünftige KI-Modelle trainiert werden können, die dann zu hochwertigen Chatbots oder Fabrik- oder Haushaltsrobotern weiterentwickelt werden können. „Es wäre für uns alle von großem Nutzen, diese Modelle in einem EU-weiten Projekt zu trainieren. Eine Art CERN für KI“, erklärte er.

Vorträge von EU-Kommissar und OWS.EU-Projektleiter

Jorge Gasós – verantwortlich für die NGI-Initiative (Next Generation Internet) der Europäischen Kommission (die auch das Projekt OpenWebSearch.EU finanziert) – gab den Rahmen für das Tagesprogramm vor, indem er den Umfang der von NGI finanzierten Projekte vorstellte, darunter Projekte in den Bereichen Blockchain-Technologie, Internet-Architektur, Datenschutz und mehr. Er erläuterte den allgemeinen Bottom-up-Ansatz, der darauf abzielt, Wissenschaft, Forschung und Industrie zusammenzubringen, um gemeinsam Projekte zu entwickeln.

Michael Granitzer von der Universität Passau gab ein Update zum aktuellen Stand des OpenWebSearch.eu-Projekts, einschließlich eines Ausblicks auf den bald stattfindenden Onboardingprozess für Drittpartner. Drittpartner erhalten Fördergelder, um das rechtliche, technische und wirtschaftliche Potenzial des offenen Web Index zu evaluieren.

Forschungstracks: „OpenWebSearch.eu I“ – Forschung und Updates von den EU-Projektgruppen und Forschern

Janek Bevendorff von der Bauhaus Universität Weimar stellte eine Fallstudie zum Thema „Product Spam on YouTube“ (Produktspam auf YouTube) vor, in der er die Clickfarming-Strategien zur Bewerbung von Affiliate-Links unter die Lupe nahm. Die Studie wurde von ihm und seinen Kollegen Matti Wiegmann und Benno Stein sowie von Martin Potthast von der Universität Leipzig und ScaDS.AI durchgeführt und kann hier online abgerufen werden.

Gijs Hendriksen präsentierte die „Challenges of index exchange for search engine operability“ (Herausforderungen des Austauschs von Indizes für die Funktionsfähigkeit von Suchmaschinen) mit dem Schwerpunkt Tokenization, mit dem er, Djoerd Hiemstra, Chris Kamphuis und Arjen P. de Vries von der Radboud University sich eingehend beschäftigt hatten.

Maik Fröbe von der Friedrich-Schiller-Universität Jena sprach über „Prototyping Open Web Search Applications with TIRA: A Case Study in Research-oriented Teaching“ (Prototyping offener Websuchanwendungen mit TIRA: Eine Fallstudie zur forschungsorientierten Lehre) und stellte die Ergebnisse inklusive Vor- und Nachteile der einzelnen Schritte vor. Die Fallstudie wurde von ihm, Theresa Elstner und Harrisen Scells von der Universität Leipzig, sowie Martin Potthast von der Universität Leipzig und ScaDS.AI zusammen mit Benno Stein von der Bauhaus-Universität Weimar durchgeführt.

Forschungstracks: „OpenWebSearch.eu II“ – Forschung und Updates von den EU-Projektgruppen und Forschern

Die Forschungstracks am Nachmittag beinhalteten sowohl eine Präsentation von „A Comprehensive Dataset for Webpage Classification“ (Ein umfassender Datensatz für die Klassifizierung von Webseiten) als auch „OWLer: Preliminary results for building a Collaborative Open Web Crawler“ (OWLer: Vorläufige Ergebnisse für den Aufbau eines kollaborativen Open Web Crawlers) von Michael Dinzinger, Saber Zerhoudi, Michael Granitzer, Mohammed Al-Maamari, Mahmoud Istaiti und Jelena Mitrovic von der Universität Passau mit dem beeindruckenden Ergebnis, dass „OWLer“ in den vorigen vier Wochen rund 120 Mio. Webdokumente abgerufen hat – mit einer Erfolgsquote von 93%.

Gemeinsam mit Ines Zelch Leipzig war das Publikum eingeladen, einen Blick auf „Commercialized Generative AI: A Critical Study of the Feasibility and Ethics of Generating Native Advertising Using Large Language Models in Conversational Web Search“ (Kommerzialisierte generative KI: Eine kritische Studie über die Durchführbarkeit und Ethik der Generierung nativer Werbung unter Verwendung von Large Language Models in Conversational Websearch) zu werfen. Die Studie wurde von Ines Zelch und Matthias Hagen – beide von der Friedrich-Schiller-Universität Jena – gemeinsam mit Martin Potthast von der Universität Leipzig und ScaDS.AI durchgeführt und vorgestellt. Darin wurde aufgezeigt, dass unterschwellige Werbung leicht in organische Texte eingeflochten werden kann, abhängig von den Aufforderungen, die an KI-Chatbots gegeben werden.

Jasmin Tietgen von der Open Search Foundation und Maari Alanko vom CSC – IT Center for Science in Finnland stellten einen Vorschlag für „Governance Towards an Open Web Index“ (Verwaltung für einen offenen Web-Index) vor, der eine Vielzahl ethischer, rechtlicher, gesellschaftlicher, kultureller, wirtschaftlicher, ökologischer und bewusstseinsbezogener Aspekte berücksichtigt.

Alexander Nussbaumer, Sebastian Gürtl und Christian Gütl sowie Rohit Kaushik von der Technischen Universität Graz hatten gemeinsam mit G. Hendriksen von der Radboud Universität in den Niederlanden das „Conceptual Design and Implementation of a Prototype Search Application using the Open Web Search Index“ (Konzeption und Implementierung einer prototypischen Suchanwendung unter Verwendung des Open Web Search Index) am Beispiel einer Sightseeing-Anwendung untersucht und die TeilnehmerInnen eingeladen, ihre eigene Suchanwendung zu entwickeln. Die Präsentation wurde von Alexander Nussbaumer gehalten.

Der erste Tag wurde mit einem Blick auf „Cooperating via Open Console“ (Kooperation über die Open Console) von Mark Overmeer von MARKOV Solutions in den Niederlanden abgeschlossen. Die Idee: die Qualität von Website-Informationen in Webindizes zu verbessern, indem Wissen über Websites und Domainnamen öffentlich geteilt und moderiert wird.

Abgerundet wurde das Tagesprogramm durch ein abendliches Social-Networking-Event mit weiteren interessanten Gesprächen und einer perfekten Atmosphäre zum Ausklang.

Es folgt eine Zusammenfassung von Tag 2.