Unser OpenWebSearch.EU Projekt wurde kürzlich in einem Bericht von arte.tv über europäische Alternativen zu den Webdiensten der großen US-amerikanischen Tech-Unternehmen vorgestellt.

Das Video unterstreicht unser Engagement für die Stärkung der digitalen Souveränität Europas, inbesondere hinsichtlich Suchdiensten für das World Wide Web. Der Bericht enthält Einblicke von Prof. Dr. Ir. Djoerd Hiemstra, Professor für Datenwissenschaften und Leiter der Forschungsgruppe Information Retrieval an der Radboud University, einem der OpenWebSearch.EU Konsortialpartner. Djoerd stellte den Open Web Index in seinem aktuellen Zustand vor und erläuterte, welche Rolle er bei der Schaffung leistungsfähiger europäischer Suchlösungen spielen könnte.
Springt zu Minute 4:16, um Djoerds Einblicke zu hören:

Alternativ könnt ihr euch das Video auch direkt auf Arte.tv ansehen: https://www.arte.tv/de/videos/121620-127-A/wo-bleibt-das-europaeische-google-oder-facebook/

Pünktlich zum Abschluss des 42 monatigen EU Projekts OpenWebSearch.EU, stellen wir spannende Use Cases auf Basis des im Projekt entwickelten offenen Webindex vor

Zur Erinnerung: das OpenWebSearch.EU Projekt wurde von 14 Partner-Organisationen aus dem Forschungs-und Non-Profit Bereich umgesetzt und hatte zum Ziel, einen ersten europäischen offenen Webindex als Kernstück für souveränen strukturierten Zugang zum Internet zu gestalten.

Der OWI (Open Web Index) ist seit Juni 2025 am Start und hat bis dato stolze 1,3 Petabyte Daten gecrawlt. Im Laufe des Projekts wurden über verschiedene Open Calls, insgesamt 15 Drittpartner-Projekte eingegliedert. Das Ziel: Juristische, technische und kommerzielle Analysen und Machbarkeits-Prüfungen rund um den offenen Webindex durchführen, um eine fundierte Basis für den Ausbau einer europäischen Webdateninfrastruktur zu legen.

Sieben der Drittpartnerprojekte (Projekte aus Open Call 2) haben sich mit konkreten technischen Anwendungsbeispielen auf Basis des OWI befasst. Die Projekte zeigen eine Bandbreite dessen, was möglich ist, wenn Webindex-Daten offen zugänglich sind. Die vielversprechenden Ergebnisse haben wir kurz zusammengefasst:

Projekt VERITAS: Faktenprüfung zum Ukrainekrieg mit einem RAG-Chatbot

Die Firma DEXAI (Tschechien) entwickelte einen so genannten Retrieval-Augmented-Generation-Chatbot und eine Chrome-Browsererweiterung zur Echtzeit-Faktenprüfung. Als Testbeispiele wurden Aussagen zum Ukrainekrieg untersucht. Das System filterte 30 Tage OWS-Crawl-Daten, extrahierte Nachrichteninhalte, indexierte mittels Embeddings und nutzte ein etabliertes Large Language Model, um quellengestützte, evidenzbasierte Antworten auf Nutzeranfragen zu generieren. Nutzer:innen können so beliebigen Text auf einer Webseite markieren und erhalten eine sofortige Bewertung auf Basis verifizierter Nachrichtenquellen. Das Projekt zeigt, dass offene Webdaten domänenspezifische Faktenprüfungstools ermöglichen, die andernfalls auf proprietäre Such-APIs angewiesen wären. Die vollständige VERITAS-Geschichte ist hier nachzulesen – https://openwebsearch.eu/results-veritas/

AKASE: Die Argumente der Welt als Wissensgraph

Die Universität Groningen (Niederlande) konstruierte einen Argumentations-Wissensgraphen basierend auf über 105 Millionen Webindex-Dokumenten. Das System identifiziert automatisch argumentative Inhalte – Behauptungen und Prämissen – auf Webseiten, erkennt rhetorische Fehlschlüsse, bewertet die Argumentationslogiken und dokumentiert Stützungs-, Angriffs- und Paraphrasierungsbeziehungen zwischen Argumenten. Zu den Anwendungen gehören eine Suchmaschine, die Ergebnisse nach Argumentationsqualität neu sortiert, und ArgsBase, eine Multi-Agenten-Deliberationsplattform, die den JTS Early Career Researcher Prize gewann.
Die vollständige AKASE-Geschichte ist hier verfügbar – https://openwebsearch.eu/akase-results/

CIFFIL Service: Suchstatistiken zwischen niederländischen Kommunen teilen

Spinque (Niederlande) integrierte das Common Index File Format (CIFF) in seine Suchplattform, um niederländischen Kommunen den einfachen Austausch von Indexstatistiken zu ermöglichen. Kleine kommunale Dokumentensammlungen – teilweise weniger als 10.000 Dokumente – leiden oftmals unter schlechter Suchqualität, da der Datenbestand schlichtweg zu klein ist, um akurate Termfrequenzschätzungen (das sind Statistiken über die Häufigkeit und Relevanz bestimmter Begriffe innerhalb von Datensammlungen) abzugeben. Entsprechend können Suchergebnis-Rankings nicht effektiv gestaltet werden. Durch die Übernahme von Statistiken größerer Kommunen über CIFF können kleinere Kommunen ihre Ranking-Effektivität deutlich verbessern.
Die vollständige CIFFIL-Geschichte lesen – https://openwebsearch.eu/ciffil-results/

DTCommerce: Den Einzelhandel beim Schritt ins Digitale unterstützen

ZenLab (Slowenien) entwickelte Open-Source-Tools, um stationären Einzelhändlern den Übergang zum E-Commerce zu erleichtern. Ausgehend von einem Excel-Export aus dem Unternehmens-ERP oder Buchhaltungstool sucht das System nach Informationen zu den darin gelisteten Produkten. Dabei werden z.B. Titel, Beschreibungen, Bilder und UVPs von Lieferantenwebsites genutzt,  bestehende Beschreibungen mittels KI optimiert zum Schluß wird alles automatisch über ein WordPress-Plugin in einen WooCommerce-Onlineshop importiert.
Die vollständige DTCommerce-Geschichte gibt es hier zu lesen – https://openwebsearch.eu/ditcommerce-results/

OMMS: Open Maps als Alternative zu etablierten Maps Apps

Die E Foundation (Frankreich) nutzte die Crawling-Tools von OpenWebSearch.EU, um strukturierte Geschäftsdaten – Öffnungszeiten, Kontaktinformationen, FAQs – von Websites zu ernten, die mit OpenStreetMap-Points-of-Interest verknüpft sind. Diese Daten werden über einen Open-Source-POI-Server für mobile Kartenanwendungen bereitgestellt. Ausgehend vom Großraum Seattle und in einem zweiten Schritt weltweit stellte das Projektteam fest, dass etwa 12 % der POI-verknüpften Websites auswertbare strukturierte Daten enthalten. Darüber hinaus identifizierte das Projekt zwei vielversprechende Zukunftsrichtungen für OWS: die Veröffentlichung von POI-Relevanz-Rankings (basierend auf PageRank oder ähnlichen Metriken) zur Verbesserung der Ergebnissortierung in Open-Data-Geocodern sowie die Nutzung von Backlink-Daten als offene Alternative zu proprietären Bewertungsdatenbanken.
Die vollständige OMMS-Geschichte kann man hier lesen – https://openwebsearch.eu/results-omms/

FUN: Das Crawling des Webs neu denken

Die Universität Pisa und die University of Glasgow (Italien/UK) schlugen einen Paradigmenwechsel beim Web-Crawling vor. Traditionelle Crawler nutzen linkbasierte Heuristiken wie PageRank, um zu entscheiden, welche Seiten beachtet werden. FUN argumentiert, dass Crawler im Zeitalter der KI stattdessen Sprachmodelle einsetzen sollten, um die semantische Qualität von Seiten einzuschätzen. Das Team entwickelte vier neuronale Crawling-Strategien und testete sie auf 87 Millionen Seiten aus ClueWeb22-B. Bei natürlichsprachlichen Anfragen übertraf die beste Strategie PageRank durchgängig sowohl bei der Crawling-Effektivität als auch bei der nachgelagerten Retrieval-Qualität, während sie bei Keyword-Anfragen konkurrenzfähig blieb.
Die vollständige FUN-Geschichte gibt es hier – https://openwebsearch.eu/fun-results/

TILDE: Vertrauenswürdige Gesundheitssuche mit fairnessbewusstem Ranking

Das Know Center Research GmbH (Österreich) baute ein Gesundheits-bezogenes Suchsystem auf dem OWI auf, das über reine Suchergebnis Relevanz hinaus mögliche Verzerrungen und unterschiedliche Grade der Vertrauenswürdigkeit adressiert. Das System extrahierte medizinische Inhalte aus rund 200.000 gesundheitsbezogenen Webseiten, standardisierte sie gegen die klinische UMLS-Ontologie und implementierte eine hybride Retrieval-Engine aus entitätsbasierter und semantischer Suche. Die Besonderheit ist eine dreistufige Fairness-Pipeline: Sie reichert jedes Suchergebnis mit Vertrauenswürdigkeits- und Neutralitätsattributen an, sortiert Ergebnisse so um, dass Fairness maximiert wird, während Glaubwürdigkeit und Vielfalt der Standpunkte erhalten bleiben, und prüft die eigenen Systemausgaben auf Stereotype. Die visuelle Weboberfläche ermöglicht es Nutzer:innen, medizinische Evidenz über visuelle Wissensgraphen und facettierte Suche zu erkunden.
Die vollständige TILDE-Geschichte gibt es hier zu lesen – https://openwebsearch.eu/tilde-results/

Und wie geht es jetzt weiter?

Ein offener Webindex ermöglicht Anwendungen, die proprietäre Suche nicht bieten kann.
Die Forschungsbeiträge haben direkte Auswirkungen darauf, wie sich die Infrastruktur selbst weiterentwickeln sollte.
Mit dem Abschluss aller Open Calls, hat das OpenWebSearch.EU-Projekt eine Gemeinschaft aufgebaut, die weit über das Kern-Konsortium hinausreicht. Der Code, die Daten, die Modelle und die Tools dieser Projekte sind ganz überwiegend quelloffen und frei verfügbar. Die Infrastrukturbeiträge bestehen über das formale Projektende hinaus fort.

Der #FreeWebSearchDay (FWSD) zeigt jedes Jahr am 29. September, wie wichtig eine freie, offene und vertrauenswürdige Internetsuche für Demokratie, Transparenz und Informationsfreiheit ist. Der Aktionstag dient als Plattform, um gemeinsam über die Bedeutung der Websuche nachzudenken und neue Wege für eine offene, faire digitale Zukunft zu entwickeln.

Im Rahmen des FWSD werden in den Tagen um den 29. September, verschiedene Events rund um die offene Websuche, demokratische Teilhabe und digitale Bildung angeboten.

Programmhighlights 2025

  • Am 17. September findet ein Community-Workshop von NGI Search und der Open Search Foundation online statt, bei dem aktuelle Projekte vorgestellt und diskutiert werden.

  • Am 19. September lädt A1 Slovenija zum virtuellen Kick-off des ersten europäischen föderierten Open Web Index für die Industrie ein – ein spannendes Treffen für Start-ups, Entwicklerinnen und Innovatorinnen.

  • Am 29. September findet im UNI:Lokal Kassel ein Informationsabend rund um Suchmaschinen und KI statt.
    Das Thema „Kann man das noch gut finden?!“ soll Interessent:innen dazu einladen, an einer kritischen Diskussion über den Einfluss von Suchmaschinen und KI auf unseren Blick auf die Welt teilzunehmen (oder zu lauschen).

  • Zum Abschluss des Monats stellt am 30. September die Entwicklerin Noor Afshan Fathima die inklusive und datenschutzfreundliche Suchmaschine Nooon vor. Direkt im Anschluss folgt ein praktischer Workshop, bei dem Teilnehmende lernen können, wie sich Nooon individuell anpassen lässt.

Weitere Veranstaltungen sind hier gelistet: https://freewebsearch.org/events2025/

Eigene Events willkommen!

Neben den geplanten Programmpunkten lebt der #FreeWebSearchDay auch besonders von eurer Beteiligung: Ob Vortrag, Diskussionsrunde, Workshop oder kreative Mitmachaktion – jede Initiative zählt. Wer selbst ein Event organisieren möchte, kann sich unter melden und so Teil der europaweiten Bewegung werden.

Mehr Informationen und aktuelle Updates zu weiteren Veranstaltungen am #FreeWebSearch Day findet ihr unter:
https://freewebsearch.org

Das jährliche Internationale Open Search Symposium #ossym findet in 2025 bereits zum siebten Mal in Folge statt. Von 8. bis 10. Oktober läd das #ossym25 die Open Search Community dazu ein, nach Helskinki/Finnland zu reisen, um vor Ort beim diesjährigen Veranstaltungspartner CSC – IT Center for Science oder wahlweise online an den 3 tägigen interdisziplinären Austauschformaten zu partizipieren.

Interdisziplinäre Blickwinkel auf klassische Websuche und KI

Wie jedes Jahr, vereint das #ossym Expert:innen aus vielerlei Bereichen wie Informatik, Recht & Regulierung, Ethik, Wirtschaft, Politik und Gesellschaft. Das siebte Internationale Open Search Symposium bietet ein Forum, um innovative Ideen der offenen und verteilten Internetsuche und deren Anwendungsgebiete weiter zu denken. Der Schwerpunkt liegt dabei auf künstlicher Intelligenz (KI), Suchanwendungen und -technologien, rechtlichen und ethischen Aspekten der offenen Websuche sowie dem Themenspektrum Informationsverwertung/Medienkompetenz.

Keynotes zu Daten Governance und Wissensmanagement

Viivi Lähteenoja ist Chief Executuve Officer bei MyData Company und gibt Impulse zum Thema Data Governance.

Harri Ketamo ist Gründer und Vorstand von Headai und spricht zum Thema „The openness of knowledge data and its role in Future Search Solutions“.

Wissenschaftliche Sessions zum Thema „Architecture & Infrastructure“

Zwei Science Tracks zum Thema “Architecture & Infrastructure” beschäftigen sich mitunter mit der Exktraktion von strukturierten Daten aus dem Open Web Index, Datenspeicherungs-Strukturen für die URL Frontier in OpenWebSearch.eu, sowie mit der Extraktion von Geo-Daten aus semi-strukturierten Daten mit Hilfe von LLMs. Common Crawl bietet zudem Einblicke in die Abdeckung diverser Sprach- und Kulturinhalte Europas.

Anwendungs-Tracks zu “Retrieval Augmented Generation & Large Language Models”

Dezentralisierte Ansätze für den Zugang zu Informationen via Browser-Agentic Web sowie die Fusion von Retrieval, Grammatik und Entscheidungsbäume zur Textgenerierung werden hier unter anderem vorgestellt und disskutiert.

Search Engine Tracks sind fester Bestandteil der #ossym Konferenzen

Eine beliebte #ossym Tradition sind die Search Engine Tracks, die sich auf alternative Suchmaschinen und deren Anwendungs-bereiche fokussieren. Bereits bestätigt sind dieses Jahr fragFinn.de und searchmysite.net.

Ethik, Recht und Gesellschaft

Und auch die nicht technischen Themenkomplexe wie etwa gesellschaftliche Interessen und Special Needs Such-Lösungen kommen nicht zu kurz und sorgen für spannende Denkanstösse.

Information and Registrierung

Das finnische Supercomputing Center CSC – IT Center for Science bietet rund 100 on-site Plätze. First come, first serve.

Alle Informationen zur Anmeldung finden Sie unter:
https://opensearchfoundation.org/events-d/ossym25-d/

Die Open Search Foundation e. V. ist eine europäische Bewegung, die die Grundlage für einen unabhängigen, freien und selbstbestimmten Zugang zu Informationen im Internet schafft. In Kooperation mit Forschungseinrichtungen, Rechenzentren und weiteren Partnern setzen wir uns ein für eine Websuche, die allen zugute kommt.
 Ganz nach dem Motto: „Together for a better net“.

Kontakt
:
Open Search Foundation e.V. – OSF

In der aktuellen Folge mit dem spannenden Titel “Kommt die europäische Suchmaschine – Wie ein unabhängiger Suchindex entsteht” sprach Podcast Host Martin Wolff mit unserem OSF Vorstand Dr. Stefan Voigt und mit Prof. Dr. Michael Granitzer über die Misslage in der aktuellen Suchmaschinen Landschaft.

Mit der Vision, die Websuche auf europäischer Ebene zu revolutionieren, war die Open Search Foundation eine der treibenden Kräfte, die 2018 die Open Web Search Initiative ins Leben rief.
Im Rahmen dieser Initiative wurde 2022 das gleichnamige Projekt OpenWebSearch.eu mit 13 weiteren Organisationen aus Forschung und Wirtschaft ausgerollt, das insgesamt Kräfte aus sieben europäischen Ländern bündelt.

Nach 2,5 Jahren Entwicklungsphase, präsentiert das Konsortium im Jahr 2025 mit Stolz seinen europäischen föderierten Open Web Index Pilot, der auf den Namen OWI getauft wurde.
Diese Errungenschaft ist nicht nur ein wichtiger erster Eckpfeiler für die europäische digitale Souveränität, sondern trifft auch den Zahn der Zeit, inmitten von dringendem Handlungsbedarf angesichts der rasant fortschreitenden globalen KI-Entwicklungen.

Innovatoren und Early Adopters gesucht

Ab Juni können kommerzielle und wissenschaftliche Entwicklungsteams jeder Größe sowie interessierte Einzelpersonen auf fast ein Petabyte an offenen Webdaten zugreifen und diese unter einer allgemeinen Forschungslizenz oder – auf Anfrage – auch unter einer kommerziellen Lizenz nutzen.

Dies ist ein aktiver Aufruf an alle Early Adopters, innovative Projekte rund um vertikale Websuche, argumentative Suche, LLM-Anwendungen einschließlich RAG und mehr zu starten.

„Der OWI symbolisiert einen ersten Schritt in Richtung echter europäischer digitaler Souveränität und ist ein grundlegender Schritt, um den Weg für eine umfassende, offene, europäische KI-Landschaft zu ebnen.“ sagt OpenWebSearch.eu’s Community Managerin Ursula Gmelch und sie führt weiter aus:

„Unser Ziel in dieser ersten Pilotphase ist es, eine Reihe von Projekten aus verschiedenen Bereichen einzubinden, um frühes Feedback zu erhalten. Wir freuen uns darauf, dass die Nutzer:innen die Qualität und den Wert der aktuellen Funktionalitäten bestätigen und/oder uns dabei helfen, die tatsächlichen Marktanforderungen zu erfüllen und weiter auszubauen.“

Kick-off Veranstaltung am 6. Juni

Am 6. Juni von 10 bis 12 Uhr MESZ können findet die offizielle Kick-off-Veranstaltung via Zoom statt. 
Die Anmeldung zur Veranstaltung ist unter folgendem Link möglich:
https://cscfi.zoom.us/meeting/register/eATIpDQ5TZidh4Jzkim6FQ#/registration

 

Google’s Entscheidung, die Nutzung seiner KI in Waffensystemen nicht mehr ausdrücklich auszuschließen, wirft zu Recht die Frage auf, was freiwillige Versprechungen und Prinzipien von Unternehmen überhaupt wert sind.

Die Welt spielt verrückt! Zu diesem Fazit dürften Beobachter der jüngsten politischen Paukenschläge kommen. Bei der Münchner Sicherheitskonferenz zeigte sich, dass Stabilitätsanker der vergangenen Jahrzehnte, wie das transatlantische NATO-Bündnis, bald nur nostalgische Vergangenheit sein könnten. Die Welt befindet sich im Umbruch. Und es sind wenige Personen, die mit ihrer Macht den gesellschaftlichen und politischen Wandel gestalten. Gut ins Bild passt da Google’s Änderung der KI-Prinzipien: Der Konzern ermöglicht nunmehr eine Nutzung der firmeneigenen Künstlichen Intelligenz für Waffensysteme. Eine solche Nutzung war zuvor noch explizit ausgeschlossen. In der technokratischen Welt von heute prägen die Chefs großer Digitalkonzerne den politischen Diskurs. Elon Musk etwa hat sich durch Geld und geschickte Manöver das Vertrauen Donald Trumps gesichert. Im Namen des US-Präsidenten krempelt er nun die amerikanische Exekutive um und trifft in rasendem Tempo Entscheidungen, die gravierende Folgen für Menschen auf der ganzen Welt haben, etwa wenn Musk Entwicklungshilfe von einem Tag auf den anderen einstellen lässt. Sprechen Autoren von einem „AI Coup“, ist das keine Schwarzmalerei.

Google’s Entscheidung, die Nutzung seiner KI in Waffensystemen nicht mehr ausdrücklich auszuschließen, wirft zu Recht die Frage auf, was freiwillige Versprechungen und Prinzipien von Unternehmen überhaupt wert sind. Klar ist: Es ist Google unbelassen, seine KI im Rahmen der geltenden Gesetze auch für die Entwicklung und den Betrieb von Waffen einzusetzen. Der Umschwung Google’s verdeutlicht jedoch auch, dass Unternehmen ethische Bedenken bereitwillig über Board werfen, sofern sie sich davon wirtschaftliche Vorteile erhoffen. Das heißt natürlich nicht, dass ethische Commitments von Großkonzernen eine reine Marketing-Maßnahme wären. Es gibt viele Unternehmen, die ihre ethische und moralische Verantwortung bei der Entwicklung Künstlicher Intelligenz ernst nehmen und mit gutem Beispiel voran gehen. Doch gerade bei sensiblen neuen Technologien, die unsere Gesellschaft ohne Zweifel umpflügen werden, sollte die Einhaltung ethischer Mindeststandards nicht kommerziellen Akteuren zur freien Entscheidung überlassen werden. Stattdessen müssen ethische Standards über alle Branchen und Unternehmen hinweg sichergestellt sein – durch verbindliche Regulierung. Ob sich die EU-KI-Verordnung dafür als geeignetes Mittel erweisen wird, steht noch in den Sternen.

Die Causa Musk in den USA zeigt bereits heute: Haben Tech-Giganten zu viel Macht, ist kein demokratisches System vor ihnen sicher. Das gilt nicht nur für die USA, sondern genauso für Europa. Die Schwergewichte der digitalen Welt beeinflussen bereits jetzt in erheblicher Weise Gesetzgebungsprozesse. Allein Meta beschäftigt aktuell mehr als 40 Lobbyisten in Brüssel. Möchten die Europäerinnen und Europäer verhindern, dass Unternehmen rücksichtslos ihre eigenen Interessen durchsetzen, führt kein Weg vorbei an mehr Vielfalt im digitalen Raum. Um die Vielfalt und Fairness auf digitalen Märkten zu stärken, hat der europäische Gesetzgeber den Digital Markets Act (DMA) erlassen. Diese Regulierungsoffensive ist ein wichtiger Baustein, reicht aber alleine nicht aus, um Europas Bürger, Forschung und Wirtschaft vor Monopolisten im digitalen Raum zu schützen. Vielmehr braucht es europäische Lösungen, die Wirtschaft und Wissenschaft uneingeschränkt zur Verfügung stehen, um Europa konkurrenzfähig zu halten und Innovation zu ermöglichen.

Beitragsbild Meine Meinung

 

In unserer neuen Rubrik „Meine Meinung“ stellen wir Kommentare und Meinungen aus dem Open Search Foundation Team bereit. Zum Auftakt kommentierte Leopold Beer – rechtswissenschaftlicher Mitarbeiter im PriDI-Projekt – die Entscheidung von Google, eigene KI Anwendungen künftig auch für Waffenentwicklung bereit zu stellen.