Basis für tausend Suchmaschinen – Artikel im IT-Magazin c't

„Muss es denn immer Google oder Bing sein? Mit dem Projekt OpenWebSearch will die EU ihre Souveränität im Internet schützen. Das Ziel ist ein frei zugängliches Webverzeichnis, das diverse Suchmaschinen und Sprachmodelle füttert und einen Boom neuer Webdienste auslösen soll.“

Arne Grävemeyer berichtet in der Ausgabe 9/2023 der c’t über das Projekt openwebsearch.eu, an dem die Open Search Foundation maßgeblich beteiligt ist. Ausführlich beleuchtet der Artikel das Vorhaben, die Hintergründe und die zukunftige Entwicklung. Zu Wort kommen Michael Granitzer (Universität Passau, OSF und Projekt-Lead von openwebsearch.eu), Stefan Voigt (Open Search Foundation, DLR), Christian Gütl (Technische Universität Graz) und Phil Höfer (SuMa e.V./MetaGer).

„Was könnte man aber mit einem großen Web-Index alles machen, wenn dieser öffentlich frei verfügbar wäre? Man könnte alternative Suchmaschinen aufbauen oder spezialisierte Suchdienste nach ausgewählten Themen. Anwender hätten die freie Wahl und könnten ihre privaten Nutzerprofile besser schützen. Sprachforscher könnten in dem Datenpool eines großen Web-Index verfolgen, wie sich unsere Sprache entwickelt, und Soziologen könnten beobachten, wie wir in den sozialen Medien miteinander umgehen. Webdienste könnten darin Hinweise auf beginnende Pandemien oder andere Katastrophenfälle suchen und damit ein Frühwarnsystem aufbauen.“

„„Wir sind kein europäisches Google“, sagt Michael Granitzer, Inhaber des Lehrstuhls für Data Science an der Universität Passau, der das OpenWebSearch-Projekt koordiniert. Es gehe bei dem Projekt nicht um den Aufbau einer großen Suchmaschine, sondern viel grundlegender darum, eine Infrastruktur zu etablieren, mit der später Suchmaschinen und andere Dienste arbeiten können. Googles Größe ist am Anfang sicher unerreichbar. „Es wird eher wie bei Wikipedia sein, die im Vergleich zu großen Verlagen zunächst mit einem kleinen Kern startete und dann kontinuierlich wuchs.“

„Bereits zum Projektstart und damit noch vor dem Hype um ChatGPT betrachteten die Partner den Open Web Index mit seinem Fokus auf europäische Inhalte und Sprachen als einen Datenpool für spezialisierte Sprachmodelle. Neue Suchmaschinen könnten diese Modelle auch gleich als Schnittstelle für Suchanfragen einsetzen. „Die Benutzer suchen in der Regel nicht Links, sondern Antworten auf ihre Fragen oder sogar Lösungsvorschläge“, sagt Gütl. Das spreche für den Einsatz von Chatbots.“

„Im Sinne der digitalen Souveränität Europas kann man den Open Web Index sicherlich als kritische Infrastruktur ansehen. Die Projektpartner hoffen, dass damit transparente Strukturen im Web entstehen. Der angestrebte europäische Web-Index verspricht mehr Pluralität und nützt hoffentlich vor allem denjenigen, die auf ihren Websites einfach die besten und verlässlichsten Informationen liefern.“

 

Online-Version des Artikels (Paywall) bei heise.de

Links zu Open Web Search, zusammengestellt von c’t: ct.de/y6sw

Das EU-Projekt OpenWebSearch.EU, an dem die Open Search Foundation maßgeblich beteiligt ist, hat den den ersten Third-Party-Call gestartet: Forschungsteams aus Wissenschaft und Forschung können sich ab sofort mit ihren Vorschlägen zu rechtlichen, wirtschaftlichen und technischen Aspekten von Open Search bewerben. Sie haben die Möglichkeit, sich an der Entwicklung eines freien und offenen Suchindexes zu beteiligen und Teil der Open Search Community zu werden.

Das OpenWebSearch.EU Projektkonsortium ist bestrebt, neue Drittmittelprojektteams in die OpenWebSearch.eu Landschaft aufzunehmen und in die zukünftigen Aktivitäten für nachhaltige Forschung und Entwicklung zu integrieren. Kandidaten für Drittmittelprojekte sollten sich mit den eng verwandten Themen des Projekts befassen. Sie sollten darauf abzielen, die bestehenden F&E-Aktivitäten zu erweitern und zu bereichern, sowie neue Aktivitäten vorschlagen, die die Projektziele ergänzen.

Der erste Aufruf besteht aus zwei Themenbereichen:

1: Konzeptionelle Beiträge zu rechtlichen oder wirtschaftlichen Aspekten von Open Search;
Der Aufbau eines Open Web Index (OWI) ist nicht nur mit technischen, sondern auch mit rechtlichen und gesellschaftlichen Herausforderungen verbunden, insbesondere wenn man die jüngsten EU-Gesetze wie den Digital Service Act oder den Digital Market Act berücksichtigt. Darüber hinaus ergeben sich Herausforderungen für neue Geschäftsmodelle oder bedeutende Veränderungen auf dem Suchmaschinenmarkt. Das Konsortium sucht nach zwei möglichen Arten von Studien:

  • Rechtliche Studien zur Analyse und zum Verständnis rechtlicher Zwänge und Anforderungen für den Aufbau und Betrieb einer OWI, u. a. (i) Zusammenstellung und Analyse der für den Aufbau und Betrieb einer OWI relevanten Gesetze und Normen, (ii) rechtliche Bewertung technischer und nichttechnischer Schutzmechanismen, (iii) rechtliche Bewertung der Auswirkungen des Rechts auf De-Referenzierung für eine OWI oder (iv) Analyse bestehender Open-Source- und Open-Data-Lizenzen im Hinblick auf ihre Eignung für die Nutzung in einer OWI.
  • Wirtschaftliche Studien zum Aufbau und zur Pflege einer OWI als öffentliche europäische Infrastruktur. Dies umfasst unter anderem Studien zur Analyse und Schätzung der Kosten, die mit der Einrichtung, dem Betrieb und der Pflege einer verteilten offenen Web-Index-Infrastruktur in ganz Europa verbunden sind, sowie zur Analyse und Schätzung des Marktpotenzials und der wirtschaftlichen Auswirkungen einer solchen Infrastruktur.

2: Technische Ansätze für eine rechtskonforme Datenerfassung unter Berücksichtigung gesellschaftlicher Zwänge:

  • Web-Crawling ist die vorherrschende Methode für Web-Suchmaschinen, um Inhalte für ihren Index zu sammeln. Webmaster und Inhaltseigentümer haben jedoch nur begrenzte Kontrolle über den Crawling-Prozess durch meist proprietäre Dienste. OpenWebSearch.eu sucht nach Konzepten und Ansätzen, um die proprietären Komponenten zu öffnen und Webmastern und Inhaltseigentümern mehr Kontrolle über den Crawling-Prozess und die Nutzung ihrer Inhalte zu geben. Die angedachten Lösungen sollten technischer Natur sein und neue Metadaten-Schemata/Ontologien, Algorithmen/Dienste für die Sammlung von Website-Metadaten, Dienste und Werkzeuge für Webmaster und Inhaltseigentümer zur Festlegung rechtlicher Einschränkungen für das Crawling sowie offene Datensätze und maschinelle Lernmodelle für die Analyse und Filterung von Webseiten während des Crawling-Prozesses umfassen.

Das OpenWebSearch.EU-Projektkonsortium ist bestrebt, neue Drittmittel-Projektteams in die OpenWebSearch.eu-Landschaft aufzunehmen und sie in die zukünftigen Aktivitäten für nachhaltige Forschung und Entwicklung zu integrieren. Daher sollte das Drittmittel-Projekt die eng verwandten Themen des Projekts untersuchen und darauf abzielen, die bestehenden F&E-Aktivitäten zu erweitern und zu bereichern sowie neue Aktivitäten vorzuschlagen, die die Projektziele ergänzen.

Termine und Modalitäten
  • Eröffnungsdatum: 1. März 2023
  • Einsendeschluss: 28. April 2023, 17:00
  • Datum der Benachrichtigung: 30. Juni 2023
  • Beginn der Projekte: 1. August 2023

Erfolgreiche Antragsteller können in diesem ersten Aufruf Fördermittel zwischen 25.000 und 120.000 EUR für einen Förderzeitraum von bis zu 12 Monaten beantragen.

Wir richten uns insbesondere an kleinere Unternehmen (z. B. KMU, Start-ups), einzelne Innovatoren, einzelne Forscher oder Forschungsteams (z. B. Doktoranden oder Postdoktoranden) von renommierten Universitäten. Antragsberechtigt sind Einzelpersonen mit Wohnsitz in einem EU-Mitgliedstaat oder einem mit Horizon Europe assoziierten Land oder Organisationen mit Sitz in einem EU-Mitgliedstaat oder einem mit Horizon Europe assoziierten Land.

Weiterführende Informationen: openwebsearch.eu/call1

„Transparenz bedeutet, dass alle die gleiche Information haben, mit dem gleichen Aufwand, wodurch es – meiner Meinung nach – dann fairer wird.“ – Prof. Dr. Michael Granitzer von der Universität Passau im Gespräch mit Manfred Kloiber von Deutschlandfunk.

Hier das Interview hören (Länge: 10 Minuten): https://www.deutschlandfunk.de/das-open-web-search-projekt-interview-michael-granitzer-dlf-fb89fd76-100.html

„Warum ist ein Index überhaupt so wichtig?“ –  Forscher und Unterstützer der Open Search Foundation und dem dazugehörigen EU-Projekt OpenWebSearch.EU kommen mit unterschiedlichen Perspektiven im Artikel von Stefan Krempl via heise.de zu Wort.

Den Artikel „Missing Link: Offener Web-Index soll Europa bei der Suche unabhängig machen“ finden Sie unter: https://www.heise.de/hintergrund/Missing-Link-Offener-Web-Index-soll-Europa-bei-der-Suche-unabhaengig-machen-7466867.html?seite=all

„So wie es ist, ist es nicht fair. Google bestimmt, was wir sehen“ –  Christine Plote und Dr. Stefan Voigt, Vorstandsmitglieder der Open Search Foundation, im Gespräch mit Tobias Gmach vom Merkur.

Den Artikel „Starnberger gegen Google-Macht: Wie die Open Search Foundation das Internet verändern will“ finden Sie unter: https://www.merkur.de/lokales/starnberg/starnberg-ort29487/starnberger-gegen-google-macht-wie-die-open-search-foundation-das-internet-veraendern-will-92037826.html