„Privacy in Open Search: A Review of Challenges and Solutions“

, ,

Samuel Sousa (Graz University of Technology) und Roman Kern (Know-Center GmbH) haben zusammen mit Christian Guetl von der Open Search Foundation (Leiter des CoDiS Labs, TU Graz) einen Artikel über die Herausforderungen und Lösungen des Datenschutzes in der offenen Suche veröffentlicht.

Hier ist die Zusammenfassung:

„Der Schutz der Privatsphäre ist weltweit von Bedeutung für Aktivitäten und Prozesse, die sensible Daten beinhalten. Aus diesem Grund haben viele Länder und Gebiete in letzter Zeit Vorschriften erlassen, die regeln, inwieweit Organisationen die von Menschen bereitgestellten Daten nutzen dürfen. In Bereichen der künstlichen Intelligenz, wie dem maschinellen Lernen und der Verarbeitung natürlicher Sprache, wurden bereits erfolgreich Mechanismen zur Wahrung der Privatsphäre eingesetzt, um den Datenschutz in einer Vielzahl von Anwendungen zu gewährleisten. Das Information Retrieval (IR) ist ebenfalls anfällig für Bedrohungen der Privatsphäre, wie z. B. Angriffe und unbeabsichtigte Offenlegungen von Dokumenten und Suchhistorien, die die Sicherheit der Nutzer beeinträchtigen und durch Datenschutzgesetze geahndet werden können.

Diese Arbeit zielt darauf ab, offene Herausforderungen für den Datenschutz in der neueren IR-Literatur aufzuzeigen und zu diskutieren, wobei der Schwerpunkt auf Aufgaben liegt, die nutzergenerierte Textdaten beinhalten. Wir leisten einen dreifachen Beitrag: Erstens geben wir einen Überblick über die Bedrohungen der Privatsphäre bei IR-Aufgaben; zweitens diskutieren wir anwendbare Mechanismen zur Wahrung der Privatsphäre, die in Lösungen zur Eindämmung der Gefahren für die Privatsphäre eingesetzt werden können; und schließlich geben wir Einblicke in die Kompromisse zwischen der Wahrung der Privatsphäre und der Nutzleistung bei IR-Aufgaben.“

Der Artikel ist auf englisch erschienen.
Autoren: Samuel Sousa, Christian Guetl, Roman Kern

Der vollständige Artikel steht in den arXivLabs zur Verfügung:
https://arxiv.org/abs/2110.10720