JKU-System schützt persönliche Merkmale vor Suchmaschinen

Sie wollen passende Kino-Empfehlungen aus dem Internet, die Suchmaschine soll aber nicht schlussfolgern, dass Sie ein österreichischer Mann sind? Dafür haben Forscherinnen und Forscher der Johannes Kepler Universität (JKU) Linz ein System entwickelt, das neugierige Suchmaschinen im Internet in Schach hält. Die Künstliche Intelligenz (KI) verschleiert Persönlichkeitsmerkmale der Suchenden, die Suchergebnisse bleiben aber exakt, berichtete die JKU am Mittwoch.

Moderne Suchmaschinen und Empfehlungssysteme arbeiten mit Künstlicher Intelligenz und Deep-Learning-Methoden. Das führt zu präzisen Antworten auf User-Fragen, gleichzeitig können aber persönliche Daten der User ziemlich genau vorhergesagt werden. Aus dem Konsumverhalten von Musik oder Filmen wird zum Beispiel das Geschlecht zu 72 Prozent korrekt abgeleitet, hieß es in der Presseaussendung der Universität.

Damit die Empfehlungssysteme nicht mehr so leicht Rückschlüsse auf die Persönlichkeit ziehen können, haben Professor Markus Schedl und sein Team vom Institut für Computational Perception eine eigene Deep-Learning-Architektur entwickelt. Beim Adversarial Variational Auto-Encoder with Multinomial Likelihood, kurz Adv-MultVAE werden zwei Netzwerke aktiv, die separat arbeiten, aber eng gekoppelt sind. Eines findet die gewünschten Filme oder Musik. Das zweite versucht, sensible persönliche Eigenschaften – wie Geschlecht oder Nationalität – des Users möglichst genau vorherzusagen. Dann werden die Parameter schrittweise so angepasst, dass die Empfehlungen ähnlich bleiben, die Persönlichkeitsmerkmale aber weniger genau bestimmt werden können.

Am Ende sollen gute Suchergebnisse, aber schlechte Persönlichkeitsvorhersagen stehen. Die Methode wurde mit Musik- und Filmdatensets getestet und reduzierte die Vorhersagegenauigkeit für das Geschlecht auf 57 Prozent bei Filmen und auf 62 Prozent bei Musik.

Neben dem Schutz der eigenen Daten erweitert das neue System auch den Horizont der Suchenden. „Das heißt, Männern werden nun häufiger auch ‚weiblich‘ konnotierte Filme wie Casablanca empfohlen. Dadurch wirkt unser Ansatz auch Stereotypen und der Blasenbildung im Internet entgegen“, erklärt Schedl. Weil vermutlich „einfach mehr Daten von Männern vorliegen“ oder „Frauen ein anderes Nutzungsverhalten als Männer“ haben, wirkt der Algorithmus bei Frauen noch etwas schlechter. Daher soll das System mit starkem Blick auf weibliche Merkmale weiterentwickelt werden.

Mit „ein bisschen Fachwissen“ könne man den vor kurzem auf der Top Information Retrieval Konferenz (ACM SIGIR) publizierten Algorithmus und seine Ergebnisse selbst testen. „Alles was man zur Umsetzung benötigt, wie Source Code, Datensets etc., steht auf unserem Github-Account zur Verfügung“, sagte Schedl.

Service: Publikation unter und Github-Account zum Testen unter

JKU-System schützt persönliche Merkmale vor Suchmaschinen

Sie wollen passende Kino-Empfehlungen aus dem Internet, die Suchmaschine soll aber nicht schlussfolgern, dass Sie ein österreichischer Mann sind? Dafür haben Forscherinnen und Forscher der Johannes Kepler Universität (JKU) Linz ein System entwickelt, das neugierige Suchmaschinen im Internet in Schach hält. Die Künstliche Intelligenz (KI) verschleiert Persönlichkeitsmerkmale der Suchenden, die Suchergebnisse bleiben aber exakt, berichtete die JKU am Mittwoch.

Moderne Suchmaschinen und Empfehlungssysteme arbeiten mit Künstlicher Intelligenz und Deep-Learning-Methoden. Das führt zu präzisen Antworten auf User-Fragen, gleichzeitig können aber persönliche Daten der User ziemlich genau vorhergesagt werden. Aus dem Konsumverhalten von Musik oder Filmen wird zum Beispiel das Geschlecht zu 72 Prozent korrekt abgeleitet, hieß es in der Presseaussendung der Universität.

Damit die Empfehlungssysteme nicht mehr so leicht Rückschlüsse auf die Persönlichkeit ziehen können, haben Professor Markus Schedl und sein Team vom Institut für Computational Perception eine eigene Deep-Learning-Architektur entwickelt. Beim Adversarial Variational Auto-Encoder with Multinomial Likelihood, kurz Adv-MultVAE werden zwei Netzwerke aktiv, die separat arbeiten, aber eng gekoppelt sind. Eines findet die gewünschten Filme oder Musik. Das zweite versucht, sensible persönliche Eigenschaften – wie Geschlecht oder Nationalität – des Users möglichst genau vorherzusagen. Dann werden die Parameter schrittweise so angepasst, dass die Empfehlungen ähnlich bleiben, die Persönlichkeitsmerkmale aber weniger genau bestimmt werden können.

Am Ende sollen gute Suchergebnisse, aber schlechte Persönlichkeitsvorhersagen stehen. Die Methode wurde mit Musik- und Filmdatensets getestet und reduzierte die Vorhersagegenauigkeit für das Geschlecht auf 57 Prozent bei Filmen und auf 62 Prozent bei Musik.

Neben dem Schutz der eigenen Daten erweitert das neue System auch den Horizont der Suchenden. „Das heißt, Männern werden nun häufiger auch ‚weiblich‘ konnotierte Filme wie Casablanca empfohlen. Dadurch wirkt unser Ansatz auch Stereotypen und der Blasenbildung im Internet entgegen“, erklärt Schedl. Weil vermutlich „einfach mehr Daten von Männern vorliegen“ oder „Frauen ein anderes Nutzungsverhalten als Männer“ haben, wirkt der Algorithmus bei Frauen noch etwas schlechter. Daher soll das System mit starkem Blick auf weibliche Merkmale weiterentwickelt werden.

Mit „ein bisschen Fachwissen“ könne man den vor kurzem auf der Top Information Retrieval Konferenz (ACM SIGIR) publizierten Algorithmus und seine Ergebnisse selbst testen. „Alles was man zur Umsetzung benötigt, wie Source Code, Datensets etc., steht auf unserem Github-Account zur Verfügung“, sagte Schedl.

Service: Publikation unter und Github-Account zum Testen unter