Ohne Verschlüsselung bringt die Anonymisierung von Datenbankdaten nichts

In den vergangenen Jahren wurde die Weltöffentlichkeit Zeuge einer grundlegenden Veränderung im Zusammenhang mit der Verwaltung und dem Schutz von personenbezogenen Daten.

Mit der EU-Datenschutz-Grundverordnung (DSGVO) sowie weiteren Regulierungsinitiativen wurden den Konsumenten wirksame neue Rechte eingeräumt, gemäß denen sie festlegen können, inwiefern Unternehmen ihre personenbezogenen Daten (PII) erfassen und verwenden dürfen. Unternehmen, die personenbezogene Daten ohne Zustimmung speichern oder die keine ausreichenden Maßnahmen zum Schutz dieser Daten ergreifen, drohen unter Umständen harte Strafen.

Eine wichtige Ausnahme gibt es allerdings. Anonymisierte Daten – Informationen, die ohne wesentliche Einzelangaben gespeichert werden, um eine Identifikation der betreffenden Personen zu verhindern – sind von dieser Regelung ausgenommen.

Jüngere Forschungen zeigen jedoch, wie Personen durch Querreferenzierung anonymisierter Daten zu verwandten, frei zugänglichen Datensätzen identifiziert werden können.

Die Verschlüsselungstechnologie, die gewöhnlich in professioneller Virtual Private Network (VPN)-Software verwendet wird, stellt die einzige zuverlässige Methode dar, um anonymisierte Daten in einer Datenbank vor dem Zugriff derjenigen zu schützen, die zum Zwecke skrupelloser Machenschaften darauf aus sind, alle Informationen zu einem Gesamtbild zusammenzufügen.

Warum Daten anonymisieren?

Anonymisierte Datensätze fallen nicht in den Geltungsbereich der DSGVO oder vergleichbarer Vorschriften weltweit. Sie erlauben Unternehmen die Sammlung, Analyse und Speicherung von Informationen, unbeeinträchtigt von Einzelnen, die Anträge auf die Erteilung einer Auskunft über personenbezogene Daten (Data Subject Access Request; DSARS) stellen oder den Zugriff bzw. die Löschung ihrer Daten verlangen.

Da Daten in anonymisierter Form nicht zur Identifizierung einzelner Personen verwendet werden können, soll damit die Wahrscheinlichkeit eines Angriffs oder eines aus ihrem Verlust resultierenden Schadens verringert werden. Nach allgemeiner Auffassung besteht keine Gefahr von Bußgeldern, solange die Privatsphäre nicht gefährdet wird.

Für medizinische Studien oder die Marktforschung sind anonymisierte Daten ideal. Beispielsweise kann sich eine regionale Gesundheitsbehörde dazu entschließen, Patientennamen, Adressen und Geburtsdaten aus digital gespeicherten Krankenakten zu entfernen. Dateien ohne diese Informationen lassen sich für Forschungszwecke verwenden, ohne dass die Gefahr besteht, hierbei die Identität einzelner Personen preiszugeben.

Nicht nur die medizinische Forschung profitiert von anonymisierten Daten. Ein aktuelles Beispiel lieferte Transport for London (TfL), die für die Koordination des Londoner Verkehrssystems zuständige Dachorganisation: TfL wertete anonymisierte Mobilfunkdaten von Fahrgästen zur Gewinnung von Informationen aus, anhand derer genauere Schätzungen von Fahr- und Ankunftszeiten möglich sind.

Doch obwohl anonymisierte Daten zweifellos ihren Nutzen haben, sind sie bei weitem nicht vollkommen.

Ein Gesamtbild zusammensetzen

Für sich allein genommen, sind anonymisierte Daten unmöglich zu entziffern. Das ist auch richtig so.

Zumindest solange, bis jemand beginnt, Querverweise zu verwandten, öffentlich zugänglichen Datensätzen – beispielsweise zu Daten aus einem Wählerverzeichnis oder einer nationalen Volkszählung – herzustellen.

Die belgische Université Catholique de Louvain (UCLouvain) und das Imperial College London stellten fest, dass sich dies tatsächlich mit erschreckender Genauigkeit bewerkstelligen lässt.

Ein Fall im Rahmen der Untersuchung zeigte, dass sich ein anonymisierter Datensatz mit 15 demografischen Merkmalen verwenden ließ, um Personen im Bundesstaat Massachusetts mit einer Genauigkeit von 99,98 Prozent zu identifizieren. Bemerkenswert, wenn man bedenkt, dass die staatliche Bevölkerung knapp sieben Millionen Menschen umfasst.

In einem anderen markanten Fall stellten Forscher fest, dass öffentlich zugängliche, anonyme Daten zu Fahrten von Taxifahrern in New York City dazu verwendet werden konnten, deren Privatadressen herauszufinden.

Im Rahmen einer Untersuchung der University of Melbourne im Jahr 2017 konnten anhand von anonymisierten öffentlichen Krankenakten fast zehn Prozent aller Australier identifiziert werden.

Ein Grundprinzip lautet: Je kleiner der Datensatz, desto genauer das Verfahren der Deanonymisierung – insbesondere bei Querverweisen auf die richtige Datenbank.

Mit Verschlüsselung die Bemühungen verstärken

Die europäischen Regulierungsbehörden haben bewiesen, dass sie bereit sind, empfindliche Strafen gegen Unternehmen zu verhängen, die im Zusammenhang mit anonymisierten Daten keine angemessenen Vorsichtsmaßnahmen ergreifen. Die dänische Datenschutzbehörde hielt es für angebracht, im März dieses Jahres ein Taxiunternehmen mit einer Geldstrafe von rund 180.000 US-Dollar zu belegen, weil es Daten nicht ordnungsgemäß anonymisiert hatte.

Unternehmen können sich zudem keinen Stillstand leisten. Sie müssen ihre Schutzmaßnahmen parallel zu Tools und Technologien weiterentwickeln. Ein Prozess, der für die Anonymisierung von Daten in einem Jahr als ausreichend erachtet wird, ist im nächsten Jahr möglicherweise veraltet.

Zweifelsohne können Unternehmen nicht davon ausgehen, mit anonymisierten Datenbankdaten allein die sensiblen Kundendaten schützen zu können. Sie müssen zusätzliche Schritte unternehmen, um angemessene Sicherheitsvorkehrungen zum Schutz der Privatsphäre zu gewährleisten.

Die Verschlüsselung stellt eine der zuverlässigsten Strategien zum Schutz der Vertraulichkeit digitaler Assets dar, insbesondere wenn das Unternehmen diese über das öffentliche Internet senden bzw. austauschen muss.

Verschlüsselte Daten sind codiert und der Zugriff auf diese Daten ist nur mit dem richtigen Schlüssel möglich. Dabei kommt in der Regel die symmetrische oder die Public-Key-Verschlüsselung zum Einsatz. Die so behandelten Daten können nicht entziffert werden und sind somit für externe Beobachter praktisch unverständlich.

Zum Schutz der in Datenbanken gespeicherten Daten und ebenso bei ihrer Übertragung ist eine Verschlüsselung unerlässlich. Die Verwendung eines professionellen VPNs in unternehmensgerechter Qualität stellt eine äußerst wirksame Methode zur Absicherung der digitalen Kommunikation dar.

Kurz gefasst: Die Anonymisierung von Datenbanken stellt eine gute Möglichkeit für die Speicherung von personenbezogenen Daten dar, die im Zuge von Forschungen erhoben werden. Da jedoch selbst die umfangreichsten Datensätze durch Querreferenzierung reidentifiziert werden könnten, dürfen Forscher nicht allein auf die Anonymisierung vertrauen, um die von ihnen gespeicherten sensiblen, personenbezogenen Daten geheimzuhalten. Unternehmen müssen noch einen Schritt weitergehen, indem sie ein robustes, für Unternehmen geeignetes VPN implementieren, um jederzeit einen umfassenden Schutz der Kundenprivatsphäre garantieren zu können.

Blog abonnieren

CAPTCHA-Bild zum Spam-Schutz Wenn Sie das Wort nicht lesen können, bitte hier klicken.