öffentlich
Redaktion Druckversion

Metadaten, Verbindungsdaten und soziale Netzwerkanalyse (SNA)

SNA via Google Mail und Facebook

4.88889
(9)
Beitrag bewerten
Kommentar schreiben
Stand: 20. August 2013
  • „Es handelt sich nur um Metadaten. Inhalte werden nicht berücksichtigt.”

    (This is just metadata. There is no content involved. Dianne Feinstein, US-Kongressabgeordnete und Vorsitzende des Ausschusses für die Nachrichtendienste)

  • […] alle Abhörvorwürfe [an Google wegen Gmail] greifen nicht, da das Vorgehen [des automatischen Auswertens von E-Mail-Inhalten] zweifelsohne zum normalen Geschäftsgebaren von Google als Provider von E-Mail-Kommunikationsdiensten (ECS) gehört.”
    (aus der Klageabweisungsschrift der Google-Anwälte Cooley LLP vom 13. Juni 2013)

„Nur” Metadaten?

Seit einigen Wochen wissen wir, dass amerikanische Nachrichtendienste, allen voran die NSA, uns flächendeckend ausspähen. Wir wissen auch, dass europäische Geheimdienste, Telekommunikationsunternehmen sowie amerikanische Internet- und IT-Konzerne wie Google, Facebook, Apple und Microsoft ihnen dabei kräftig helfen. Das Hauptaugenmerk der Späher liegt zunächst auf sogenannten Metadaten.

Metadaten, auch Metainformationen genannt, sind (meistens) strukturierte Daten, die Aspekte des Inhalts anhand von Merkmalen beschreiben. Typische Metadaten z.B. für Bücher sind: Autor, Titel, Verlag, Erscheinungsjahr, ISBN-Nummer, Seitenzahl. Gewünscht sind dabei Eigenschaften, die sich maschinell bestimmen, erfassen und auswerten lassen – und somit auch in größeren Mengen verarbeitet werden können.

Verbindet man maschinell lesbare Informationseinheiten wie Mobilfunkdaten, IP-Adressen, Browserverläufe und E-Mail-Metadaten mit der Technologie von Suchfiltern, dann hat man bereits sehr mächtige Werkzeuge, um die Bewegungen und Aktivitäten von Menschen zu überwachen. So wird klar, warum schon allein aus diesem Umstand heraus Firmen wie Google für die NSA besonders interessant sind. Schließlich wird durch die neuen Google-AGB sichergestellt, dass Google selbst Verbindungen zwischen seinen vielfältigen Diensten herstellen darf – Google Suche, Google Mail, Google Kalender, Google Earth/Maps, Google+, YouTube, Blogger usw.

Verbindungsdaten und soziale Netzwerkanalyse (SNA)

Metadaten dienen außerdem dazu, die Struktur und Beschaffenheit von sozialen Netzwerken aufzuzeigen. Hier geht es etwa um Aussagen wie: Wer spricht mit wem? Wann? Wie lange? Wo? Von welchem Gerät aus? Welche soziale Rolle hat diese Person inne? Um was für eine Kommunikation handelt es sich? Und daraus abgeleitet: Wie ist die Beziehung zwischen den Menschen, wer hat wen wo und wie oft besucht? usw. Es handelt sich dabei um „Verbindungsanalyse” oder „traffic analysis”. Damit können soziale Netzwerke und deren Einzelknotenpunkte (d.h. Menschen) analysiert werden.

Um es gleich klarzustellen: Die soziale Netzwerkanalyse („social network analysis”, SNA) hat nicht die NSA oder ein anderer Geheimdienst erfunden, sondern die Wissenschaft. Soziale Netzwerkanalysen werden seit den 30er-Jahren des 20. Jahrhunderts als Konstrukt in der Sozialforschung genutzt, um Aussagen über Verbindungen zwischen Individuen, sozialen Gruppen oder gar Nationen zu machen. Darüber hinaus können mit SNA Informationen über Kommunikations- und Arbeitsprozesse in Unternehmen gewonnen und damit Probleme gezielter angegangen werden. Auch Epidemieverläufe können so beschrieben werden, um den möglichen Verlauf von Krankheitswellen vorauszusagen und ihre Ausbreitung einzudämmen. Interessant sind solche Auswertungen schließlich auch, um Produkte gezielt zu vermarkten oder die Chancen eines Produkts auf dem Markt einzuschätzen, weil sie zeigen, wo ein bestimmtes Produkt ein Problem löst oder eine Lücke im Kommunikations- oder Produktionsprozess schließt.

Bei der sozialen Netzwerkanalyse soll das ans Licht, was Social-Media-Unternehmen wie Facebook z.T. bereits über ihre Nutzer bekannt ist: deren „Likes”, „Freunde” und die Nähe oder Entfernung zu anderen „Kreisen” und „Netzwerken”. Das Projekt Immersion des MIT Media Labs kann diesen Ansatz jedem verdeutlichen, der über ein Google-Mail-Konto verfügt. Allein anhand von Empfänger (auch CC), Absender und Zeitpunkt (Timestamp) der Mails ergeben sich recht tiefe Einblicke in das eigene soziale Netzwerk, so wie Google-Mail es sieht. Durch Klicks auf die einzelnen Knoten erhält man detaillierte Informationen über die Beziehung zu den ausgewählten Kontakten. Mit den Reglern kann man die Zeitschiene einstellen und schauen, wie die E-Mail-Kontakte sich über die Jahre und Monate verändert haben – und somit Schlüsse über das soziale Netzwerk und die Stellung des Einzelnen innerhalb dieses Netzwerks ziehen. Bei Immersion gelten als Kontakt nur diejenigen, mit denen man mindestens dreimal E-Mails ausgetauscht hat.

Wer sich nicht mit dem eigenen Gmail-Account anmelden möchte, kann sich – wie hier abgebildet – einen Demo-Account anschauen.

Soziale Netzwerkanalyse anhand eines Googlemail-Accounts: Das Programm Immersion von MITBild vergrößernSoziale Netzwerkanalyse anhand eines Googlemail-Accounts: Das Programm Immersion von MIT

Soziale Netzwerkanalyse hat einen festen Platz sowohl in der Polizeiarbeit als auch in anderen Arten von Aufklärungstätigkeit, auch der Geheimdienste. Im Falle des NSA soll die Erhebung der dazu notwendigen Daten auch zur Terrorbekämpfung dienen. Allerdings scheint das Verfahren gerade bei Terrorgruppen oder anderen Geheimorganisationen nicht gut zu funktionieren. Valdis E. Krebs zufolge, einem Forscher, Autor und Berater in Fragen der sozialen Netzwerkanalyse und Berater beim US-Verteidigungsministerium, zeichnen sich geheim im Untergrund arbeitende Netzwerke gerade dadurch aus, dass die handelnden Akteure mit Absicht selten direkt miteinander kommunizieren. Die Verbindungslinien und die Intensität der Verbindung zwischen den einzelnen Mitgliedern einer terroristischen Organisation sind deshalb sehr schwer herauszubekommen – Geheimhaltung ist im Regelfall wichtiger als Effektivität und kurze Wege. Eine Voraussage über mögliche Terroranschläge ist äußerst schwierig und die Aufklärungsrate gering.

Möglicherweise dienen diese Schwierigkeiten als Rechtfertigung für die Ausweitung der Ausspähung auf zwei oder drei „hops” (Sprünge), wie NSA Deputy Director John Inglis die Anwendung der Richtlinien der FISA vor einem US-Kongressausschuss beschrieb. Nicht nur die unmittelbar Verdächtigen werden also legal ausgespäht, der Kreis der „Untersuchten” wird bis ins dritte Glied erweitert – hierfür sei keine besondere Genehmigung erforderlich. Diese Einschränkung gilt ohnehin nur für US-Bürger, die nicht im Ausland sind. Informationen über alle anderen können NSA und andere US-Nachrichtendienste jederzeit detailliert und nach US-Recht ganz legal einholen. Sie tut dies auch. Dadurch wiederum wird es möglich, jeden US-Bürger ohne besondere rechtliche Verfügung auszuspionieren, wenn er über drei „hops” mit einem nicht in den USA lebenden Amerikaner oder einem ausländischen Bürger kommuniziert.

SNA liefert nicht nur Informationen über die Topologie eines sozialen Netzwerks als Ganzes. Aus der Netzwerkanalyse kann man auch detaillierte Erkenntnisse über eine Einzelperson gewinnen. So kann man über diejenigen, die meinen, sie hätten „nichts zu verbergen”, mit Metadaten und SNA weitaus mehr erfahren, als den meisten lieb sein dürfte. Eine Fundgrube hierfür sind Social-Media-Websites, insbesondere Facebook.

SNA, Facebook und "Social Graph"

Carter Jernigan und Behram Mistree haben in ihrer Studie "Gaydar: Facebook Friendships Expose Sexual Orientation" (2009) gezeigt, wie anhand einer einfachen Analyse der Facebook-Freunde mit bis zu 80% Sicherheit festgestellt werden konnte, wer homosexuell ist. Dabei war es irrelevant, ob man mit seiner sexuellen Orientierung in Facebook offen umging oder nicht. Es war auch nicht erforderlich, das man selber in dem Feld „interessiere mich für: (Frauen, Männer)” überhaupt etwas eintrug. Es reichte, wenn man Freunde hatte, die dieses Feld bedienten. Ausgehend von der in verschiedenen Studien untermauerten Annahme, dass homosexuelle Männer weitaus mehr homosexuelle Freunde haben als heterosexuelle Männer, konnte anhand einer einfachen sozialen Netzwerkanalyse von 4.080 Facebook-Profilen, die zufällig aus dem damaligen MIT Network ausgewählt wurden (MIT-Netzwerk: das Facebook-Netzwerk von Studierenden des Massachusetts Institute of Technology), Aussagen über die sexuelle Orientierung getroffen werden. Es stellte sich heraus, dass diese Aussagen eine hohe Trefferquote hatten: Sie stimmten für 78% der homosexuellen Männer und für knapp 83% der heterosexuellen Männer.

Die Implikationen der Studie sind in mehreren Hinsichten beunruhigend. Anhand von einfachen Analysen der Facebook-Profile kann die sexuelle Orientierung auch dann „entlarvt” werden, wenn der Einzelne diese Information selbst gar nicht preisgibt. Gleichzeitig jedoch weist die Auswertung eine Fehlerquote von ca. 20% auf, also trifft die Kategorisierung häufig wiederum nicht zu. Betroffene können so oder so mit Problemen rechnen, wenn ihre Umwelt auf solche Informationen zur sexuellen Orientierung negativ reagiert.

Facebook hat damit aber kein Problem. Facebook hat eine lange Geschichte klarer Verletzungen von Datenschutz und Privatsphäre. Und Facebook ermöglicht inzwischen selbst seinen Nutzern eine soziale Netzwerkanalyse – eine Art PRISM für Arme. Das Werkzeug hierfür heißt „social graph” und ist zurzeit in der englischsprachigen Version von Facebook zu sehen.

Wenn Sie diese soziale Netzwerkanalyse in Facebook selber sehen wollen, gehen Sie in Ihre Facebook-Einstellungen und stellen Sie die Spracheinstellung auf „English (US)”. Geben Sie dann in das Facebook-Suchfeld ein: „Men who live in (Stadt Ihrer Wahl, z.B. New York) and are gay” ( „Männer in Stadt X, die schwul sind”). Sie erhalten eine Liste von Männern, die in dem entsprechenden Feld „interested in” entweder „men” oder „men and women” eingegeben haben. Im Suchfeld oben wurde ihre Suche von Facebook verändert: Nun lautet Ihre Suchanfrage „men who live in (Stadt X) and are interested in men” – schließlich weiß Facebook, was Sie wissen wollen. Facebook hat Ihre Suche so übersetzt, dass es auf Facebooks eigene Felder passt.

Grenzen wir nun die Reichweite ein, sodass die Suche sich nur auf Ihr Netzwerk bezieht. Geben Sie ein: „Friends of my friends who are gay” (schwule Freunde meiner Freunde). Es dauert zwar einen Moment, aber dann erhält man eine Liste vermeintlich schwuler Männer, mit denen man über gemeinsame Freunde verbunden ist. In meinem Fall sind es weit über 100. Nun gebe ich aus Neugierde ein Friends of friends of my friends who are gay” (also „schwule Freunde von Freunden meiner Freunde”) und das hilfreiche Facebook-Suchfeld ändert sich in „Friends of friends of my friends who are men interested in men” und ich erhalte eine Liste von weit über 1000 Männern, die von sich sagen, dass sie sich für Männer bzw. für Männer und Frauen interessieren. Da wären wir bei den zwei Hops, die die NSA offenbar verwendet, um ihre Suchreiche zu erweitern.

Nun kann man die Suche verfeinern, indem ich den Arbeitgeber, die Heimatstadt, den Wohnort usw. eingebe. Ob diese Männer tatsächlich alle schwul oder bisexuell sind, wage ich zu bezweifeln. Aber was weitaus wichtiger ist: Haben diese Männer, als sie das Feld ”interested in” ausfüllten, geglaubt, dass Dritte so leicht und schnell Zugriff auf ihre (vermeintliche) sexuelle Präferenz bekommen? Wohl eher nicht – in der Regel möchte man doch selber von Fall zu Fall entscheiden, wem man so etwas Intimes mitteilt. Davon abgesehen gibt es Länder auf dieser Welt, in denen Homosexualität mit dem Tod bestraft wird.

Ähnliche Suchabfragen kann man für Menschen mit psychischen Krankheiten, Menschen, die Alkoholiker sind/waren usw. machen. Die Liste der Ausspähmöglichkeiten hängt nur davon ab, wie erfindungsreich man ist und mit welchen Daten die Facebook-Ergebnisse kombiniert werden können.

Beitrag bewerten

Ihre Wertung:

 

Neuer Stand

Im Artikel sind relativ simple Formen der Auswertung beschrieben. Es gibt sehr viel weitergehende Möglichkeiten die auch "opake" Privacy-Einstellungen durchdringen.
http://qz.com/140357/what-your-facebook-friends-list-reveals-about-your-...

Komplexe Metadatenauswertungen

Vielen Dank für den wertvollen Hinweis! Sie haben vollkommen recht: In der Tat gibt es vielfältige Möglichkeiten Metadaten auszuwerten - die auch genutzt werden, nicht nur für geheimdienstliche Tätigkeiten. Wie in dem von Ihnen zitierten Artikel nutzen auch Firmen wie Facebook - aber auch viele andere Unternehmen, u.a. Marketingunternehmen - Metadaten, um Profile via "Webwanzen", "Beacons" u.a.m. zu erstellen. Die Verknüpfung von den vielfältigsten Metadaten erlauben eine "Personalisierung" (euphemistisch ausgedrückt), trotz "dynamischer" IP-Adressen & Co. Es reicht, wenn man während der Online-Sitzung, eine E-Mail schickt, in den Social Media aktiv wird, etwas kauft, oder gar etwas liest (was mit Zählpixel und zwei Jahrescookie versehen ist) u.v.a.m. um aus vermeintlichen "anonymen" Merkmalen sehr viele personenbezogenen Informationen zu erhalten. Es geht eben nicht um das EINE Merkmal, sondern um die Bündelungen der Metadaten, die erst kombiniert ihre volle Kraft entfalten.
Die im Beitrag genannten Möglichkeiten von Facebooks Social Graph sollten demonstrieren, wie einfach es ist, mit den primitivsten Mitteln, die Facebook anbietet und die Informationen, die von Mitgliedern nichtsahnend bereitgestellt werden, jeder die Privatsphäre eines anderen empfindlich verletzen kann. Dass Facebook und andere Unternehmen ausgefeiltere Möglichkeiten haben und nutzen, steht außer Frage.

Handy-Daten ausgewertet: Beispiel

Es gibt eine sehr schöne Visualisierung dessen, was man allein aus den Handydaten eines einzelnen Menschen an Bewegungsprofilen erstellen kann. Der Politiker Malte Spitz hat das für sich selbst sinnigerweise in Form einer GoogelMaps-Karte gezeigt: http://www.zeit.de/datenschutz/malte-spitz-vorratsdaten

Mitglied werden, Vorteile nutzen!

  • Sie können alles lesen und herunterladen: Beiträge, PDF-Dateien und Zusatzdateien (Checklisten, Vorlagen, Musterbriefe, Excel-Rechner u.v.a.m.)
  • Unsere Autoren beantworten Ihre Fragen

Über die Autorin:

bild141779

Ray M. Rosdale ist Historikerin, Unternehmensberaterin und Mitgründerin von akademie.de. Seit über 20 Jahren konzipiert und entwickelt sie IT- und Internet-Projekte. Ein besonderer inhaltlicher Schwerpunkt ihrer Arbeit ist die Frage nach brauchbaren, erfolgreichen Geschäftsmodellen, insbesondere für Contentangebote im Netz.

Newsletter abonnieren