Soziale Medien: Informations-Epidemien im Internet

24. Januar 2011
Twitter, Facebook & Co. – soziale Medien beherrschen zunehmend das Internet. Wie aber breiten sich Nachrichten über diese neuen Plattformen aus? Welche Rolle spielt dabei eine kleine Clique von Super-Einflussreichen? Und inwiefern sind die alten Massenmedien auch online ganz vorn mit dabei? Diese Fragen beschäftigen Krishna Gummadi am Max-Planck-Institut für Softwaresysteme in Saarbrücken.

Text: Ralf Grötker

Krishna Gummadi besitzt nicht weniger als 1,75 Milliarden Tweets – Textnachrichten des Social Media Dienstes Twitter. Jeder Beitrag besteht aus maximal 140 Zeichen (was der Länge dieses Satzes entspricht), meist inklusive eines Hinweises auf eine Webadresse. „Eine Goldgrube“, sagt der 31-jährige Inder. Der Schatz liegt sicher verwahrt auf 58 Computerservern in der „Wartburg“ – einem trutzigen, in den 1920er-Jahren erbauten Gemeindehaus in der Saarbrückener Innenstadt.

Hier, in direkter Nachbarschaft zur Sparkasse und zu einer Kreditkarten-Firma, ist das Max-Planck-Institut für Softwaresysteme untergebracht, jedenfalls bis der Neubau des expandierenden Instituts auf dem Universitätscampus fertig ist. Gummadi leitet seit 2005 die Forschungsgruppe „Networked Systems Research“. Um seine Leidenschaft für die 1,75 Milliarden Tweets zu verstehen, muss man etwas weiter ausholen.

Anfang 2003 brach im Prince of Wales Krankenhaus in Hong Kong die SARS-Epidemie aus. Untersuchungen zeigten später: Ein einziger Patient hatte 50 Mitpatienten auf direktem Weg infiziert, was schlussendlich zu 156 SARS-Fällen allein in besagtem Krankenhaus führte – und dann zum Ausbruch der Epidemie weit über die Stadt hinaus.

Ganz ähnlich wie mit Krankheiten scheint es sich mit Ideen und Moden zu verhalten. Der plötzliche Erfolg der Schuhmarke Hush Puppies ist dafür ein Beispiel. Mitte der 1990er-Jahre war der Absatz für die bequemen Kreppsohlentreter auf einem Tiefpunkt angelangt. Dann, plötzlich, geschah das Unerwartete: Der New Yorker Modedesigner John Bartlett bestellte eine Serie Hush Puppies für die Präsentation seiner Frühjahrskollektion. Er war auf die Schuhe aufmerksam geworden, weil einige Leute in der New Yorker Clubszene sie zu tragen begonnen hatten. Eine Hush-Puppies-Epidemie brach aus. 1995 verkaufte die Firma 430000 Paar Schuhe – 400000 mehr als im Vorjahr; im Jahr darauf gingen sogar knapp zwei Millionen Paar über die Ladentheken.

Der amerikanische Wissenschaftsautor Malcolm Gladwell, der die Geschichte in seinem Buch The Tipping Point beschreibt, hat für derartige Vorkommnisse eine einfache, aber plausible Erklärung. Epidemien werden von Influentials losgetreten – Leuten in einer besonderen beruflichen und sozialen Position, aber auch mit einer bestimmten Begabung und Lebenseinstellung, die es ihnen ermöglicht, mit einer ungeheuer großen Anzahl von Menschen in persönlichen Kontakt zu treten.

Die schon seit den 1950er-Jahren vor allem in der Marketing-Welt als Standardwissen zirkulierende Theorie der sozialen Epidemie wurde in der jüngeren Vergangenheit immer wieder stark kritisiert. Ein Einwand: Die Verbreitung von Viren und von Moden sei nicht vergleichbar, weil das Infektionsrisiko bei wiederholtem Kontakt mit dem Erreger im Falle eines Virus jedes Mal gleich hoch ist, bei einer Mode jedoch sowohl Mitzieh- wie Abstumpfungseffekte entstehen können. Ein anderer Vorwurf: Leute wie Gladwell würden sich die Anekdoten so auswählen, wie sie ihnen ins Konzept passten.

Oft zeigt tatsächlich schon ein näherer Blick auf die Ereignisse, dass vermeintliche Schlüsselpersonen lediglich ein Produkt der Umstände sind. Gerade der oben erwähnte SARS-Ausbruch in Hong Kong ist dafür exemplarisch. Im Prince of Wales Krankenhaus begann alles damit, dass bei dem besagten Patienten fälschlicherweise eine Lungenentzündung diagnostiziert wurde. Statt ihn zu isolieren, wurde er in einem offenen, überfüllten Saal mit schlechter Luftzirkulation untergebracht. Man schloss einen Bronchien-Ventilator an seine Lungen an – der die SARS-Viren in der Umgebung verteilte. Als Beleg für die Influentials-Theorie ist der Fall daher ein denkbar schlechtes Beispiel.

Twitter als Modell für Moden und Krankheitsepidemien

Hier kommt nun Krishna Gummadi ins Spiel. Die Forschungen, an denen er vor allem mit seiner mittlerweile als Assistant Professor am Korean Institute of Science and Technology tätigen Mitarbeiterin Meeyoung Cha gearbeitet hat, versprechen nämlich, den Streit um die Influentials zu klären. Gummadi untersucht seit mehreren Jahren die Informationsflüsse sozialer Netzwerke in Internet-Communities wie Facebook, LiveJournal, LinkedIn (dem amerikanischen Pendant zu Xing) und Twitter.

Was sich innerhalb dieser Online-Netzwerke tut, wie sich etwa Moden verbreiten, gibt wichtige Aufschlüsse auch über die Verbreitung von Viren und sozialen Epidemien in der physischen Welt. Denn hier wie dort sind die grundlegenden Strukturen Netzwerke – mit durchaus vergleichbaren Eigenschaften.

Einige der ersten Arbeiten überhaupt, welche die Entwicklung von Online-Netzwerken in großem Stil nachzeichnen, sind 2007 von Gummadis Gruppe veröffentlicht worden. Seit Neuestem untersucht er einer groß angelegten Reihe von Studien das Nutzungsverhalten des Online-Dienstes Twitter. In der zweiten Hälfte des Jahres 2009 haben die Forscher Informationen – mit spezieller Erlaubnis von Twitter und unter Berücksichtigung der üblichen Richtlinien des Datenschutzes – von knapp 55 Millionen Twitter-Konten „gecrawlt“: Im Prinzip öffentliche, aber eben nicht in gesammelter Form vorliegende Informationen wurden durch wiederholte Datenabfragen an die Twitter-Webseite gesammelt. Aus diesen 55 Millionen wurden wiederum sechs Millionen aktive Nutzer herausgefiltert. Diese Nutzer hatten einander wiederum die erwähnten 1,75 Milliarden Tweets gesendet.

Auf der Grundlage der neuen Daten ist es erstmals möglich, empirisch zu untersuchen, wie sich Ideen und Moden in sozialen Netzwerken verbreiten – und damit gängigen Theorien der Mundpropaganda oder der Innovations-Verbreitung auf den Zahn zu fühlen. Eine Studie, an der das Max-Planck-Team derzeit arbeitet, soll zeigen, ob es verschiedene Nutzer sind oder immer wieder dieselben, die mit Erfolg ihre Twitter-Kollegen auf eine bestimmte Webseite hinweisen. Bis vor kurzem war es lediglich möglich, solche Fragen mithilfe von Computersimulationen oder anderen Modellen zu untersuchen.

Duncan Watts, ehemals Soziologe an der New Yorker Columbia-Universität und heute in der Forschungsabteilung bei Yahoo, kam bei einem Test verschiedener Modellierungsverfahren zu dem Ergebnis, dass die Influentials zwar unter bestimmten Umständen eine Rolle spielten könnten – aber dass diese Umstände eng definiert sind und vermutlich relativ selten eintreten. Influentials, so das Resümée seiner Studie, sind weniger Leute mit bestimmten Eigenschaften als vielmehr solche, die einfach Glück gehabt haben.

Genau hieran knüpft die neue Twitter-Studie an. Bei der Formulierung von Hypothesen und dem Design von Versuchen greift die Studie auf die im Feld der Netzwerk-Analyse etablierten Methoden zurück. Das Vorgehen ist allerdings empirisch. In den Daten suchten die Forscher gezielt danach, welche Webseiten die Twitter-Nutzer einander empfohlen haben. Dann legten sie eine Rangliste an, die zeigen soll, welche Nutzer zur Verbreitung einer bestimmten Webseite am meisten beigetragen hatten. Zu diesem Zweck durchforsteten die Wissenschaftler Millionen von Twitter-Nachrichten nach darin genannten Webseiten-Adressen und diese wiederum nach Korrelationen und Mustern. „Eine ziemlich haarige Angelegenheit“, sagt Gummadi. Selbst große Rechneranlagen stoßen bei derartigen Aufgaben an die Grenzen ihrer Kapazitäten.

Auf Twitter und Flickr verbreiten sich Informationen epidemieartig

Nun liegt der Einwand nahe, dass man genauso wenig vom Verhalten in Online-Netwerken wie Twitter auf andere soziale Phänomene schließen kann wie von der Verbreitung von Viren auf soziale Epidemien. Strikt betrachtet stimmt das. Andererseits helfen gerade die Analysen von sozialen Medien, ein Gespür dafür zu entwickeln, welche Feinheiten entscheidende Unterschiede machen können – sowohl online als auch auf der Straße.

So etwa hat die Studie eines Teams um Jure Leskovec von der Carnegie Mellon University ergeben, dass auf der in den USA populären Produkt-Empfehlungsseite Epinion die meisten Empfehlungsketten nach wenigen Schritten im Nichts enden – was per se erst einmal eine schlechte Voraussetzung für die Verbreitung von sozialen Epidemien ist. Anders verhält es sich bei der Fotoseite Flickr, mit der sich eine Vorgängerstudie von Gummadis Twitter-Analyse befasst. „Die meisten Bilder finden hier keine große Verbreitung“, fasst Krishna Gummadi das Ergebnis zusammen. „Einige wenige Superstars unter den Fotos machen einen Großteil der Empfehlungen aus.“ Hier liegen die Voraussetzungen für Epidemien also günstiger.

Eine neulich veröffentliche Studie, die auf dem Twitter-Datensatz basiert, untersucht detailliert, wie sich die verschiedenen Kommunikationswege innerhalb von Twitter unterscheiden. Auf Twitter ist es möglich, jemandem einfach nur zu „folgen“, also dessen Nachrichten zu beziehen – ohne dass diese Gefolgschaft, so wie die „Freundschaft“ auf Facebook, der Bestätigung des Gegenübers bedarf. Man kann, zweitens, Nachrichten weiterleiten – an die Personen, die einem selbst „folgen“. Drittens: Man kann auf Nachrichten antworten.

Wenn man diese drei Aktionsformen jeweils für sich untersucht, hat man nicht mehr ein, sondern quasi drei Twitter-Netzwerke vor sich. Das Resultat: In der Kategorie „Nutzer mit den meisten Followers“ waren Nachrichtenmagazine sowie Stars und Politiker die einflussreichsten Akteure. In der Kategorie „Weitergeleitet“ hatten ebenfalls die News-Anbieter die Nase vorn, aber auch prominente Business-Ratgeber. Die meisten „Antworten“ schließlich erhielten die Stars. Was heißt: Tausende von Followers zu haben, macht einen Twitter-Nutzer nicht notwendig zum Influential – jedenfalls ist es kein Indiz dafür, dass die Botschaft, die man verbreiten will, auch aufgenommen und weiter verbreitet wird.

Daneben zeigte die Studie: Einflussreiche Twitter-Nutzer sind meist nicht nur auf einem einzigen Gebiet, sondern in verschiedenen Themenfeldern erfolgreich (dies im Gegensatz etwa zu den Communities auf der Plattform Epinion, die sich meist um ein spezielles Produkt drehen). Und: Die Einflussreichen sind keine Eintagsfliegen. Sie bleiben über einen längeren Zeitraum erfolgreich. „Einfluss ist hier kein Zufallsprodukt, sondern das Ergebnis konzertierter Bemühungen“, hält Gummadis Studie in Entgegnung auf den Influentials-Skeptiker Watts fest.

Noch etwas fällt ins Auge: die hervorgehobene Rolle, welche die Massenmedien oder deren Repräsentanten in den sozialen Online-Netzen spielen. Diese Rolle entspricht nicht unbedingt dem, was man sich unter Mundpropaganda vorstellt. Krishna Gummadis Team hat diese Beobachtung gleich zum Anlass einer neuen Studie genommen. „Wir wollten wissen: Was passiert, wenn wir hoch verlinkte Akteure wie die Seiten von Nachrichtensendern und Zeitungen einfach aus dem Spiel entfernen?“, sagt der Netzwerkforscher.

Man wählte das Auftauchen der britischen Amateur-Schlagersängerin Susan Boyd in den Twitter-Nachrichten von 2009 als Testereignis. Das Resultat: 60 Prozent aller Twitter-Nutzer erfuhren durch Tweets, die von den Nachrichtenseiten kamen, zuerst von Boyd. Was bedeutet: Ohne die Massenmedien geht gar nichts. Dennoch wirkt die große Mehrheit aus weniger gut verlinkten Twitter-Nutzern wie ein Verstärker für von den Massenmedien kommende Nachrichten. Diese Mehrheit hatte an der Verbreitung der Nachricht von Susan Boyd einen Anteil von immerhin fünf Prozent.

Social search: Gleichgesinnte suchen Ähnliches

Noch vieles mehr ließe sich mittels der Twitter-Daten untersuchen. „Mich würde interessieren, ob Dienste, die für Empfehlungen genutzt werden, dazu führen, dass die Spannbreite der individuell konsumierten Medien zunimmt – ob ich also Dinge lese, von denen ich auf dem Wege der herkömmlichen Massenmedien gar keine Kenntnis hätte“, sagt Gummadi. Ein anderes Vorhaben: „Wir könnten herausfinden, wie sich Moden und Gepflogenheiten verbreiten.“ So wurde es in letzter Zeit auf Twitter üblich, anstelle ellenlanger www-Adressen Kürzel einzusetzen, sogenannte Tiny-URLs. In dem Datensatz ließe sich genauestens verfolgen, wer wann welche Form von Tiny-URLs ins Spiel gebracht hat. „So etwas wäre nützlich als Anhaltspunkt dafür, wie sich Innovationen verbreiten.“

Für Marketingexperten könnten die Resultate solche Analysen durchaus nützlich sein. Auch hier ist man mittlerweile von dem Glauben an die Macht der Influentials abgerückt. „Das Web hat sich verändert. Heute ist nahezu jeder bei Xing oder Facebook angemeldet – da können wir gar nicht mehr sagen, wer der Relevanteste ist“, meint Christian Wilfer, Geschäftsführer der auf virales Marketing spezialisierten Agentur Dialog-Solutions. Und: „Es kommt immer auf das Produkt an“, ergänzt Mundpropaganda-Experte Martin Oetting von trnd. „Wenn ich einen Weichspüler bewerbe, dann gibt es dafür kaum eine Gruppe von besonders einflussreichen Vermittlern. Viel wichtiger sind hoch involvierte Normalverbraucher.“

Dementsprechend verhält es sich auch mit der Strategie der Marketing-Community trend: Statt einiger weniger werden viele tausend Konsumenten, die sich als Produkttester auf der Online-Plattform von trnd registriert haben, mit Neuigkeiten sozusagen geimpft. Anders als bei Dialog Solutions, die mit ihrer Plattform Shareifyoulike einen ähnlichen Plan verfolgen, konzentriert sich trnd jedoch auf die Offline-Kommunikation, weil Menschen ihren Freunden doch anders zuhören als den „Friends“ auf Facebook.

Relevant für praktische Anwendungen ist die Analyse von Netzwerken in sozialen Medien, wie sie Krishna Gummadi und seine Kollegen in Saarbrücken betreiben, aber nicht nur für die Marketing- und Innovationsforschung. Die genaue Kenntnis von Netzwerkstrukturen ist auch die Voraussetzung von Algorithmen zur Spambekämpfung. Spammer steigern ihre Online-Reputation, indem sie ihre Seiten und Benutzerkonten so häufig wie möglich verlinken. Oft entstehen so aber lediglich in sich geschlossene Verlinkungs-Universen – ohne Verbindung zu den Clustern der ehrbaren Netzbürger. Mithilfe von Algorithmen lassen sich solche Spamcluster identifizieren und lahmlegen.

Ein weiteres Anwendungsgebiet ist social search: die Suche nicht im World Wide Web, sondern innerhalb der Gemeinschaft Gleichgesinnter. Ein Prototyp eines solchen Suchverfahrens wurde vor einigen Jahren unter der Leitung von Gummadis damaligem Student Alan Mislove entwickelt, der heute als Assistant Professor an der Northeastern University in Boston lehrt. „Wir wollten wissen, wie stark man bei der Suche von der sozialen Umgebung profitieren kann“, sagt Mislove.

Wann immer einer der zehn am Projekt beteiligten Forscher eine Webseite aufrief, wurden deren Bezeichnung und Inhalt im institutseigenen Netzwerk gespeichert. Startete einer der Wissenschaftler dann eine Internetsuche, wurde ihm als Ergebnis neben der Google-Liste eine Liste aus den vom Team besuchten Webseiten präsentiert. Der Vorteil: „PeerSpective“, so der Name des Projekts, zeigte auch Einträge in Online-Bibliothekskatalogen an, die auf Google gar nicht verzeichnet sind.

Knapp acht Prozent aller tatsächlich angezeigten Suchergebnisse, so das Resultat der Pilotstudie, konnten ausschließlich mit PeerSpective gefunden werden. So gut schafft es selten jemand, sich neben Google zu behaupten. Mislove ist dies mit Software gelungen, die er innerhalb von nur einer Woche im Alleingang zusammengebastelt hat.

Erste Suchmaschinen, die sich des Prinzips von PeerSpective bedienen, gibt es bereits auch auf dem Markt. So etwa das von der kalifornischen Firma Eurekster angebotene Swicki. Auch in den Forschungsabteilungen von Yahoo, Google und Microsoft existieren Pläne für social search. Durchgesetzt haben sich statt neuartiger Suchmaschinen jedoch bislang eher integrierte Lösungen wie „See what your friends are sharing on facebook“ und „E-mailed – Blogged – Viewed most“ auf den Seiten der New York Times oder der Integration von „Buzz“ in Googles „gmail“.

Wertvolles Wissen über die Nutzer

Aber einerlei wie social search angegangen wird: Damit der Ansatz funktioniert, kommt es zunächst darauf an, für eine bestimmte Suchanfrage erst einmal die passende Community zu finden. Dieses Vorhaben gingen Gummadi und seine Leute vor kurzem an. Sie versuchten, mit einem der üblichen Algorithmen Gruppen innerhalb eines Netzwerks aufzuspüren, um so Menschen mit ähnlichen Interessen herauszufiltern. Erstaunlicherweise konnte aber der Algorithmus einige Gruppen, von denen man wusste, dass sie existierten, nicht detektieren.

Hier musste erst ein wenig Soziologie ins Spiel kommen. Gruppen nämlich sind nicht gleich Gruppen. Einige Gruppen (in der Soziologie „Gemeinschaften“ genannt) werden durch persönliche Verbindungen zusammengehalten: „So wie einige von uns hier am Institut sich jede Woche treffen, um Poker zu spielen – weil wir einfach gern zusammensitzen“, wie Krishna Gummadi lächelnd sagt. Andere Gruppen (die „Gesellschaften“) sind themenbezogen – „so wie Greenpeace“. In themenbezogenen Gruppen kennen die meisten Teilnehmer einander gar nicht. Gummadi: „Auf diesen Unterschied mussten wir erstmal kommen. Der von uns zuerst eingesetzte Algorithmus, der lediglich Teilnehmer herausfilterte, die durch besonders wenige Zwischenschritte miteinander verbunden waren, konnte diese Cluster deshalb gar nicht finden.“

Wenn man Krishna Gummadi zuhört, scheint die Spanne der praktischen Belange, in denen die Ergebnisse der Analyse von Netzwerken in den sozialen Medien zum Tragen kommen könnten, schier unendlich zu sein. Eine der neuesten Arbeiten ist ein nationales Stimmungsbarometer. Alan Mislove hat Twitter-Nachrichten in den USA daraufhin ausgewertet, welche emotionale Befindlichkeit sich in ihnen widerspiegelt. Das Ergebnis ist in einer animierten Landkarte wiedergegeben, in der die einzelnen Bundesstaaten auf einer Farbskala von grün (happy) über gelb (neutral) bis rot (not happy) rangieren – und im Verlauf des Tages die Farbe wechseln.

Für sich genommen, ist das Stimmungsbarometer nur eine Spielerei. Aber es demonstriert, welche Informationen in den sozialen Medien schlummern. Die Betreiber von Twitter wissen buchstäblich, wie die Welt tickt. Sie können beobachten, worüber die Leute reden und was sie mit ihrem Geld machen. Daraus kann man Prognosen ableiten – ob Aktien von Automobilkonzernen sinken oder fallen, oder welchen Erlös ein soeben gestarteter Kinofilm am Ende der ersten Woche einspielen wird. Das ist schon faszinierend. Andererseits: „Es ist wirklich verrückt, welche Macht diese Unternehmen haben“, so Gummadi. Von daher kann man schon verstehen, warum einem 1,75 Milliarden Tweets als Goldgrube erscheinen.

GLOSSAR

Social Media

Online-Plattformen für den Austausch von Meinungen, Nachrichten, und medialen Inhalten wie Fotos innerhalb von sozialen Netzwerken. Zu den in Deutschland verbreiteten Social Media gehören die Business-Community Xing, die auf Studenten ausgerichtete Plattform  StudiVZ, Facebook, der Fotodienst Flickr sowie Twitter.

Word of Mouth Marketing
Verbreitung von Empfehlungen oder Informationen durch die Weitergabe in der persönlichen Kommunikation. Netzwerkstrukturen, in denen ähnlich wie im Liniennetz des internationalen Flugverkehrs einige Hubs die Aufgabe eines Verteilers übernehmen, begünstigen die schnelle Verbreitung von Werbebotschaften. Eine besondere Form des „WoMa“ sind Verfahren des collective filtering, wie sie etwa bei den persönlichen Buch- und Medienempfehlungen bei Amazon zum Einsatz kommen.

Theorie der sozialen Epidemie
Nach dem in neuerer Zeit vor allem durch den amerikanischen Wissenschaftspublizisten Michael Gladwell vertretenen Erklärungsmodell verbreiten sich Meinungen oder Werbebotschaften in ähnlicher Weise wie Krankheitserreger. Eine zentrale Rolle in diesem Modell spielt die Influentials-Theorie. Nach dieser Theorie werden Entwicklung und Ausmaß einer Epidemie vor allem durch die Existenz einer kleinen Gruppe von Menschen gesteuert, die über eine besonders hohe Anzahl sozialer Kontakte verfügen.

Zur Redakteursansicht