Globale Wanderungstrends im E-Mail-Verkehr entdeckt
Weltweite Mobilität steigt – für Frauen stärker als für Männer
Erstmals gibt es internationale Ein- und Auswanderungsdaten für fast jeden Staat der Welt. Bisherige Erhebungen sind zwischen den Ländern kaum vergleichbar, und Angaben nach Geschlecht und Alter gibt es oft überhaupt nicht. Emilio Zagheni vom Max-Planck-Institut für demografische Forschung (MPIDR) in Rostock erstellte nun einen Datensatz globaler Migrationsströme, indem er Millionen weltweit versandter E-Mails analysierte.
“Wo Schätzungen internationaler Migration existieren, sind sie oft veraltet und stimmen kaum miteinander überein”, sagt MPIDR-Demograf Emilio Zagheni. Offizielle Wanderungszahlen sind problematisch: Migranten tendieren beispielsweise dazu, sich nach einem Umzug amtlich nicht oder erst sehr spät neu anzumelden. Zudem gibt es zwischen den Ländern bisher keine Übereinkunft, wann jemand überhaupt als Migrant definiert wird.
Offizielle Wanderungsdaten sind oft veraltet und unstimmig
“Globale Internetdaten haben solche Nachteile nicht”, sagt Zagheni. “Sie sind für alle einheitlich und schnell verfügbar.” Zusammen mit Ingmar Weber von Yahoo! Research wertete er den weltweiten E-Mail-Verkehr von 43 Millionen Benutzerkonten des Internetdienstleisters Yahoo! aus. Für Nachrichten, die zwischen September 2009 und Juni 2011 geschrieben wurden, ermittelten die Forscher anonymisiert den Wohnort des Absenders – und damit letztlich sein Wanderungsverhalten. Sie nutzten dazu sogenannte IP-Adressen, aus denen sich für jedes Gerät bestimmen lässt, aus welchem Land es eine E-Mails versendet.
Neben Datum und Ursprungsland jeder Mail verwendeten sie auch den Geburtstag und das Geschlecht des Absenders, die dieser in seinem Benutzerkonto angegeben hatte. Eine Person wurde dann als Migrant gezählt, wenn sie den Ort, von dem aus sie die Mehrheit ihrer Mails verschickt, dauerhaft änderte. So konnten Zagheni und Weber gezielt die Wanderungsströme aus fast jedem und in fast jedes Land der Welt messen. Die Forscher arbeiteten ausschließlich mit anonymisierten Daten und konnten weder den Autor einer Nachricht, noch deren Titel oder Inhalt erkennen. Die Forschungsergebnisse wurden jetzt in den “ACM Web Science Conference Proceedings” veröffentlicht.
Sie offenbaren bisher unmögliche Einblicke in das globale Migrationsgeschehen: Für die USA ließ sich erstmals überhaupt die Auswanderung nach Geschlecht und Alter beziffern. Damit wurde sichtbar, dass dort die Mobilität nach der Finanzkrise deutlich zunahm (siehe Grafik): Die Zahl der Menschen, die das Land verließen, stieg. Dasselbe Phänomen zeigte sich bei fast allen entwickelten Staaten, mit wenigen Ausnahmen wie der Schweiz oder Taiwan. Wo die internationale Mobilität zunimmt, kristallisiert sich ein weiterer bisher unbekannter Trend heraus: Die Frauen legen im Verhältnis stärker zu als die Männer.
Was die Daten aus dem Netz so wertvoll macht, ist nicht nur die große Zahl der E-Mails, auf denen sie beruhen. Wichtig ist auch das Modell mathematischer Korrekturen, das die Wissenschaftler aufgestellt haben, um typische Fehler aus der E-Mail-Statistik herauszurechnen. Denn die Gruppe der E-Mail-Nutzer in einem Land ist nicht repräsentativ für die gesamte Bevölkerung. Einige, etwa ältere Einwohner, schreiben weniger Mails und sind darum unterrepräsentiert. Zagheni und Weber berechneten jedoch Korrekturfaktoren, die solche Verzerrungen beheben. Um diese Faktoren zu bestimmen, verglichen sie ihr Modell mit Wanderungsdaten aus Europa, wo die offiziellen Zahlen verhältnismäßig gut sind.
“Was wir herausgefunden haben, ist nur die Spitze des Eisbergs”, sagt Emilio Zagheni. Mit verfeinerten mathematischen Korrekturen und weiteren digitalen Daten wie etwa Twitter-Nachrichten ließen sich auch schwierigere Fragen beantworten. Zum Beispiel ließen die kurz- und langfristigen Bevölkerungsbewegungen in einer Krisenregion wie der der japanischen Fukushima-Reaktoren sichtbar machen.
Demografen, betont Emilio Zagheni, bekommen dank digitaler Daten erstmals realistische Eindrücke über das Wanderungsverhalten von Regionen, über die sie bisher nur spekulieren konnten: “Das größte Potenzial liegt in den sich gerade entwickelnden Ländern. Dort verbreitet sich das Internet viel schneller als es ein verlässliches demografisches Meldewesen geben wird.”