Mit „So bewegt sich Deutschland“ hat Telefónica NEXT eine interaktive Karte geschaffen, die deutschlandweite Verkehrsströme sichtbar macht. Die Basis, auf der die Bewegungen berechnet wurden, sind anonymisierte Mobilfunkdaten. Diese Daten fallen im regulären Mobilfunkbetrieb von Telefónica Deutschland an, wenn Handys mit den Mobilfunkzellen kommunizieren.

TEF_Next_Datenschutz_Grafik_RGB.png

 

Sichere Nutzung von Big Data

Um die im Netz anfallenden Mobilfunkdaten datenschutzkonform auszuwerten, hat das Unternehmen mit der so genannten Data Anonymization Platform ein Verfahren entwickelt, das die zugrunde liegenden Daten sicher anonymisiert und schützt. Es wurde in mehrjähriger Zusammenarbeit mit der Bundesbeauftragten für den Datenschutz und die Informationsfreiheit entwickelt und vom TÜV Saarland zertifiziert. So können aus den Daten nützliche Erkenntnisse für Wirtschaft und Gesellschaft entstehen. Die interaktive Karte stellt Reisebewegungen als Tropfen dar, die immer signifikante Gruppen von Reisenden abbilden. Visualisiert werden die Daten dabei als direkte Quelle-Ziel-Beziehungen zwischen deutschen Postleitzahlgebieten, und das als Gesamtverkehr quer über alle Verkehrsmittel hinweg.

Wie das Fraunhofer Institut für Arbeitswirtschaft und Organisation (IAO) in Stuttgart mit der Studie „Potenzialanalyse zur Mobilfunkdatennutzung in der Verkehrsplanung“ bestätigte, sind die anonymisierten Daten gut für die Verkehrsplanung verwendbar. Die Analyse eröffnet zahlreiche Anwendungsmöglichkeiten für die Planung im öffentlichen Personennahverkehr (ÖPNV), im Städtebau oder für neue Formen der Mobilität wie individuellen öffentlichen Verkehr (IÖV).

Quelle-Ziel-Matrix für Deutschland

Auf Basis der anonymisierten Mobilfunkdaten von Telefónica Deutschland wurde eine umfangreiche Quelle-Ziel-Matrix (engl. Origin-Destination-Matrix oder OD-Matrix) für ganz Deutschland erstellt. In dieser OD-Matrix wurden Informationen zu Start und Ziel von Reisen über zwei Kilometer innerhalb Deutschlands im März 2017 erfasst. Die Daten wurden Stunden- und Postleitzahlen-genau ausgewertet. Alle Daten entsprechen extrapolierten Werten und sind damit auf die gesamte deutsche Einwohnerzahl hochgerechnet. Die Mobilfunkinfrastruktur eignet sich vor allem zur Untersuchung von Reisen ab zwei Kilometern Distanz. Kürzere Wegstrecken sind deshalb in diese Untersuchung und Visualisierung nicht eingeflossen.

quelle-ziel-matrix.png

Zusätzlich zu den oben aufgeführten Basiswerten der OD-Matrix wurde noch das Transportmittel ausgewertet, mit dem die größte Reisedistanz zurückgelegt wurde. Dabei erfolgt eine Unterscheidung zwischen luftgebundenem Transport einerseits und den restlichen landgebundenen Transportmitteln (Straßen- und Schienenverkehr) andererseits. Der zugrunde liegende Algorithmus kann z.B. auf Basis von Werten wie unter anderem Reisegeschwindigkeit und –Dauer eine Flugreise identifizieren. 

Zu kleine Personengruppen werden in den Analysen aus Gründen des Datenschutzes nicht berücksichtigt und vom TÜV-geprüften Anonymisierungsverfahren automatisch aus der Analyse ausgenommen. Innerhalb der OD-Matrix werden somit nur Reisen von ausreichend großen Gruppen ausgegeben; die Anonymität der Reisenden ist sichergestellt

Berechnung des Tagesstarts

Die Berechnung des Tagesstarts basiert auf allen Reiseaktivitäten, welche innerhalb eines Postleitzahlgebietes von Montag bis Donnerstag zwischen 5:00 Uhr und 20:00 Uhr starten. Diese Auswahl reflektiert das durchschnittliche Reiseverhalten an Werktagen.

81476.jpg

Analyse des Tagesstarts aus der Postleitzahlen-Abfrage für 81476 München Forstenried-Thalkirchen-Obersendling.
Das Muster ist typisch für ein Wohngebiet.

Um den deutschen Bundesdurchschnitt zu ermitteln, wurde zunächst die Stunde mit der höchsten Reiseaktivität berechnet. Dabei wurde festgestellt, dass diese zwischen 7:00 und 8:00 Uhr morgens liegt. Innerhalb dieser Stundenkategorie wurde eine Normalverteilung angenommen und die Reisefrequenzen minutengenau aufgeteilt. Als letzter Schritt wurde der kumulierte prozentuale Anteil an den definierten Tagesgesamtreisen betrachtet und der Median der 7-Uhr-Kategorie als durchschnittlicher bundesweiter Startzeitpunkt festgelegt. Für Gesamtdeutschland ergibt sich daraus ein Startzeitpunkt von 7:29 Uhr, was einem kumulierten prozentualen Anteil an den definierten Tagesgesamtreisen von 13,845% entspricht.

berechnung-tagesstart.png

Anschließend wurde dieses Vorgehen für jedes einzelne Postleitzahlgebiet wiederholt und der Zeitpunkt identifiziert, an dem die Reisefrequenzen den Grenzwert von 13,845 % der definierten Tagesgesamtreisen erreichen. Daraus lässt sich der Startzeitpunkt jedes Postleitzahlgebietes mit dem bundesweiten Durchschnitt vergleichen.

Für etwa fünf Prozent der Postleitzahlen gibt die Datenvisualisierung keinen Wert aus. Auch dies geschieht aus Gründen des Datenschutzes: Die Data Anonymization Platform von Telefónica NEXT nimmt Gebiete von der Analyse aus, in denen während des betrachteten Zeitraums zwischen 5:00 und 20:00 Uhr während mindestens einer Stunde zu wenige Personen unterwegs waren.

Die interaktive Visualisierung „So bewegt sich Deutschland“ ist online abrufbar.

Jetzt Quelle-Ziel-Matrizen für Ihr Gebiet anfordern!

Wie sind die zugrunde liegenden Daten entstanden?

Im regulären Geschäftsbetrieb eines Mobilfunkkonzerns fallen große Mengen an Daten an, die vor allem dann entstehen, wenn die Mobilfunkgeräte mit den Mobilfunkzellen kommunizieren. Es handelt sich dabei demnach um im Regel-Netzbetrieb anfallende Daten. Diese Daten werden zunächst anonymisiert und stehen danach für Analysezwecke zur Verfügung. Ein Datenpunkt wird im Rahmen der Analyse "Ereignis" genannt und entsteht beispielsweise bei

  • Anrufen (eingehend oder abgehend),
  • Versand / Empfang von SMS / MMS,
  • mobile Internet- / Appnutzung,
  • beim Ein- und Ausschalten des Mobilfunkgeräts, sowie
  • durch periodische passive Events

Täglich entstehen im Telefónica-Mobilfunknetz über 5 Milliarden solcher Ereignisse durch über 48 Millionen mobile Anschlüsse – dies entspricht im Mittel ca. 100 Ereignissen pro Mobilgerät.

Die anonymisierten Daten aus den Mobilfunknetzen werden aggregiert und hochgerechnet und können erst in dieser Form für verkehrsplanerische Zwecke genutzt werden. Detaillierte Informationen zu Anonymisierungsverfahren und Datenschutz sind auf dieser Übersichtsseite zu finden.

 

Legende

In der interaktiven Karte entspricht ein „Tropfen“ der Gesamtheit aller Reisenden auf der dargestellten Quelle-Ziel-Relation während einer Stunde (siehe Beschreibung oberhalb in Abbildung 1). Bei Landreisen stehen die kleinsten Tropfen für meist zweistellige Gruppengrößen auf der Relation. Mittlere Tropfen umfassen einige hundert bis wenige tausend Reisende, während die größten Tropfen 6 000 oder mehr Reisende pro Stunde repräsentieren. Bei den Luftreisen umfassen die größten Tropfen rund 60 Reisen.

Im Filterbereich definieren sich die Entfernungsklassen folgendermaßen:

  • kurz: <= 80 km
  • mittel: > 80 km bis <= 400 km
  • lang: > 400 km