Malte Heckelen

Computational Social Science |

Digital Humanities

A Week on Political Twitter, Teil 1: Überblick

July 23, 2019, 12:11 p.m.

Als spaßiges, aber doch relevantes Nebenprojekt zu meiner Forschung starte ich eine Blogserie zu einer Woche politischer Twitterdiskussion. Die vieles umfassenden, ähnlichen aber dennoch unterschiedlichen Themen: Ursula von der Leyen und Angela Merkel.

(English version)

In meiner Forschung interessieren mich Meinungsdynamiken und Überzeugung (Persuasion), insbesondere wie die Gesetzmäßigkeiten dieser je nach sozialem Kontext variieren können. Dabei schaue ich mir Daten von Social Media an (Twitter). Die Datenbeschaffung und -aufbereitung für solche Fragestellung ist schwierig und langwierig (obwohl du mir dabei helfen kannst). Es dauert, bis man da mal substanzielle Ergebnisse sieht. Deswegen habe ich mir gedacht, mit all dem Analysecode, den ich so schreibe, daneben ein wenig datenjournalistisch aktiv zu werden und diese Serie über politische Twitter-Diskussionen zu starten.

Arno Mikkor, CC BY 2.0 license

CC-BY-4.0: © European Union 2019 – Source: EP

Ich schaue mir die Diskussionen zu und in Assoziation mit zwei Politikerinnen an: Ursula von der Leyen und Angela Merkel. Warum genau diese beiden? Sie sind sehr sichtbare Politikerinnen, die teils kontrovers diskutiert werden, viele allgemein gesellschaftlich relevante Themen werden im selben Kontext diskutiert und, der wohl wichtigste Punkt, es gab ein großes Tweet-Volumen für die beiden als ich die Datensammlung gestartet habe. Angela Merkel etwa hatte sich jüngst positiv zu Fridays for Future geäußert, einen Schwächeanfall und Geburtstag (was mir erst beim Blick in die Daten auffiel), Ursula von der Leyen wurde bekanntermaßen zur Präsidentin der Europäischen Kommission gewählt.

Während größere politische Events wie die Wahlen zum Europäischen Parlament natürlich sehr viel schöner die extremeren Tendenzen zeigen, bringt eine Analyse des eher alltäglichen Twitterbetriebs die vielleicht nicht so sichtbaren Probleme hervor, die hinter den Kulissen die größeren Shitstorms vorbereiten.

Zuerst gebe ich einen einfachen, sehr groben Überblick über die beiden Twitterthemen, für die ich zwischen dem 07. Juli 2019 bis zum 17. Jul (19. Juli im Fall von Merkel) Daten gesammelt habe. In diesem Post findet ihr die allgemeine Aktivität, Hashtag-Netzwerke und die User-Netzwerke. Da es aber nicht so viel bringt, alles auf einmal zu sehen, schaue ich mir in Folgeposts die Verteilung der Themen und Quellen über die Communities, die Zeit und beides zusammen genauer an. Wie man sich denken kann, sollte man zusätzlich zum "Was" auch noch das "Wann und wer" kennen. An das "Wieso" kommen wir hier denke ich nicht heran. Über den Rest werde ich aber so sehr ins Detail gehen, wie ich kann (und es mein eigentlicher Job erlaubt).

In die Follower/Following-Beziehungen kann ich leider nicht sehr einsteigen, da die Datensammlung wegen Einschränkungen seitens Twitter dort sehr schweirig werden kann. Wenn du mir helfen willst, kannst du aber ein Twitter Access Token spenden (das ist nicht der Login). Wie ich die Daten in die richtige Form gebracht und visualisiert habe, werde ich dann in Kürze auf meinem GitHub dokumentieren.

Aber jetzt lasst uns einen Blick in die Daten werfen!

So much noise: Wie viele Tweets pro Stunde?

Wir starten mit der Diskussion um Ursula von der Leyen. Für den Zeitraum vom 7. bis zum 17. Juli gab es 89 597 Tweets von 34 848 Nutzern. Die beiden wichtigen Events am 10. / 11. und dem 16., 17. und 18. kann man gleich erkennen.

Tweets pro Stunde für Ursula von der Leyen

Der zweite Spike kommt natürlich direkt nach der Bekanntgabe ihres Wahlsiegs. Der erste Spike gehört zu ihrer Nominierung.

Natürlich passiert die meiste Action in den Antworten, nicht unbedingt den Originaltweets. Das sieht man hier auch, die Menge der Antworten steigt rapide an, als sie die kontrovers diskutierte Position ergattert. Beim ersten Spike hat man verhältnismäßig mehr Retweets, wohl, weil die Verbreitung der Nachrichten hier wichtiger waren.

Aber diese Informationen sind nicht sicher: Wie gesagt gibt es insbesondere bei Follower/Followings und Antworten Beschaffungsprobleme, daher hier noch einmal ein nicht ganz subtiler Nudge in Richtung meiner Token-Spendeseite.

Jetzt aber zur Diskussion um Angela Merkel. Die allgemeine Tweetmenge ist vergleichbar: Wir haben 94 388 Tweets von 33 150 Usern. Die Dynamiken aber sind sehr verschieden.

Tweets pro Stunde für die Diskussion zu Angela Merkel

Über die Zeit ist das Volumen geringer (schaut auf die y-Achse), aber es ist schon konstant. Das kann man sich gut erklären: Angela Merkel ist die wohl sichtbarste Politkerin Deutschlands. Daher gibt es trotz bestimmter signifikanter Events ein Grundniveau an Tweets. Die Spikes hier haben ebenfalls mit Ursula von der Leyens Nominierung und Wahl zu tun, neben Merkels Geburtstag.

Wie gesagt ist das Volumen vergleichbar, aber die Dynamiken unterscheiden sich. Wie man weiter unten sehen kann, sind andere User in diesen Diskussionen wichtig, obwohl die Gewichtung der Themen im Grunde ähnlich sind.

Verschiedene Arten von Themen mit unterschiedlichen Aktivitätsmustern werden schon in der Wissenschaft diskutiert. Angela Merkel ist ein eher konstantes Thema mit relativ ordentlichem Grundniveau an Aktivität, während Ursula von der Leyen sich hier mehr wie ein Event verhält - kurze Spikes mit schnell abflachender Aktivität.

Aber was für Aktivität ist das überhaupt?

Worum geht es hier eigentlich?

Was in der Visualisierung aussieht wie der Todesstern sind die Hashtags in der Diskussion zu von der Leyen. Es sieht noch ziemlich durcheinander aus und es war schwierig, das Netzwerk in eine lesbare Form zu bringen. Bitte nicht überinterpretieren: Die Nähe der Hashtagknoten zueinander entspricht nur bedingt der Häufigkeit ihres gemeinsamen Vorkommens. Die Farbe drückt ebenfalls nur aus, dass sie tendenziell häufiger gemeinsam vorkommen. Das ist kein wissenschaftliches Fakt, sondern eher eine visuelle Hilfe.

Hashtag-Netzwerk für die Diskussion zu Ursula von der Leyen (für eine größere, zoombare Variante klicken)

Obwohl es eher eine bunte Mischung ist, kann man einige zusammenhängende Themen erkennen. Die hellblaue Farbe befasst sich mit von der Leyen als Personalie, ihrer Rolle als Verteidiungsministerin und der CDU selbst (Annegret Kramp-Karrenbauer, Jens Spahn und andere finden sich hier).

Die hellgrünen und hellpinken Farben sind eher mit dem politischen Prozess der EU gewidmet ("spitzenkandidat", "wahl", "bruessel", etc.), während die wichtigsten, großen Hashtagknoten sich direkt mit der EU und von der Leyens neuer Rolle befassen. Außerdem gibt es einen großen Knoten "demokratie", der mit sehr vielen anderen Hashtags verbunden ist - der Wahlprozess für den Kommissionspräsidenten wird oft als undemokratisch kritisiert.

Links vom großen "vonderleyen"-Knoten finden wir viele eher kritische Hashtags: flintenuschi, berateraffäre, inkompetenz, gorchfock, zensursula. Das spiegelt natürlich jüngere Skandale und Themen wieder, wobei insbesondere für "zensursula" Artikel 13 und die Piraten wichtig sind./p>

Rechts oben sehen wir auch, wie es aussieht, ein paar Verschwörungstheorien und Rassismus. Die Hashtags "neger", "juden" in Verbindung mit "genealogie" und "puppets" erscheinen mir doch einem gewissen Spektrum zuordenbar. Denselben Wust findet man genauso auch in Merkels Hashtag-Netzwerk, was dafür spricht, dass es auf einzelne Nutzer zurückführbar ist.

Es gibt mehr zu sehen (schaut gern selbst) und darauf werde ich in einem eigenen Post noch genauer eingehen.

Das Merkel-Hashtagnetzwerk ist visuell etwas klarer strukturiert:

Hashtagnetzwerk für die Diskussion zu Angela Merkel (für eine größere, zoombare Variante klicken)

Hier sehen wir die tagesaktuellen Ereignisse: Merkel hat Greta Thunberg öffentlich für ihren Aktivismus gelobt, was man direkt oben sehen kann (fridaysforfuture, co2steuer und andere) und auch ganz rechts in der Mitte (greta). Ihr öffentliches Zittern ist auch ein Thema (zitteranfall, merkelzittern) und wenn man die Augen zusammenkneift sieht man auch, dass Geburtstagsglückwünsche marginal wichtig sind.

Außerdem sieht man das Thema Seenotrettung relativ klar.

Und hier sehen wir auch wieder den Haufen, den wir schon bei Ursula von der Leyen entdeckt haben. Wie dieses bunte Sammelsurium (neger, juden, trump, lifeline) zustandegekommen ist, wird sich in den Folgeposts zeigen.

Insbesondere interessiert mich, welche Nutzer-Cluster bei welchen Themen (wann) aktiv sind. Aber was für User sind das überhaupt?

Wer spricht (einseitig) mit wem?

Die User-Netzwerke habe ich aus den Retweets, Mentions und Antworten zusammengebaut. Die tatsächlichen Follower / Following - Beziehungen zu bekommen ist etwas schwieriger (siehe Help Me Out). Aber die RTs, Mentions und Antworten spiegeln die eigentliche Aktivität ohnehin besser wieder. Die Größe der User-Knoten spiegelt die Anzahl ihrer eingehenden Tweets wieder, also wie oft sie retweetet, erwähnt oder beantwortet wurden. Farben bedeuten wieder, dass die User sich tendenziell öfter retweeten, beantworten oder mentionen. Die Namen von Nutzern, die kaum retweeted usw. wurden, habe ich unterdrückt: Sie sind nicht im Auge der Öffentlichkeit und das soll sich nicht ändern.

Usernetzwerk für die Diskussion zu Ursula von der Leyen (für eine größere, zoombare PDF-Version klicken)

Die Beziehungsn sind hier relativ gut erkennbar: Links sehen wir eine satirische (aber natürlich dennoch oder gerade deshalb politische) Front um Martin Sonneborn, Nico Semsrott, DiePartei und die Heute Show. Das gerade Nico Semsrott so prominent und in einem anderen Cluster zu sein scheint mag daran liegen, dass er selbst Aspirationen zum Kommissionspräsidenten hatte.

In der Mitte findet man Politiker der Linken (Sarah Wagenknecht), SPD (Sven Giegold) und den Grünen (Tiemo Wölken, Ska Keller).

Rechts oben sieht man Accounts von Politkern der AfD in rot.

Das Usernetzwerk für die Diskussion zu Angela Merkel sieht etwas anders aus:

Usernetzwerk für die Diskussion zu Angela Merkel (für eine größere, zoombare PDF-Version klicken)

Die politischen Satiriker sind hier etwas weniger Prominent, zumindest nicht dieselben (z.B. Wurfschuh). Möglicherweise liegt das daran, dass sie momentan mehr auf Europa konzentriert sind und Merkel als Dauerthema nicht so wichtig ist (obwohl ergiebig). Noch viel interessanter ist aber die rechte Blase oben links.

Statt der offiziellen Politker-Accounts, die man in der eher eurozentrischen Diskussion um von der Leyen sieht, findet man hier eher normale User, die sehr aktiv sind oder zumindest stark zitiert werden. Außerdem sieht man scheinbar, dass Hans-Georg Maaßen die Vorzüge seines Twitter-Accounts entdeckt hat.

Interessanterweise sieht man auch einige Aktivität aus der österreichischen Twittersphäre. Sebastian Kurz ist hier vielzitiert, beziehungsweise -beantwortet, aber einige Journalisten und Aktivisten kann man im orangen Blob auch finden.

Wie diese Nutzergruppen mit verschiedenen Themen umgehen, werde ich in den nächsten Posts (versuchen zu) zeigen. Es scheint zumindest ein unterschiedliches Publikum für dieselben Themen zu geben, obwohl die Themen ähnlich sind (bei vdL offensichtlich mehr eurozentrisch orientiert).

Nächstes Mal schaue ich mir die Unterschiede zwischen den Retweet, Antwort und Mention-Netzwerken an. Für Anregungen und Kritik könnt ihr mir unter @Boomcrashkapow oder malteheckelen@protonmail.com schreiben.