Malte Heckelen

Computational Social Science |

Digital Humanities

A Week on Political Twitter, Teil 3: Das Usernetzwerk zu von der Leyen

Aug. 13, 2019, 11:29 a.m.

In meiner Untersuchung einer ganz normalen Twitterwoche schaue ich mir nun das User-Netzwerk zum Thema Ursula von der Leyen genauer an.

(English version soon)

In dieser Blogserie untersuche ich eine relativ normale Woche auf dem politischen Twitter, so tiefgehend, wie ich es neben der Arbeit kann. Die Themen sind Angela Merkel und Ursula von der Leyen, weil sie viele politische Themen umfassen, aber einen etwas anderen Fokus haben: Ursula von der Leyen ist jüngst ein mehr europäisches Thema geworden und Angela Merkel umfasst als Kanzlerin sehr viele makropolitische Themen in Deutschland.

Den ersten Überblick habe ich im im ersten Post gegeben. Dabei fiel auf, dass insbesondere die stark rechtskonservative Sphäre anders zusammengesetzt ist. Im Gegensatz zum von der Leyen - Thema gibt es bei Merkel eine Dominanz von Influencern, statt den offizielleren Accounts von Politikern der AfD. Genau das habe ich im letzten Post etwas näher unter die Lupe genommen.

In den nächten Wochen wird es um die Inhalte gehen, aber heute schaue ich mir das Usernetzwerk an, dass in den Tagen vom 7. Juli 2019 bis zum 17. Juli 2019 das Thema Ursula von der Leyen und dessen Peripherie diskutierte. Wenn dir solche Untersuchungen gefallen, kannst du mich gern unter Help Me Out unterstützen (Twitter Access Token spenden).

Wer und wie sind die User im Netzwerk zu vdL?

Das Usernetzwerk zur Diskussion um Ursula von der Leyen vom 08. - 18. Juli (klicken für zoombare PDF)

Dieses Netzwerk habe ich aus den Retweets, Mentions, Quotes und Replies generiert. Namen der Accounts werden nur angezeigt, wenn es sich um verifizierte Accounts und / oder Accounts mit sehr vielen Replies, Retweets, Mentions und Quotes handelt. Die Größe der Account-Knoten drückt genau diese Häufigkeiten aus - wie oft interagieren User mit dem jeweiligen Account?

Die Farben stehen dafür, dass User der gleichen Farbe in irgendeiner Weise eher miteinander interagieren, als mit anderen Usern. Das ist keine objektive Einteilung, sondern nur eine sehr grobe Annäherung basierend auf einem Algorithmus. Genauso ist es mit der Position der User in diesem Netzwerk: Ein Algorithmus hat basierend auf Kriterien und den Verbindungen im Netzwerk eine optimale visuelle Anordnung errechnet. Sowohl Farben und Anordnung sind nicht willkürlich, aber trotzdem bitte nicht zu viel hineininterpretieren.

Um trotzdem grobe Zusammenfassungen geben zu können, nehme ich die farbigen Einteilungen als Kategorien und schaue mir mal genauer an, wie sich die Nutzer in diesen Clustern verhalten. Ich gebe den Clustern Namen, damit sie besser auseinanderzuhalten sind. Diese Namen sind aber keine absoluten Beschreibungen, sondern primär Gedächtnisanker. Meistens habe ich die Namen basierend auf den Usern im Cluster gewählt, um das Cluster nicht im Voraus schon auf Themen festzulegen. Manchmal ließ sich letzteres nicht vermeiden. Daher auch bitte die Namen kritisch und nur als mentale Hilfe betrachten.

Die Kategorien

Die Cluster mit Namen sind nur eine Auswahl: für Cluster mit weniger als 400 Usern oder einem sehr geringen Tweet-Output erschien mir eine Untersuchung nicht sehr sinnvoll. Die Cutoff-Werte sind natürlich rein pragmatisch gewählt worden.

Basierend auf den Namen kann man sehr gut Vergleiche anstellen, was den Tweet-Output angeht. Genau das werden wir auch tun, aber erstmal stelle ich die Namen selbst vor:

Label Beschreibung
parteien_politiker Parteien, Politiker (CDU, SPD, Grüne), Accounts von EU-Organen, und Medien wie ZDF, tagesspiegel
satire Martin Sonneborn, Nico Semsrott, heuteshow, aber auch Grünen-Politiker und Klimaaktivisten
afd_nah AfD-Politiker, AfD-Account, Sympathisanten
presse spiegelonline, zeitonline, FAZ, u.a., aber auch tagessschau
woelken_piraten_ua Tiemo Wölken, Piraten- und Grünenpolitiker, Accounts zu Datenschutz, Artikel 13
linke SWagenknecht, GregorGysi, dieLinke u.a.
bild Bild, BILDblog, diverse Journalisten u.a.

Wieviel tweeten die Cluster?

In dieser Tabelle sieht man die Größe des Outputs, den diese Cluster in der Untersuchungszeit zum Thema Merkel hatten. Für jede Stunde wurde die Anzahl Tweets erhoben. So bedeutet der Median von 21 für "parteien_politiker", dass in 50% aller Stunden im Beobachtungszeitraum mindestens 21 Tweets abgesetzt wurden. Im Mittel sind es mit 84 Tweets sogar weitaus mehr. Hier fällt gleich auf, dass die generellen Parteien- und Politikeraccounts inklusive Follower sowie die satirisch-politischen Accounts inklusive Follower sehr viel mehr Tweets produzieren, als das Cluster "afd_nah".

Beim Merkelnetzwerk war es außerdem so, dass das Cluster "afd_nah" ein anderes Verhältnis von "Anzahl User" zu "Anzahl Tweets" hatte: Es wurden wesentlich mehr Tweets pro User produziert, als bei den anderen Clustern - ein User mehr bedeutete für dieses Cluster mehr Tweets, als für andere Cluster. Hier nicht so: Die Verhältnisse sind über die Cluster hinweg mehr oder weniger gleich.

Label Anzahl User Anzahl Tweets Median Mittelwert
parteien_politiker 10342 29977 21 83.969188
satire 11750 27597 14 77.302521
afd_nah 3400 9656 6 27.047619
presse 2615 6577 5 18.422969
woelken_piraten_ua 1507 4062 2 11.378151
linke 1022 2205 1 6.176471
bild 876 1844 1 5.165266

Wer den Post zum Merkel-Usernetzerk gelesen hat, blickt natürlich als nächstes auf den Median. Während es im Merkel-Netzwerk bis auf beim AfD-nahen Cluster ein Median von 0 war, liegt er hier durchgängig bei größer gleich 1.

Man könnte das mit der Einteilung durch den Cluster-Algorithmus erklären: Mit denselben Einstellungen wie beim Merkel-Netzwerk ergeben sich hier weitaus größere Cluster, die dann natürlich auch aktiver sind. Dafür spricht, dass sich das Merkel- und vdL-Netzwerk auf einer Nutzerebene nicht so sehr unterscheiden. Die Statistik oben zeigt ja nur wieviel die Cluster insgesamt pro Stunde tweeten, aber in beiden Netzwerken tweeten die User pro Stunde sehr wenig (Median: 0).

Andererseits sind nur die Cluster-Größen nicht so unterschiedlich, der Output aber dennoch größer. Im ersten Post habe ich schon festgestellt, das von der Leyen eine andere Art Thema ist, als Merkel. Ursula von der Leyen ist mehr "ereignishaft", weshalb sie kurzfristig sehr intensiv diskutiert wird und Merkel ist eher ein "Dauerbrenner" mit schwacher, aber anhaltenderer Aktivität.

Um dem näherzukommen, wollen wir das noch weiter aufschlüsseln.

Aktivitäten der Cluster über die Zeit

Hier sieht man die Tweets pro Stunde für die verschiedenen benamten Cluster. Das scheinbar niedrige Grundniveau täuscht: Die Spikes am 16. Juli drücken drücken die Skala auf der Y-Achse herunter. Tatsächlich ist das Grundniveau durchaus höher als beim Merkel-Netzwerk, gerade für die Cluster "parteien_politiker" und "satire". Die Spikes sind hier auch wesentlich höher, bei "Merkel" waren 500 Tweets pro Stunde das höchste der Gefühle. Das spiegelt die Analyse aus dem ersten Post wieder, wo wir sahen, dass das Grundlevel an Tweets bei "Merkel" konstanter, aber niedriger ist, obwohl beide Oberthemen eine vergleichbare Anzahl Nutzer und Tweets insgesamt haben.

Tweets pro Stunde für die verschiedenen Cluster

Das Cluster "afd_nah ist am 16. Juli auch recht aktiv, aber es ist zum Beispiel nicht aktiver, als das "presse"-Cluster. Wie gesagt setzt sich "afd_nah" hier anders zusammen, als im Merkelnetzwerk. Während es dort vor allem rechtskonservative Influencer sind, sind es hier die offizielleren Accounts von AfD-Politikern. Grundsätzlich legt das nahe, dass das eher europäische, wenig auf die allgemeine Lebenswelt münzbare Thema "von der Leyen" und "Kommissionspräsidentschaft" schwer wirksam auf die grundsätzlichen Themen der AfD und der rechtskonservativen Sphäre münzen lassen.

Aber das wird eine Analyse der Inhalte genauer zeigen. Im Mittel produzieren die User der verschiedenen Cluster pro Stunde ähnliche Mengen, was interessant ist. Im Netzwerk zu Merkel gab es hier noch deutlicher sichtbare Unterschiede.

Mittelwert Tweets pro Stunde für die verschiedenen Cluster

Die User des Clusters um "bild" sowie "afd_nah" sind am 17. plötzlich weitaus aktiver, als die anderen Cluster. Das mag ein verspätetes Nachkommentieren sein, welche Form das auch annehmen mag. Wir werden es in den nächsten beiden Wochen sehen.

Wie stehen die Cluster zueinander?

Unten gibt es wieder ein Netzwerk. Diesmal wurden die Interaktionen pro Cluster zusammengefasst: Pfeile zwischen den Clustern sind die Interaktionen zwischen Usern dieser Cluster. Die Dicke der Pfeile ist ein Zeichen für die Intensität der Beziehung: es drückt aus, wieviele Prozent der an die benannten Cluster ausgehenden Beziehungen (Mentions, RTs, u.a.) auf diesen Cluster verwendet werden. Je dicker der Pfeil also ist, desto häufiger interagieren diese Cluster. Die Größe der Pfeilspitzen ebenso: So zitiert das Cluster "afd_nah" sehr viel mehr vom Cluster "satire" als andersherum.

Die Größe der Cluster-Knoten drückt aus, wie viel sie mit sich selbst reden, also der Anteil der Verbindungen aus dem Usernetzwerk, die innerhalb des eigenen Clusters enden.

Cluster-Netzwerk (Klicken für zoombare PDF)

Wie beim Merkel-Netzwerk reden die größeren Cluster ähnlich viel mit sich selbst. Das Cluster "woelken_piraten_ua" hat hier den geringsten Anteil und bezieht sich größtenteils auf "parteien_politiker" und "satire". Das mag daran liegen, dass es sich bei "woelken_piraten_ua" um einen Zusammenschluss von Accounts handelt, die sich im europäischen Kontext mit Themen wie Datenschutz, Privatsphäre und Urheberrecht befassen - der Bezug nach außen ist dort wichtig und gerade die starken Bezüge zu "satire" ergeben hier Sinn. Dort haben wir ebenfalls viele Accounts, die sich mit eher linksorientierter Kritik und eben auch Netzpolitik befassen.

Interessant ist die Beziehung zwischen "linke", "afd_nah" und "satire". Sowohl "afd_nah" und "linke" beziehen sich häufig auf "satire", aber andersherum ist das nicht der Fall (der zurückgehende Pfeil ist so klein, dass er nicht sichtbar ist). Die wechselseitige Beziehung zwischen "linke" und "afd_nah" ist allerdings relativ ausgeglichen.

Insgesamt ist natürlich das Cluster "parteien_politker" am wichtigsten - hier stecken die meisten Accounts, über politische Kontexte hinweg. Viele der Beziehungen zu diesem Cluster sind einseitig, daher die meiste "Action" passiert innerhalb dieses Clusters selbst und ein Bezug nach außen ist kaum nötig. Ausnahme ist das Cluster "satire", zu dem es eine starke wechselseitige Beziehung gibt.

Während all dies einleuchtend ist, sollte man vorsichtig sein und nicht von diesen suggestiven Zusammenhängen auf politische Allianzen schließen. Der Algorithmus hat so eingeteilt, dass diejenigen, die mehr miteinander als mit anderen reden, in einer Kategorie landen. Es kann sich hier teilweise um Artefakte handeln.

Dennoch zeigt sich hier ein anderes, etwas weniger polarisiertes Bild als beim Netzwerk zum Oberthema "Merkel". Wirklich von Polarisierung sprechen kann man allerdings erst, wenn man auch die diskutierten Inhalte kennt. Genau das werden wir uns in den nächsten Posts anschauen: Was wird mit welchen Quellen in welchen Clustern diskutiert? Für Anregungen und Kritik könnt ihr mir unter @Boomcrashkapow oder malteheckelen@protonmail.com schreiben. Wenn dir der Post gefallen hat und du mich gern unterstützen möchtest, kannst du das unter Help Me Out tun.