Über das Projekt

Wer steckt hinter dem Projekt?

Der Tagesspiegel-Politiker-Check ist aus dem gemeinsamen Forschungsprojekt »Check Your Government« der Gruppe Wettbewerbs- und Technologieanalyse am  Fraunhofer IMW, Leipzig  und der Tagesspiegel-Redaktion entstanden. Das Forschungsprojekt wurde im Rahmen des Programms »Wissenschaft und Datenjournalimus« von der  VolkswagenStiftung gefördert.

Team

Tagesspiegel
INGRID MÜLLER
Journalistische Supervision, Controlling
HENDRIK LEHMANN
Projekt- und Recherchekoordination, Konzeption, Text
NIKOLAS ZöLLER
Entwicklung Webseite, Datenanalyse
DR. JOST MüLLER-NEUHOF
Rechtliche Rechercheleitung
KRISTOF GEREGA
Datenbereinigung, Recherche
FRANZISKA VESELY
Datenbereinigung, Recherche
HELENA WITTLICH
Recherche, Text
GRACEFUL HASTE
Designberatung
Fraunhofer IMW
JPROF. DR. LUTZ MAICHER
Projektleitung
MICHAEL PRILOP
Technische Leitung
MAX KIESLING
Entwicklung
FABIAN BARTSCH
Recherche

Warum machen wir das?

Während immer mehr Geschäftsmodelle auf dem Sammeln und der Analyse personenbezogener Daten beruhen, wird die Arbeit des Bundestags bisher kaum digital dokumentiert. Daten über die konkrete Arbeit von Abgeordneten sind – wenn überhaupt verfügbar – meist an verschiedenen Orten verstreut, mangelhaft aufbereitet und lückenhaft. Der Tagesspiegel Politiker-Check ist ein erster Versuch, das zu ändern. Wir sammeln die verschiedenen Datenquellen über Abgeordnete an einem Ort und versuchen sie so aufzubereiten, dass auch normale Bürger sich ein Bild machen können – ohne sich erst in den Papierdschungel des parlamentarischen Archivs einarbeiten zu müssen.
Im Rahmen des Projekts versuchen wir im Besonderen, die Einflussnahme von Lobbyisten und Experten auf Entscheidungsprozesse im Bundestag und den Ministerien genauer auszuloten. Dafür ordnen wir die vielen tausend Interessenvertreter, die den Bundestag besuchen, den Ausschüssen und ihren Abgeordneten zu. So entsteht ein erster Eindruck davon, mit welchen Interessen und Personen Abgeordnete in ihrem Arbeitsalltag zu tun haben. Wer tiefer in diesen Kosmos einsteigen möchte, kann das überall über die verlinkten Originaldokumente tun.
Es geht aber genauso um ganz einfache Fragen, deren Antworten dennoch oft schwer herauszufinden sind: Zu welchen Themen hat eine Abgeordnete oder ein Abgeordneter in den vergangenen Monaten besonders oft Anträge gestellt, Antworten gegeben, Reden gehalten und Vorschläge gemacht? Korrespondiert das mit den Themen, die in den Ausschüssen bearbeitet wurden, in denen sie oder er volles Mitglied ist? Oder setzt die Person ganz andere Schwerpunkte?
Weil wir uns bewusst sind, dass Politik vor allem durch Medien vermittelt wird, stellen wir Analysen daneben. Welche Aufmerksamkeit genießen die Abgeordneten im Lauf der Zeit in den klassischen Medien und den Sozialen Netzwerken? Wer steht im Rampenlicht? Und wer arbeitet abseits der öffentlichen Aufmerksamkeit vielleicht an besonders brisanten Themen?

Für wen machen wir das?

Die Webseite richtet sich erst einmal an alle, die sich für Politik interessieren. Wir hoffen aber auch, dass sie dem Bundestag einen Anstoß gibt, künftig mehr strukturierte Daten über seine Arbeit zur Verfügung zu stellen. Dann können wir, ebenso wie andere Medien, Forscher und Wähler, genauer nachvollziehen, womit sich unsere gewählten Vertreter gerade beschäftigen.
Wissen wächst meist besser, wenn viele denken. Weil wir noch längst nicht alle Daten ausgewertet haben, die wir inzwischen gesammelt haben und weil es viele weitere Möglichkeiten gibt, Erkenntnisse aus unseren Datensätzen zu gewinnen, werden wir sukzessive Datensätze als
Open Data  veröffentlichen. Wir können anderen Forschungsprojekten außerdem auf Anfrage Schnittstellen zur Verfügung stellen, um die Auswertungen aus dem zugrunde liegenden System CYGAR nutzbar zu machen.

Welche Datenquellen werden genutzt und wie?

Die Software hinter dem POLITIKER-CHECK ist CYGAR, eine Dateninfrastruktur, die auf dem Big Data Center des Fraunhofer IMW, Leipzig läuft und die im Rahmen des gemeinsamen Forschungsprojekts entwickelt wurde. Dort werden verschiedene öffentlich verfügbare Daten mit händisch recherchierten verknüpft, sodass Beziehungen zwischen den verschiedenen Datenpunkten errechnet werden können. Einfach gesagt: Damit die verschiedenen Datenquellen einem Politiker zugeordnet werden können. Folgende sind die wichtigsten Quellen, die wir nutzen:
»Dokumentations- und Informationssystem für Parlamentarische Vorgänge (DIP)«
Alle Dokumente der Arbeit des Bundestages und seiner Ausschüsse werden im so genannten  »Dokumentations- und Informationssystem für Parlamentarische Vorgänge (DIP)«  des Bundestags archiviert. So können Mitarbeiter oder andere Interessierte einfacher danach suchen, welche Gesetze und Themen bereits an welcher Stelle bearbeitet wurden. Es basiert auf dem Thesaurus »PARTHES«. Dieses Archivordnungssystem benötigt Schlagworte, um Dokumente zu ordnen. Also werden für jedes einzelne Dokument, das im parlamentarischen Dokumentationssystem gespeichert wird, Schlagwörter vergeben. Z.B. hätte eine Anfrage zum Stand der aktuellen Maßnahmen gegen Kinderarmut die Schlagwörter »Kinder«, »Armut«, »Sozialhilfe«, usw.
Wir nutzen die mehr als 13.000 Dokumente und ihre Schlagwörter, um auszurechnen, mit welchen Themen sich die einzelnen Ausschüsse pro Monat am häufigsten beschäftigt haben. Dabei werden die Schlagwörter aller Dokumente, die einem Ausschuss zugeordnet sind, zusammengezählt und die häufigsten ermittelt. So fällt dann zum Beispiel auf, dass viele der Ausschusssitzungen sich mit der Arbeit der Bundesregierung oder der Umsetzung von EU-Recht in nationales Recht beschäftigen. Für einzelne Politiker funktioniert die Analyse ähnlich. Hier schaut das System jedoch nach allen Dokumenten, die einer Person zugeordnet sind. Weil Politiker nicht jeden Monat Anfragen stellen oder Gesetzesvorlagen einreichen, haben sie auch nicht immer in jedem Monat bearbeitete Themen in unserer Grafik.
Abgeordnetenbiografien auf Bundestag.de
Auf der  Webseite des Deutschen Bundestags  gibt es für jeden Abgeordneten eine Unterseite. Dort stehen für jeden Abgeordneten eine selbst verfasste Biografie, sowie Angaben darüber, in welchem Ausschuss die Person Mitglied ist und welchen Nebentätigkeiten sie neben dem Mandat nachgeht. Diese Angaben übernehmen wir in genau dieser Form, so werden auch Aktualisierungen automatisch übernommen.
Webseiten von Bundestagsabgeordneten
Leider veröffentlicht der Deutsche Bundestag nicht von allen Abgeordneten deren persönliche Webseite, auf denen sie oft über ihre Tätigkeiten berichten. Auch Facebook- und Twitter-Profile sind nur bei wenigen verlinkt. Wir haben deshalb alle fehlenden persönlichen Webseiten von Abgeordneten selbst nachrecherchiert. Von den Abgeordneten-Webseiten und Kreisverbänden haben wir außerdem die Adressen aller angegebenen Wahlkreisbüros von Politikern gesammelt, um auf einen Blick darstellen zu können, wo sich die Wahlkreisbüros befinden. Denn jeder sollte unkompliziert erfahren können, wo er persönlich seinen Abgeordneten und dessen Mitarbeiter treffen oder anschreiben kann.
Google Maps Geocoding API
Eine Adresse, die ein Mensch lesen kann, ist für eine Maschine noch lange nicht lesbar. Deshalb werden alle Adressen von Wahlkreisbüros an eine Schnittstelle von Google geschickt, die mit den entsprechenden Geokoordinaten der Büros antwortet. Diese nutzen wir, um die Büros auf einer Karte darstellen zu können und um beispielsweise Analysen nach Landkreisen oder Bundesländern durchzuführen.
Fotos von Wikipedia
Leider gibt es keine zentrale Webseite oder Schnittstelle, die frei nutzbare Fotos aller Bundestagsabgeordneten zur Verfügung stellt. Auch die Bundestagsverwaltung selbst kann nach eigener Aussage die Fotos der Abgeordneten nicht zur Nutzung zur Verfügung stellen, da die Urheberrechte daran bei den Politikern selbst oder deren Fotografen liegen, wenn der Bundestag sie nicht selbst aufgenommen hat. Die Fraktionen haben leider auf unsere Bitte, uns Fotos von all ihren Abgeordneten zu schicken, bis heute nicht reagiert. Wir nutzen deshalb bei den meisten Abgeordneten frei nutzbare Bilder von Wikimedia. Wenn es auch dort keine gab, wurden sie händisch von den Presseseiten der Parteien oder den Abgeordneten-Webseiten übernommen, wo dies explizit für die Presse erlaubt ist. Deshalb sind die Bilder vieler Abgeordneter leider nur in sehr schlechter Auflösung vorhanden. Das finden wir schade. Wir freuen wir uns, wenn Abgeordnete oder die Fraktionen uns noch frei nutzbare Bilder mit der Angabe der entsprechenden Lizenz an  digital@tagesspiegel.de schicken. Dann wechseln wir sie aus.
Tagesordnungen der Bundestagsausschüsse
Um herauszufinden, welche Experten und Verbände besonders häufig zu Ausschussitzungen im Bundestag eingeladen werden, haben wir alle 3995 Tagesordnungen, die im Vorfeld von Ausschussitzungen veröffentlich wurden, nach Namen und Verbänden analysiert. So wollen wir einen Eindruck davon vermitteln, vom wem die Abgeordneten sich beraten lassen. Wichtig zu wissen ist dabei, dass die Einladungen der Experten nach Parteiproporz im Ausschuss geschieht. Die Partei mit den meisten Sitzen hat daher immer am meisten Einfluss darauf, welche Experten und Lobbyisten eingeladen werden.
Facebook
Unser CYGAR-System fragt jeden Tag über eine Schnittstelle von Facebook, ein sogenanntes Application Programming Interface (API), für jeden Politiker mit offizieller »Facebook-Page« ab, wie viele Personen das Profil geliked haben, wie oft der Politiker gepostet hat und wie oft seine Posts kommentiert, geteilt oder geliked wurden. Weil Facebook selbst nicht veröffentlicht, wie sein Algorithmus genau entscheidet, welche Posts wem alles angezeigt werden, gewichten wir die Inhalte von Politikern annäherungsweise.
Dabei gehen wir erstens davon aus, dass ein Post, desto mehr Menschen auf Facebook erreicht, je mehr Fans ein Politiker hat. Ein Post von Angela Merkel, deren Facebook-Seite inzwischen knapp 2,5 Millionen Menschen geliked haben, erreicht erst einmal mehr Menschen, als ein Post von einem relativ unbekannten Politiker mit 500 Fans.
Zweitens nehmen wir an, dass das Teilen eines Inhalts von einem Politiker die größte Zustimmung, bzw. die größte Kritik seiner Aussage bedeutet. Und dass das Teilen durch andere auf der eigenen Seite am stärksten zur Weiterverbreitung der Inhalte des Politikers beiträgt.
Drittens gehen wir davon aus, dass Posts von Politikern, die besonders viel kommentiert werden, dafür sprechen, dass der Post besonders viel Zustimmung oder Ablehnung verursacht. Außerdem ist bekannt, dass Facebook Posts mit vielen Kommentaren höher gewichtet und deshalb mehr Nutzern anzeigt. Viertens werden Likes gewertet, allerdings nicht so stark wie Kommentare oder Shares.
Außerdem werden auch Likes von Facebook als Anhaltspunkt genutzt, einen Inhalt mehr Nutzern zu zeigen. Alle gewichteten Werte zusammen werden jede Woche aufsummiert und anschließend unter allen Politikern verglichen. Denn wir glauben nicht, dass die reine Anzahl von Posts, Likes oder Shares relevant ist. Im Wettbewerb um die Aufmerksamkeit in Sozialen Netzwerken ist wichtiger, wie die Politiker sich im Vergleich zueinander verhalten bzw. wahrgenommen werden.
Wichtig ist es, zu betonen, dass wir nur öffentliche Facebook-Seiten (Pages) von Politikern abfragen. Persönliche Webseiten, bei denen man sich mit der Person befreunden muss, um ihre oder seine Inhalte zu sehen, fragen wir nicht ab. Dies geht zum einen mit der Facebook-Schnittstelle nicht und wäre zum Anderen auch ein Verstoß gegen den Datenschutz von persönlichen Daten.
Die Formel für die Berechnung unseres Facebook-Rankings ist:
page_likes_score = Math.log10((page_likes * (990.0/page_likes_max))+10)
score_per_week[week] = page_likes_score*posts_count[week] + 2.5 * posts_comment_count[week] + 3 * posts_share_count[week] + 2 * posts_like_count[week]
Twitter
Auch bei Twitter gibt es eine Schnittstelle (API) wie bei Facebook. Hier gehen wir ebenso vor wie bei Facebook - mit dem Unterschied, dass es bei Twitter keine Kommentare gibt.
Für Experten:
Die Formel für die Berechnung unseres Twitter-Rankings ist:
follower_score = Math.log10((follower_count * (990.0/max_follower))+10)
score_per_week[week] = follower_score*tweets_count[week] + 3*tweets_retweet_count[week] + 2*tweets_like_count[week]
Nachrichtenerwähnungen: Bing-News
Wann immer eine Nachricht im Internet veröffentlicht wird, wird sie meist kurze Zeit später von den automatischen Suchmechanismen der großen Suchmaschinen erfasst. Sonst könnte man sie bei der Suche auf Google, Bing oder Yahoo nicht finden. Außerdem bieten unter anderem Google und Bing, der Suchdienst von Microsoft, spezielle News-Suchmaschinen an, die nur Nachrichten, nicht aber Shopping-Webseiten etc., anzeigen.
Wir nutzen die Schnittstelle von Bing-News, um regelmäßig nach Nachrichten zu allen Politikern zu suchen. Unser System zählt dann, wie oft und auf welchen Webseiten die Politiker erwähnt wurden.
Alexa-Ranking
Weil nicht alle Nachrichten-Webseiten gleich stark besucht werden, gewichten wir die Nachrichtenerwähnungen entsprechend der Reichweite der Nachrichtenwebsites. Um zu messen, wie bedeutsam eine Webseite im Internet ist, betreibt Amazon den Dienst »Alexa«. Dort wird ständig ein Ranking aller Webseiten der Welt geführt. Wir gewichten Erwähnungen von Politikern auf Webseiten mit höherem Rang stärker. Anders gesagt: Wenn ein Abgeordneter auf Spiegel Online erwähnt wird, wird das stärker gewichtet, als wenn auf der Webseite einer bayrischen Lokalzeitung über ihn berichtet wird.
Open Data vorhandener Projekte
Das Projekt konnte glücklicherweise auf der Vorarbeit und den Offenen Daten vorheriger Arbeiten zum Bundestag und der Social-Media-Nutzung von Abgeordneten aufbauen. Besonders die Arbeit der Aktiven rund um Offenes Parlament, Bundestwitter und Abgeordnetenwatch hat uns inspiriert und viele sinnvolle Anknüpfungspunkte geliefert. Außerdem bedanken wir uns für die zusätzlichen Facebook- und Twitter-Accounts von Politikern, die uns Martin Fuchs von Pluragraph zur Verfügung gestellt hat.
Darüber hinaus wurden weitere Accounts im Rahmen der Arbeit an der Tagesspiegel-KandiDATENbank recherchiert, die in Zusammenarbeit mit Abgeordnetenwatch entstanden ist.
Impressum
Die Website bundestag.tagesspiegel.de
ist ein Angebot von
Verlag Der Tagesspiegel GmbH
Askanischer Platz 3
10963 Berlin
Telefon: 030 29021 0
redaktion@tagesspiegel.de
Geschäftsführung: Florian Kranefuß (Sprecher), Ulrike Teschke, Farhad Khalil
AG Charlottenburg HRB 43850, UID: DE 151725755
Erstmals veröffentlicht am 1. September 2017
Vollständiges Impressum