Mit Daten Gutes tun: Data Science for Social Good im Interview

Data Science for Social Good Berlin (DSSG Berlin) ist eine Initiative von Data Scientists aus dem Großraum Berlin, die gemeinnützige Organisationen pro bono unterstützt, ihre Daten effektiv zu nutzen und projekttaugliche Erkenntnisse daraus zu gewinnen. Denn oft mangelt es ihnen an der entsprechenden Expertise. Was an Vorarbeit und Know-how dahinter steckt und wie konkrete Resultate aussehen können, hat uns Katharina Rasch, Data Scientist und Teil des Kernteams von DSSG Berlin, ausführlich erklärt.

Hallo Katharina. Was genau macht Ihr für soziale und gemeinnützige Organisationen? Wie kann man sich das vorstellen? 

Wir, also DSSG Berlin, bieten Non-Profit-Organisationen (NPO) kompetente Beratung zum Thema Daten und Datenanalyse an. Das heißt: Wir beraten und begleiten sie dabei, den Wert ihrer Daten zu erkennen und sie strategisch für die Erreichung ihrer Ziele einzusetzen.

Das klingt spannend – aber für Unerfahrene vielleicht noch etwas unverständlich. Hast du ein Beispiel? 

Ein erstes typisches Beispiel ist die Bedarfsanalyse. Also herauszufinden, wo sich die Zielgruppen befinden, die die gemeinnützige Organisation erreichen möchte.

Wir haben beispielsweise mit einer Organisation zusammengearbeitet, die Schüler*innen in ein Praktikum vermittelt, mit dem sie ausprobieren können, ob der angestrebte Beruf der richtige ist. Da haben wir eine Analyse durchgeführt, die die Unterschiede zwischen den Praktika sichtbar macht, die von Schüler*innen gesucht werden, und denen, die von Unternehmen oder staatlichen Trägern angeboten werden. Anschließend wusste die Organisation, in welcher Region noch Anbieter fehlen, die wirklich passende Praktika anbieten.

Damit eröffnet Ihr also neue Anwendungsmöglichkeiten. Wie kann Eure Arbeit noch aussehen?

Wir haben tatsächlich sehr oft Projekte, in denen es darum geht, vorhandene Daten anwendbar zu machen. Eine Organisation hat zum Beispiel seit Jahren sehr ausführliche Fragebögen von ihren Teilnehmenden gesammelt. In Papierform. Die lagen dann allerdings sehr lang unbeachtet in Kisten, mit unheimlich viel Wissen und Feedback zur Arbeit der Organisation. Hier bestand das Projekt darin, diese ganzen Daten erstmal zu digitalisieren und zu analysieren. In den Fragebögen war zuviel Volltext, um das alles manuell einzulesen und auszuwerten. Teil der Analyse war deshalb, relevante Informationen automatisiert zu exzerpieren.

Könntet Ihr solche Analysen uneingeschränkt für jede Art gemeinnütziger Organisation durchführen? Also beispielsweise auch für die Katzenhilfe aus der Nachbarschaft? 

Die Analysen, die wir durchführen, beruhen natürlich darauf, dass gewisse Daten bereits vorhanden sind. Darauf schauen wir zuerst, wenn wir ein Erstgespräch mit einer gemeinnützigen Organisation haben. Oft brauchen deren Mitarbeiter einfach Feedback, was für eine Datenbank sie einsetzen sollen oder welche Daten überhaupt gesammelt werden sollen, die spannende Analysen ergeben können.

Gerade bei kleineren Organisationen passiert auch öfter, dass wir ein Gespräch führen und dann erstmal genaue Anweisungen geben, was sie zunächst zu tun haben. Nach ein bis zwei Jahren sprechen wir nochmal und führen dann auch konkrete Analysen durch – wenn wir die Daten haben.

Also ist Eure Betreuung in der Regel ein längerer Prozess? 

Genau. Wir engagieren uns alle ehrenamtlich neben dem Beruf. Die Anzahl der Stunden, die wir pro Woche für ein Projekt aufbringen können, ist also begrenzt. Mit manchen gemeinnützigen Organisationen haben wir daher Erstgespräche und geben Feedback, wie die nächsten Schritte aussehen, und sehen uns dann erst nach längerer Zeit wieder.

Mit anderen Organisationen führen wir auch Leuchtturmprojekte durch. Denn alles rund um die Datenanalyse ist für fachfremde Leute immer noch sehr schwammig. Für die Mitarbeiter*innen der NPOs ist es daher sehr anschaulich, wenn sie eine komplette Analyse miterleben. Dazu arbeiten wir eng mit den Organisationen zusammen und identifizieren ein typisches Problem, wie etwa die Analyse der Fragebögen, um sie zu inspirieren und zu motivieren, die Datenanalyse von Anfang an mitzudenken und so zu verstehen: Welche Daten muss ich sammeln, damit ich später die Analyse machen kann, die mich tatsächlich an mein Ziel bringt?

Wie genau läuft so ein ganzer Prozess ab?

In einem Telefonat wird erstmal identifiziert, worum es geht. Dann starten wir in unserem Netzwerk von ungefähr 150 Datenanalyst*innen einen Aufruf. Zum Beispiel: Wir haben eine Organisation, die braucht jemanden, der sich mit Textanalyse auskennt. Hast du Bock, an diesem Projekt zu arbeiten? Wir versuchen, auf jedes Projekt zwei oder drei Leute zu setzen, die eng mit der Organisation zusammenarbeiten. Die führen mit der Organisation dann einen zwei- bis dreistündigen Workshop durch, in dem sie sich genau anschauen: Was sind Eure Ziele? Wo fallen Daten an? Wie speichert Ihr sie und welche Daten solltet Ihr noch speichern? In gewissem Maße auch: Welche personenbezogenen Daten sollte man im Rahmen der DSGVO nicht speichern? Allerdings können wir in dem Punkt keine juristische Beratung anbieten.

Im Grunde geht es im Workshop um die Ausformulierung realistischer Fragestellungen, die jetzt gelöst werden sollen und können. Man kann natürlich ganz viel wollen, doch da wir ehrenamtlich arbeiten, muss man bei der Zeit für das Projekt realistisch sein. Nach dem Workshop wird geschaut: Was wäre ein geeignetes Leuchtturmprojekt? Das Ganze kulminiert dann in unserem so genannten Datathon.

Was genau ist ein Datathon?

Das ist wie ein Hackathon – nur für Daten. Bei uns ist das ein Wochenende, das wir einmal pro Jahr abhalten, mit zwei bis drei Organisationen und etwa 30 Datenanalyst*innen, um an den Fragestellungen zu arbeiten. An so einem Wochenende schafft man nur eine gewisse Menge an Arbeit, deswegen ist es enorm wichtig, die Fragestellungen genau zu formulieren.

Und wir wollen, dass am Ende auch wirklich etwas rauskommt, wie zum Beispiel bei der Analyse der Fragebögen. Hier wurde im Vorfeld geschaut: Wie müssen die Daten digitalisiert und gesäubert werden, in welchen Felden sind vielleicht unerwartete Informationen und wo müssen wir anonymisieren? Sodass dann zum Datathon sowohl klare Fragestellungen vorhanden waren als auch Daten, auf deren Basis man sofort arbeiten kann.

Wie sieht die Zusammenarbeit während des Datathons aus? Sitzen die Teilnehmer aus den Organisationen einfach am Rand und schauen zu?

Nein, alle Teilnehmenden finden sich in kleinen Gruppen zusammen und bearbeiten die vorher definierten Fragen. Die Mitarbeiter*innen der Organisation sind die ganze Zeit dabei. Das ist ganz wichtig. Sie sitzen mittendrin, und es ergibt sich ein wunderbarer Austausch mit den Data Scientists. Sie sind auch dabei, wenn die Daten und ihre Qualität beurteilt werden. Das bringt viel praktische Erfahrung für das nächste Mal.

Auch die Datenanalyst*innen lernen dazu und sehen, wie ihre Arbeit den gemeinnützigen Organisationen weiterhilft. Viele arbeiten in ihrem Beruf eher technisch und haben selten die Möglichkeit, auch strategische Beratung durchzuführen. So ermöglichen wir hoffentlich unseren Analyst*innen, dass sie beraten können und nicht nur umsetzen.

Du hast gesagt, dass es den meisten Organisationen an Verständnis für die Wichtigkeit der Daten mangelt. Wie kommt dann eine Zusammenarbeit zustande? 

Das ist gar nicht so einfach. In vielen Fällen hat es damit zu tun, dass die Mitarbeiter viel zu tun haben und chronisch unterbesetzt sind, sodass einfach nicht die Zeit da ist, über IT-Belange nachzudenken. Oder auch, dass das Thema Daten für gemeinnützige Organisationen eher abschreckend ist.

Wir gehen also tatsächlich raus und versuchen die Organisationen zu erreichen. Es gibt in Berlin verschiedene Konferenzen, auf denen sie sich treffen. Dort sind wir nach Möglichkeit präsent und halten auch Vorträge über das, was wir machen. Die eine oder andere NPO fühlt sich dann in ihren „Painpoints“ angesprochen.

Habt Ihr auch Kooperationen mit Unternehmen wie Unbelievable Machine, mit denen Ihr gemeinsame Aktionen umsetzt? 

Neben dem Ehrenamt arbeiten viele von uns fest in Unternehmen. Die unterstützen uns dann schon, indem sie uns zum Beispiel Zeit geben, ein Beratungsgespräch während der Arbeitszeit durchzuführen. Wir bekommen auch relativ viel Unterstützung bei Räumlichkeiten. Wir selbst haben keine Büros. Für unsere Meetings und teilweise Workshops mit gemeinnützigen Organisationen, die kein Büro in Berlin haben, sind wir daher einfach auf die Unterstützung von Unternehmen wie Unbelievable Machine angewiesen. Auch beim Sponsoring der Verpflegung am Datathon.

Könnt Ihr gewisse Themen identifizieren, die besonders viele gemeinnützige Organisationen beschäftigen?

Die Themen unterscheiden sich gar nicht so sehr von denen der Privatwirtschaft. Da hätten wir beispielsweise Marketingfragen wie: Auf welche Google Adwords sollen wir setzen, damit Leute uns finden? Gemeinnützige Organisationen bekommen häufig von Google Budget zu Marketingzwecken und können dort quasi kostenlos werben. Ein anderes typisches Thema ist die Wirkungsanalyse. Also messbar zu machen, was die gemeinnützige Organisation tatsächlich zu erreichen versucht, indem ihre Arbeitsergebnisse vor und nach einem Projekt festgehalten und verglichen werden.

Gemeinnützige Organisationen haben also viel von der Zusammenarbeit. Was bringt Euch die Arbeit bei DSSG im persönlichen und im beruflichen Kontext?

Für mich persönlich den schon genannten strategischen Part. Ich bin beruflich eher in der technischen Umsetzung involviert, und gerade die Erstgespräche mit Organisationen sind für mich ganz anders und spannend im Vergleich zu meiner normalen Arbeit. Wenn wir Datenbotschafter*innen für ein Projekt suchen, versuchen wir zudem, zwei erfahrenere Personen einzubringen und eine Person, die gerade erst ins Berufsleben startet, damit sie voneinander lernen können.
Auch bei den Datathons versuchen wir immer, zu jedem Projekt Fragestellungen zu formulieren, die eher für Neueinsteiger*innen passend sind, und wirklich sehr komplexe Fragestellungen, bei denen die Erfahreneren ihr Wissen einbringen, sodass sie technisch ebenfalls voneinander lernen.

Durch dein Engagement bei DSSG gehst du also auch anders auf Themen deiner Arbeit ein? 

Auf jeden Fall. Ich denke mehr über das große Ganze von dem nach, was ich da gerade implementiere und was wir eigentlich damit erreichen wollen.

Was ist deine persönliche Motivation?

Meine persönliche Motivation ist: Wir als Datenanalyst*innen haben ein großes technisches Wissen, das wir in unseren Firmen für die Zwecke der Firma einsetzen – und ich finde es schön, dass wir uns und anderen Datenanalyst*innen in Berlin mit der Hilfe von DSSG ermöglichen, eben dieses Wissen auch für das Gemeinwohl einzusetzen.

Was steht als nächstes bei Euch an? Gibt es spannende neue Projekte? 

Derzeit sind sind wir gleich mit mehreren gemeinnützigen Organisationen in Erstgesprächen. Dazu möchte ich aber noch nicht ins Detail gehen. Es hat sich gezeigt, dass ein Großteil dieser Gespräche nicht zu einem Datathon-Projekt wird, weil einfach noch nicht die Daten da sind oder die Zeit bei den NPOs fehlt. Ich denke aber, dass wir bis zum Herbst wieder spannende Projekte für einen Datathon haben.

Auf jeden Fall sind wir immer auf der Suche nach gemeinnützigen Organisationen. Erstgespräche führen wir jederzeit gerne und schauen dann, ob es für beide Seiten passt und was die nächsten Schritte sein können.

Danke für das Gespräch, Katharina. Und weiterhin so ein tolles Engagement!


Das könnte dich auch interessieren:

Weihnachtsspende an DSSG: Walking in a Data Wonderland
DSSG: *um unterstützt 2. Data Dive in Berlin
DSSG: *um supportet die Initiative und das erste Event in Berlin

This post is also available in: Englisch