Wie Daten Helfern helfen
Spätestens seit Amazon, Google und Facebook ist bekannt, dass die Big-Data-Analyse ein lukratives Geschäft ist. Längst sind Unternehmen durch die Auswertung gesammelter Daten in der Lage, Internet-Nutzern Empfehlungen zu geben, die auf deren Interessen basieren, riesigen Rechenzentren und schlauen Algorithmen sei Dank. Big Data lässt sich aber nicht nur für kommerzielle Zwecke nutzen: Wie mit frei verfügbaren Daten und wenigen Ressourcen sozialen Organisationen geholfen werden kann, zeigen Initiativen wie Data Science for Social Good Berlin, kurz DSSG Berlin, oder Correlaid.
Das Problem gemeinnütziger Organisationen ist häufig das gleiche: chronischer Geldmangel. Was sich zumindest innerhalb der Organisation mit engagierten Freiwilligen kompensieren lässt, wird spätestens bei Projekten, die konkretes Fachwissen erfordern, zum Problem. Hier setzen Unternehmen wie Proboneo an: Statt Geldspenden stellen Freiwillige ihr Fachwissen zur Verfügung.
Big Data - Antworten in Datensätzen
Ein Bereich der Pro-Bono-Arbeit ist die Erstellung von Datenanalyse-Modellen sowie die anschließende Auswertung. Die Initiative DSSG Berlin liefert solche Antworten mithilfe von Big Data im Rahmen sogenannter Data Dives an einem Wochenende. Bei der Premierenveranstaltung vom 23. bis zum 25. Oktober halfen die freiwilligen Data Scientists dem Sozialunternehmen Streetfootballworld, das weltweit Straßenfußball-Initiativen miteinander vernetzt. Die Helfer strukturierten anhand von Texterkennung und automatischer Themenkategorisierung die Antworten eines Fragebogens von Streetfootballworld.
Ein voller Erfolg sei auch die Wirkungsanalyse für Jambo Bukoba gewesen, berichtet DSSG-Berlin-Initiator Daniel Kirsch. Die Initiative kämpft für bessere Bildung, Gesundheit und Chancengleichheit für Kinder in Tansania. Dank offener Daten sowie Daten von Jambo Bukoba konnte DSSG Berlin helfen, die Effizienz des Programms sichtbar zu machen und Argumente für eine Fortsetzung zu liefern.
Wenig Verständnis für Data Science
Schon jetzt plant DSSG Berlin unter ehrenamtlicher Führung von Daniel Kirsch den nächsten Data Dive – eine Herausforderung, wie Kirsch erklärt: „Der Data Dive selbst ist nicht so aufwendig, die Vorbereitung schon.“ Interessenten hat Kirsch ausreichend. Ihnen fehle aber häufig die Kompetenz, ihr Problem aus Data-Science-Sicht einschätzen zu können. Dadurch müssten sich Kirsch und sein Team jedes potenzielle Projekt vorab genau anschauen und prüfen, ob die dazugehörigen Aufgaben auch im Rahmen eines Data Dives umsetzbar sind. Sei das der Fall, gelte es, die Daten mit Blick auf Format und Datenschutz vorab aufzuarbeiten. „Die ganze Vorbereitung dauert etwa drei Monate”, sagt Kirsch. „Wenn alles gut läuft, könnte es sein, dass wir in vier bis fünf Monaten den nächsten Data Dive veranstalten. Ich gehe aber eher vom Oktober nächsten Jahres aus.“
Ein weiteres Problem, dem sich die Wissenschaftler stellen müssen, ist das Image von Big Data und Data Science in Deutschland. „Der Vorteil in den USA ist der angelsächsische Umgang mit Daten und Datensicherheit. Die gehen pragmatischer vor und haben eine viel enthusiastischere Sicht auf das Thema”, erklärt der studierte Mathematiker. „Hierzulande hat das Thema in den Medien einen negativen Unterton. Das erfordert ein anderes Vorgehen.“
Big Data gegen Armut
Ein anschauliches Beispiel für eine gemeinnützige Datenanalyse liefert Givedirectly, eine New Yorker NGO, die Armut mit direkten Spenden bekämpft. Um die Regionen mit extrem armer Bevölkerung zu identifizieren, holte sich die Organisation Hilfe bei den Pro-Bono-Statistikern Datakind. Je mehr Strohdächer in der Region, desto höher die Armut, besagte die These. Mit existierenden Satellitenaufnahmen und selbstlernenden Algorithmen analysierte Datakind in 507 Dörfern in Kenia und Uganda das Verhältnis von Stroh- und Metalldächern. Das sparte Givedirectly gut 100 Personentage und knapp 4000 Euro.
Correlaid aus Konstanz zeigt, dass die freiwillige Unterstützung nicht nur gemeinnützigen Initiativen, sondern auch den Helfenden einen Vorteil bietet. Das derzeit von zwölf Ehrenamtlichen geführte junge Unternehmen setzt auf Studierende, die anhand existierender Probleme je nach verfügbarer Zeit ihr Wissen anwenden und sich dabei in Datenanalyse üben können. Im Pilotprojekt wertet das Team eine Mitgliederbefragung des Pfadfinder- und Pfadfinderinnenbund Nord (PBN) aus, um die Mitgliederstruktur zu verstehen. Ziel ist es, den Einfluss der Pfadfinder auf das Sozialkapital der Jugendlichen zu identifizieren, das über den Zusammenhalt der Gruppe entscheidet.