17.11.2014 Big Data: Öl für die Verwaltung

Neelie Kroes, die ehemalige EU-Kommissarin für die Digitale Agenda, hat es auf den Punkt gebracht: Data is the new oil. Daten sind zu einem grundlegenden Rohstoff des Wirtschaftslebens, aber auch weit darüber hinaus geworden.

Big Data ist auch für den öffentlichen Sektor relevant. Mancher hält entgegen, dass es weitaus dringendere Herausforderungen gebe – wie etwa die anstehende Bewältigung der Personallücke, die im Öffentlichen Dienst durch das Ausscheiden von 700.000 Mitarbeitern entsteht. Richtig ist daran, dass es demographische Herausforderungen gibt. Falsch wäre es aber, eine Herausforderung gegen eine Chance auszuspielen. Und Chancen bietet Big Data. Auch für den Öffentlichen Dienst, der ein ureigenes Interesse daran hat oder jedenfalls haben sollte, die verlässlichste Datenbasis und die beste Analyse für die bestmöglichen Planungen und Entscheidungen zur Verfügung zu bekommen. Was ist mit dem einerseits griffig-prägnanten, andererseits unbestimmten Begriff „Big Data“ eigentlich gemeint? Und was bedeutet Big Data für die Verwaltung? Übereinstimmend sehen Experten weltweit drei, manchmal auch vier Merkmale von Big Data, die mit Volume, Variety, Velocity (Masse, Vielfalt und Geschwindigkeit) auf eine prägnante Kurzformel gebracht werden. Diese Kurzformel wird bisweilen noch ergänzt um Veracity (Genauigkeit, Zuverlässigkeit)

Volume: Die Dimension „Datenmasse“ bezieht sich auf große Datenmengen, die analysiert werden, um bessere und richtigere Entscheidungen zu treffen. Um welche Größenordnung es jeweils geht, variiert von Branche zu Branche. Sicher ist, dass Meldedaten oder andere personenbezogene Bürgerdaten kaum alleine die Größenordnungen erreichen, um die es bei Big Data. Andererseits gibt es zahlreiche Anwendungsfälle, wo auch in der öffentlichen Hand extrem große Datenmengen entstehen. Beispiele sind etwa Sensordaten der Wetterstationen, Verkehrsdaten, Statistik, Steuer- oder Versicherungsdaten oder die epidemiologischen anonymisierten oder pseudonymisierten Patientendaten aus den Kliniken, die zur Versorgungsforschung genutzt werden können

Variety: Vielfalt entsteht durch unterschiedliche Datenformate und Datenquellen und Datentypen (strukturiert, unstrukturiert). Im Zuge der immer stärkeren Verbreitung von Sensoren, intelligenten Endgeräten und Social Collaboration-Technologien fallen neue Daten in Formaten wie Text, Protokoll- und Transportdaten, Tweets, Sensordaten, Audio, Video, Klickstreams, Cookies an. Die Vielfalt dieser Daten ist bei der Zusammenstellung und der anschließenden Analyse der Daten relevant.

Velocity: Die Geschwindigkeit, mit der Daten erzeugt, verarbeitet und analysiert werden können, nimmt stetig zu. Mehr und mehr werden Daten in Echtzeit generiert und auch in Echtzeit in Analyse- und Entscheidungsprozesse eingebunden. Mit anderen Worten verkürzt sich die Zeit zwischen Erstellung oder Erfassung von Daten und dem Zeitpunkt des Datenzugriffs (Latenz). Die Geschwindigkeit, in der heute Daten fortlaufend entstehen, macht es für traditionelle Systeme unmöglich, diese Daten zu erfassen, zu speichern oder gar zu analysieren. Bei zeitkritischen Prozessen (z.B. Katastrophenschutz) müssen Datentypen in Echtzeit analysiert werden, um einen angemessenen Schutz der Bevölkerung sicherzustellen

Ein Big Data-Szenario schafft schon heute das nationale Krebsfrüherkennungs- und -registergesetz. Das Gesetz von 2013 sieht unter anderem vor, dass die Länder flächendeckend klinische Krebsregister einrichten. Diese Register sollen Daten über das Auftreten, die Behandlung und den Verlauf von Krebserkrankungen in der ambulanten und stationären Versorgung erfassen und auswerten. Diese Analyse ist kein Selbstzweck, sondern soll die Qualität der onkologischen Versorgung in allen Behandlungsphasen sektorenübergreifend darstellen, bewerten und verbessern helfen. Ein neuer Anwendungsfall für Datenanalyse im Gesundheitswesen. Aber nicht der einzige.

Einige Spitzenkliniken in Deutschland setzen Hightech-Lösungen ein, um bessere Erkenntnisse über Tumor-Physiognomie und Medikamentenwirkstoffe zu erreichen und Krebsbehandlungen gezielter auf Patienten und Krebsarten abzustimmen und so die Heilungschancen verbessern. Wenn künftig Tumorzellgenome sämtlicher Krebspatienten entschlüsselt und untersucht werden, um individuelle Therapien zu ermöglichen, entstehen pro Patient Datenmengen im Terabyte-Bereich. Die müssen möglichst in Echtzeit nach den relevanten Mutationsinformationen durchsucht und analysiert werden.

Im Zuge des Datenspähskandals durch US-amerikanische und britische Geheimdienste sind Big Data-Anwendungen in ein zweifelhaftes Licht geraten. Dabei bleibt allerdings außer Acht, dass Technologie nicht nur zur Auswertung ausgespähter Daten eingesetzt werden kann. Sie kann auch dazu dienen Muster der Ausspähung zu erkennen und Gegenmaßnahmen einzuleiten. Beide Seiten nutzen Techniken der Mustererkennung und des Data Mining. Sicherheitsexperten setzen sie ein, um der Bedrohung durch Schadsoftware, Computerviren und -würmer zu begegnen, wie auch der Bedrohung durch Spähattacken. Gerade durch Big Data ist hier in mehrfacher Hinsicht ein Durchbruch erreicht worden. Data-Mining-Technik kann in Echtzeit gegen Netzangriffe, Hacking-Attacken und gegen Datenspionage eingesetzt werden erlauben. Hierbei helfen große Speicher, verfeinerte Analysetechniken, die es erlauben, alle Daten im Arbeitsspeicher zu halten und während der Analysen neue Daten hinzuzufügen und gleich in Echtzeit mit auszuwerten. Technik ist eben auch hier ein neutrales Werkzeug.

In Deutschland besteht noch Nachholbedarf – Länder wie Australien machen mit der Public Service Big Data Strategy vor, wie ein strukturierter und planvoller Einsatz von Big Data im öffentlichen Sektor gelingen kann und die Potentiale und Chancen von Big Data mit den berechtigten Wunsch des Bürgers nach Privatheit in Einklang gebracht werden können.

Diesen Beitrag teilen

Ihr Kommentar

Ihr Kommentar

* = Pflichtfelder

Der Inhalt dieses Feldes wird nicht öffentlich angezeigt

Diese Frage hat den Zweck zu testen, ob sie ein menschlicher Benutzer sind und um automatischem Spam vorzubeugen.

Captcha

Bitte geben Sie alle Zeichen ein.