Künstliche Intelligenz benötigt Daten

  • Unternehmen erwarten steigenden Bedarf an Trainingsdaten für KI
  • Zwei Drittel benötigen dabei auch personenbezogene Daten

Berlin, 13. August 2020 - Ob für die Routenplanung, die Qualitätskontrolle in der Produktion oder die Analyse von Röntgenbildern: Künstliche Intelligenz (KI) hält in immer mehr Bereichen Einzug. Zwar geben laut einer Umfrage des Digitalverbands Bitkom unter 503 Unternehmen ab 50 Mitarbeitern 34 Prozent an, aktuell KI einzusetzen, den Einsatz zu planen oder zumindest darüber zu diskutieren. Für fast zwei Drittel aber ist das kein Thema. Eine zunehmende Bedeutung gewinnt vor allem das sogenannte maschinelle Lernen. Dabei werden KI-Systeme nicht lediglich programmiert, sondern auch mit geeigneten Daten trainiert. Die in den Trainingsdaten erkannten Muster und Informationen können die Systeme nach Abschluss des Trainingsprozesses auf bisher unbekannte Datenbestände übertragen. Der Bedarf an solchen Trainingsdaten wird in den kommenden Jahren stark zunehmen. Fast alle Unternehmen (94 Prozent), die sich mit KI auseinandersetzen, gehen davon aus, dass der Bedarf an Trainingsdaten steigen wird. Zwei Drittel (66 Prozent) sagen zudem, dass personenbezogene Daten genutzt werden müssen, damit die KI verwertbare Analyseergebnisse liefert. „Daten sind der Treibstoff für Künstliche Intelligenz“, sagt Bitkom-Präsident Achim Berg. „Unternehmen, die KI entwickeln oder einsetzen, kommen daher schnell an den Punkt, dass sie auch auf Datensätze zurückgreifen müssen, die personenbezogene Daten enthalten.“

Die Unternehmen betreiben einen hohen Aufwand, um die rechtlichen Vorgaben beim Training von Systemen des maschinellen Lernens mit personenbezogenen Daten einzuhalten. Die meisten von ihnen (69 Prozent) erfüllen die datenschutzrechtlichen Vorgaben, indem sie die Einwilligung der Betroffenen einholen. Für 63 Prozent der Unternehmen führt kein Weg an der Anonymisierung der Daten vorbei, obwohl der für viele KI-Analysen besonders wertvolle Personenbezug dadurch entfernt wird. Jedes Fünfte (20 Prozent) nutzt die Pseudonymisierung, bei der Personenbezüge ersetzt werden. 42 Prozent verarbeiten die Daten auf Grundlage einer datenschutzrechtlichen Interessenabwägung und 16 Prozent greifen auf einen Dienstleister zurück, der den Datenschutz sicherstellen soll. Zugleich gibt jedes zehnte Unternehmen (10 Prozent) an, von vornherein auf die Nutzung personenbezogener Daten zu verzichten. „Es gibt einen großen Bereich von Rechtsunsicherheit und rechtliche Risiken bei der Nutzung von Daten. Viele Unternehmen entscheiden sich im Zweifel gegen die Nutzung von Daten und gegen die Entwicklung von KI-Modellen“, sagte Berg. „Datensouveränität und Datensorgfalt müssen Datensparsamkeit als Leitmotiv ablösen, wenn wir die großen Zukunftsherausforderungen erfolgreich angehen wollen.“

Methodik: Grundlage der Angaben ist eine Umfrage, die Bitkom Research im Auftrag des Digitalverbands Bitkom durchgeführt hat. Dabei wurden 503 Unternehmen aller Branchen ab 50 Mitarbeitern in Deutschland telefonisch befragt. Die Umfrage ist repräsentativ für die Gesamtwirtschaft. Die Fragestellungen lauteten: „Inwieweit setzt Ihr Unternehmen bereits Künstliche Intelligenz ein bzw. plant oder diskutiert Künstliche Intelligenz zukünftig zu nutzen?“, „Ist nach Ihrer Ansicht bzw. Erfahrung die Analyse von personenbezogenen Daten erforderlich, damit KI-Anwendungen verwertbare Analyseergebnisse liefern können?“, „Welche Maßnahmen haben Sie vorgesehen, um beim Training von KI-Systemen mit personenbezogenen Daten den Datenschutz zu gewährleisten?“ und „Wie wird sich der Bedarf an Trainingsdaten für Künstliche Intelligenz in den kommenden fünf Jahren in Ihrem Unternehmen entwickeln?“