Big Data: Beherrscher der Daten
Titelbild: © Vectomart/Shutterstock.com Posted on von Big Data

Big Data: Beherrscher der Daten

Laut einer Prognose der IT-Analysten von IDC verdoppelt sich das weltweit produzierte Datenvolumen alle zwei Jahre. Beherrschbar und nutzbar sind diese Datenberge nur mit einer Schlüsseltechnologie: Big Data.

Genau 1,44 Megabyte: Soviel passte einst auf eine 3,5-Zoll-Diskette. Die 90 mm breiten und 3,3 mm hohen Speicherträger, in der Regel aus schwarzem oder blauem Plastik, reichten in den 1990er Jahren noch für komplette Softwareanwendungen und ganze Betriebssysteme. Heute sind sie längst reif für das Museum. Auch die magnetisch-mechanischen Speichermedien mussten vor dem wachsenden Datenkosmos kapitulieren.

Die IT-Analysten von IDC gehen davon aus, dass sich im Zeitraum von 2013 bis 2020 das weltweite Informationsvolumen alle zwei Jahre verdoppelt. Um 40 Prozent soll die Menge an Bits und Bytes per annum zunehmen, die Maschinen, Sensoren, Unternehmen oder Individuen produzieren. 2020 wird der Datenkosmos 44 Zettabyte betragen – also 44.000.000.000.000.000 Megabyte. Wer versuchen würde, diese Menge auf den vor 30 Jahren handelsüblichen 3,5-Zoll-Disketten unterzubringen, könnte sein Werk auf 674 gleich hohe Stapel verteilen – jeder einzelne von ihnen würde von der Erde zur Sonne reichen.

Datenmengen, die die menschliche Vorstellungskraft übersteigen. Und die Frage aufwerfen: Welcher Art sind diese Daten eigentlich?

Zwei Megabyte an Daten pro Minute und Mensch

Ob Smartphone-Fotos für Facebook, Überwachungskameras an Flughäfen und Bahnhöfen, Mautsysteme auf der Autobahn oder Messsensoren in Fabriken: Das Anschwellen des Informationsvolumens hat viele Ursachen – jeden Tag. Die IDC-Analysten vergleichen die Entwicklung mit einem digitalen Sonnensystem, das jede Person oder jedes Unternehmen mit seinen Daten füttert. Alle Sonnensysteme zusammen bilden den gigantischen, stetig wachsenden Datenkosmos. So produziert das digitale Sonnensystem jedes einzelnen Menschen auf der Erde aktuell fast zwei Megabyte – pro Minute.

Der mit am schnellsten wachsende Anteil im Datenkosmos besteht aus sogenannten Metadaten. Also zusätzlichen Informationen, die notwendig sind, um andere Daten interpretierbar zu machen. So enthält etwa dieser Blogbeitrag nicht nur lesbaren Text für den Nutzer, sondern auch besagte Metadaten – also Informationen speziell für Suchmaschinen, Browser und Computer. Auch ein Digitalfoto setzt sich nicht nur aus Bildinformationen zusammen, sondern hält ebenfalls Metadaten bereit – über das Kamerasystem, die Belichtung, die Codierung oder das Speicherformat.

Bezogen auf den Speicherbedarf sind digitale Fotos oder HD-Videos wahre Mega- und Gigabyte-Riesen im Datenkosmos. Weit genügsamer sind da die Sensoren im Internet der Dinge (IoT): Sie verpacken ihre Messwerte in Speichercontainern von der Größe weniger Kilobyte. Bezogen auf die Menge an Bits und Bytes sollen bis ins Jahr 2020 nur 10 Prozent des Datenkosmos auf Systeme mit integrierten IoT-Sensoren zurückgehen. Aktuell sind dies gerade mal 2 Prozent. Aber: 99 Prozent aller Datencontainer sollen 2020 ihren Ursprung im Internet der Dinge nehmen. Denn die Menge an vernetzten IoT-Geräten wächst rasant: Waren es 2013 noch rund 13 Milliarden sollen es 2020 bereits etwa 32 Milliarden IoT-Geräte sein, die teils im Sekundentakt Messwerte produzieren und in einem Container speichern.

Produktiver und profitabler arbeiten dank Daten

Dass Daten wie diese das neue Gold sind, gilt mittlerweile als geflügeltes Wort – und bedeuten für Unternehmen Fluch und Segen gleichzeitig. Segen, weil laut Management-Magazin „Harvard Business Review“ Unternehmen, die zum führenden Drittel ihrer Branche gehören und sich selbst als datengetrieben beschreiben, durchschnittlich um 5 Prozent produktiver und um 6 Prozent profitabler arbeiten als ihre Wettbewerber.

Fluch, weil die schiere Menge und die Komplexität dieses Datenkosmos viele Unternehmen überfordern. Gilt es doch, sich über folgende Fragen klar zu werden: Welche Informationen lohnt es überhaupt, zu speichern und auszuwerten? Und wie schaffe ich es überhaupt, relevante von irrelevanten Informationen zu trennen? Und welche Handlungsempfehlungen leite ich daraus ab, um den Erfolg meines Unternehmens zu steigern? Ob Mittelstand oder Großkonzern – laut IDC sollten Informationen

  • einfach zugänglich,
  • in nahezu Echtzeit verfügbar
  • und repräsentativ nutzbar für eine große Gruppe Menschen oder Unternehmen sein.

Grundvoraussetzung: Die Daten sind bereits „getagged“. Das heißt: Es ist eindeutig beschrieben, um welche Art von Informationen es sich überhaupt handelt. Kurz: Bezeichnet die Zahl „43“ in einem Datencontainer das Alter einer Person? Oder vielleicht die Anzahl der Freunde auf Facebook? Oder auch die Summe aller Einkäufe bei Amazon?

IDC geht davon aus, dass sich von den Daten, die getagged existieren, aktuell 6 Prozent zur Analyse mit Big Data anbieten. Im Jahr 2020 sollen das bereits 11 Prozent sein – letztlich nicht mehr als gut ein Prozent aller weltweit verfügbaren Daten.

Ob getagged oder nicht getagged – hier zeigt sich deutlich, welches Potential im gesamten Datenkosmos schlummert. Die wahre Kunst besteht also darin, möglichst viele Informationen auswertbar zu machen. Wie das gelingen kann? Die Metadaten enthalten den Schlüssel zur Lösung. Wer sie intelligent zu verknüpfen und auszuwerten weiß, ist in der Lage, unstrukturierte Daten aus unterschiedlichen Quellen zum Beispiel per Ausschlussprinzip zu taggen und auszuwerten. Fest steht: Big Data ist die Schlüsseltechnologie, um den Datenkosmos mehr und mehr zu erschließen und zu beherrschen.

2020: 1.231 Gigabyte pro IT-Mitarbeiter

Hinzu kommt: Während sich der Datenkosmos alle zwei Jahre verdoppelt, wächst die Anzahl an IT-Professionals nicht im gleichen Tempo. Kamen im Jahr 2014 auf weltweit rund 28 Millionen IT-Mitarbeiter etwa 230 Gigabyte pro Kopf, sollen es 2020 dann schätzungsweise 1.231 Gigabyte für jeden der dann rund 36 Millionen IT-Experten auf der Erde sein.

Und auch das globale Speicherangebot kann laut IDC mit der Entwicklung des digitalen Universums nicht Schritt halten: Mit der im Jahr 2020 weltweit verfügbaren Kapazität wären gerade einmal 15 Prozent von 44 Zettabyte speicherbar.

zurück zur Startseite

Kommentar

Wenn Sie die E-Mail-Adresse eingeben, die Sie bei Twitter oder Gravatar verwenden, erscheint Ihr Bild neben dem Kommentar.

mit * gekennzeichnete Felder sind Pflichtfelder. Sie erhalten zur Freischaltung ihres Kommentars eine E-Mail. Ihre E-Mail-Adresse wird nicht veröffentlicht.