Was du über Big Data wissen musst - einfach und kompakt erklärt

 

Data, data und nochmal Data

2006 war Öl noch Thema Nr. 1. Google war gerade als neue Suchmaschine auf den österreichischen Markt gekommen. Vielerorts fragte man sich, welches Geschäftsmodell hinter einer Gratis-Suchmaschine im Internet stecken sollte. Schon damals predigten die Gründer von Google - Larry Page und Sergey Brin -, dass sich der Stellenwert von Daten in unserem Leben fundamental verändern würde.

 

Was damals noch utopisch klang, ist seit einiger Zeit bei uns allen angekommen. Man kann sich fast nicht mehr vorstellen, dass es einmal auch anders war. Daten sind das neue Öl. Inzwischen gibt es Unternehmen, die mit der Speicherung, Aufbewahrung, Analyse oder Auswertung von Daten ihr Geld verdienen. Und kaum ein Unternehmen kann es sich noch leisten, seine Daten ungenutzt herumliegen zu lassen.

 

Daten können auf vielfältigste Weise genutzt werden: Im Bildungssegment z.B. dazu, individuelles Lernen Realität werden zu lassen. Interne Unternehmenskennzahlen wie z.B. Krankenstandstage, unverbrauchte Urlaubstage oder angehäufter Zeitausgleich - alles Daten, die ausgewertet, analysiert und optimiert werden. Forschungsabteilungen sammeln Testdaten und gewinnen daraus Erkenntnisse für Weiterentwicklungen. Und schließlich sammelt jeder Mensch mit jeder Erfahrung die er macht im Grunde Datenmaterial. Dieses wird im Hirn gespeichert, mit anderen Daten verknüpft und dann und wann hervorgeholt.

 

Wann wird aus Data nun Big Data?

Daten sind also allgegenwärtig. Big Data als relativ neuer Begriff meint Daten, die nicht mehr so ohne Weiteres verarbeitbar und analysierbar sind. Und das ist nicht allein von der Menge, sondern auch von der Struktur der Daten abhängig. Eine genaue Definition ab wann von Big Data gesprochen wird, gibt es grundsätzlich nicht. Bei den einen Unternehmen fängt Big Data bei 100 Terrabyte Datenmaterial an, andere orten Big Data schon bei 10 Terrabyte. Dabei kommt es jeweils auf die 3 Vs an: Volume (Menge), Variety (Vielfalt) und Velocity (Geschwindigkeit). So gibt es Datenmengen, die eher konstant, klar und einheitlich sind. In solchen Fällen fängt Big Data erst bei sehr viel größeren Mengen an, als bei der Auswertung von schwach strukturierten und sich schnell ändernden Daten. Big Data ist also so individuell wie die darin enthaltenen Daten selbst. Mit dem Begriff wird vielmehr auf eine neue Art der Datenanalyse und des Einsatzes der daraus gewonnenen Erkenntnisse abgestellt.

 

Und es gibt mehr als genug Daten. Jede Sekunde, jede Minute und jeden Tag entstehen unvorstellbar viele neue Daten. Laut MerlinOnline werden mittlerweile jeden Tag 2,5 Trillionen Bytes digitale Daten erzeugt. Kein Wunder, dass Big Data all unsere Lebensbereiche durchdringt. Ja wir sogar selbst Teil dieser riesigen Datenproduktion sind, indem wir ständig in irgendeiner Form online sind: Wir surfen im Internet, schreiben über Whatsapp eine Nachricht, schießen ein Foto, das wir auf Instagram hochladen. Wir schicken unsere Vitalfunktionen Gott weiß wohin und tragen unser Handy ständig bei uns.

 

Was ist neu seit Big Data?

Seit Big Data Analysten an die Arbeit gegangen sind, hat sich viel verändert. Netflix, Youtube & Co schlagen dir auf Grund ihrer Erfahrungen von und mit anderen Usern Serien und Videos vor, die dir vermutlich gefallen. Navis zeigen heute schon Staus von morgen an, Dating-Apps bieten ausgefeilte Matching-Dienste an, Google & Co zeigen dir individuell zugeschnittene Werbeanzeigen an u.v.m.

 

Es gibt unzählig viele denkbare Anwendungsmöglichkeiten von Big Data. Wie Datenanalyse im Unternehmen funktionieren kann und welche Möglichkeiten sie bereit hält, kannst du dir im folgenden Video anschauen:

 

Big Data und Small Data - was damit tun? 

Egal ob groß oder klein - JEDES Unternehmen verfügt über Daten. Seien es Daten zu Produkten, Käufern, Verkäufern, Mitarbeitern, internen Abläufen, zum Mitbewerb oder sonstige Daten. Wer Daten ganz gezielt erhebt, sinnvoll sammelt und geplant analysiert, kann daraus entscheidende Wettbewerbsvorteile für sein Unternehmen ziehen. Wie das genau geht kannst du z.B. in unseren BFI-Ausbildungen zu Data Analysis, Business Intelligence und Data Science lernen. 

 

Big Data und viele andere neue Begriffe

In der Welt von Big Data sind in den letzten Jahren viele neue Begrifflichkeiten entstanden, die für Laien nicht recht verständlich sind. Ich habe deshalb für dich ein Glossar mit den am häufigsten gehörten Begriffen rund um Big Data geht zusammengestellt:

 

Big Data Analytics: Bezeichnet die Gesamtheit der Analyse von großen Datenmengen - von der Datenbeschaffung über die Datenoptimierung und -Auswertung bis hin zur Analyse der Daten und Präsentation der Ergebnisse.

 

 

Business Intelligence: Die systematische Auswertung und Analyse unternehmensinterner Zahlen zum Zweck der Optimierung von Managemententscheidungen.

 

Data Lake: Datenspeicher, der in der Lage ist, riesige Datenmengen unformatiert und unstrukturiert im Rohformat aufzunehmen. Neben Daten können Bilder, Videos und andere Dateiformate aufgenommen werden.

 

 

Data Mining: Data Mining bezeichnet die systematische Anwendung mathematisch-statistischer Methoden auf große Datenbestände. Ziel ist das Aufspüren und Erkennen von zuvor unbekannten, nicht trivialen Mustern und Regeln.

 

 

 

Data Science: Der gesamte Prozess von der Aufbereitung der Daten bis hin zur Gewinnung neuer Erkenntnisse aus der Analyse der Daten.

 

Data Warehouse: Eine Datenbank, deren Zwecke die Datananalyse ist und die ihre Rohdaten aus anderen Datenbanken bezieht. Die Rohdaten im Data Warehouse sind (im Gegensatz zu denen im Data Lake) bereits strukturiert, validiert und formatiert.

 

Knowledge Discovery: Der Gesamtprozess von der Aufbereitung der Daten über die Anwendung mathematisch-statistischer Methoden (Data-Mining) bis hin zur Bewertung der Resultate.

 

Künstliche Intelligenz: Die Automatisierung von intelligentem Problemlösungsverhalten. Menschliche Entscheidungsstrukturen sollen in einem nicht klar definierten Umfeld nachgebildet werden. 

 

Maschinelles Lernen: Ist eine Vorstufe der Künstlichen Intelligenz. Dabei wird Wissen aus Erfahrung (d.h. aus vorangegangenen Datenanalysen) generiert. Systeme können nach Beendigung der Lernphase verallgemeinern. Gelerntes Wissen kann auf neue, bisher unbekannte Daten übertragen werden. 

  

Open Data: Daten, die von der Allgemeinheit eingesehen, analysiert, weiterverwendet und auch weiterverbreitet werden dürfen.

Kommentare

Keine Kommentare

Kommentar schreiben

* Diese Felder sind Pflichtfelder