Bei Big Data handelt es sich um eine große Menge an strukturierten und unstrukturierten Daten. Die Daten zeichnen sich vor allem durch ihre Größe, Komplexität, Schnelllebigkeit sowie die grundsätzlich schwache Strukturierung aus. Daneben geht es bei Big Data auch um neue und explizit leistungsstarke IT-Lösungen und Systeme, mit denen Unternehmen die Informationsflut vorteilhaft verarbeiten können.
Diese großen Datenmengen können für Unternehmen hilfreich sein, da große Datenmengen zur Erkenntnisgewinnung analysiert und auf deren Grundlage bessere Entscheidungen getroffen werden können. Das Unternehmen kann strategisch danach ausgerichtet werden.
Der Begriff „Big Data“ lässt sich hinsichtlich drei verschiedener Dimensionen definieren:
In jüngster Zeit wird die Definition um die beiden Bezeichnungen Value und Validity ergänzt. Diese stehen für den Mehrwert, den das Unternehmen durch diese Daten generiert sowie die Datenqualität, die im Betrieb sicherzustellen ist.
Big Data ist ein recht junges und somit höchst modernes Konzept. Jedoch begann man bereits in den 1960er- und 1970er mit der Datenverarbeitung. Dies geschah im Kontext der Einrichtung erster Rechenzentren und der Entwicklung einer relationalen Datenbank.
In der Mitte der 2000er-Jahre, in etwa im Jahr 2005, erkannte man das Potenzial der Menge an generierten Daten über Plattformen wie Facebook, YouTube und andere Online-Dienste. Dies veranlasste die Entwicklung von Hadoop. Bei Hadoop handelt es sich um in Open-Source-Framework, das speziell für die Speicherung und Analyse von umfangreichen Datensätzen ausgelegt ist.
Mit der Entwicklung weiterer Analyse-Tools nahm auch das Vorkommen von Big Data zu. Die entwickelten Tools vereinfachten die Datenanalyse und -verarbeitung zunehmend und senkten immer mehr die Speicherkosten.
Mit der fortschreitenden Digitalisierung nahmen auch potenzielle Datenquellen zu. So bildet sich Big Data nicht nur durch die aktive Eingabe von Daten durch den Nutzer heraus. Durch das Internet of Things sind mehr Objekte und Geräte mit dem Internet verbunden und sammeln Daten zu Nutzungsmustern der Kunden und zur Produktleistung. Die Einführung des maschinellen Lernens, auch Künstliche Intelligenz oder KI genannt, hat zu noch mehr Daten geführt.
Zusammenfassend lässt sich sagen, dass heutzutage zahlreiche Quellen zur Datengenerierung vorliegen; die Möglichkeiten zur Nutzung dieser Daten steht jedoch nach am Anfang. So nutzen schon viele Unternehmen Big Data zur Optimierung ihres Geschäfts, jedoch bestehen immer noch Barrieren und sowohl rechtlich als auch ethisch nicht einfach zu klärende Fragen bezüglich Big Data.
Big Data ist nicht nur hinsichtlich seiner verfügbaren Menge, sondern auch hinsichtlich dessen Nutzung interessant. Daten können aus beliebigen Quellen generiert und anschließend analysiert werden. Mit Big Data können Kosten gesenkt, Zeit gespart, neue Produkte und Angebote entwickelt und optimiert und effektivere geschäftliche Entscheidungen getroffen werden. So können beispielsweise die Ursachen für Fehlfunktionen, Probleme und Defekte früh erkannt werden. Auf dieser Grundlage lassen sich schnell effektive Lösungswege entwickeln.
Besonders interessant ist Big Data für die Business Intelligence (BI). BI befasst sich mit der Analyse gesammelter Daten, indem auf systematische Ansätze und neue Softwarelösungen zur Bewertung großer Datenmengen zurückgegriffen wird. Die dazu verwendete Software ist in der Lage, parallel große Datenbestände zu bearbeiten. Zu den Grundfunktionen dieser Softwares zählen die Verarbeitung großer Datensätze, der schnelle Import neuer Daten, die schnelle Abfrage und Suche von Daten, parallele Bearbeitung von Abfragen und die Analyse verschiedener Informationstypen. Somit repräsentiert Big Data Analysis auch einen der wichtigsten Trends innerhalb der BI-Software-Branche.
Nicht nur die Wirtschaft, sondern auch weitere Bereiche versprechen sich Vorteile durch die Analyse von Big Data. Die Wissenschaft profitiert von Big Data insofern, dass die Untersuchung des Klimawandels, Entstehens von Erdbeben und Epidemien als auch Massenphänomenen, wie Bevölkerungswanderungen, Verkehrsstaus und Shitstorms, erleichtert wird. Behörden und Geheimdienste analysieren große Datenmenge, um Abweichungen oder Auffälligkeiten festzustellen, die wiederum Hinweise auf Kriminelle oder Terroristen geben können.
Die für Big Data Analytics herangezogenen Daten können aus verschiedenen Quellen stammen. So fungieren auch viele Alltagsgegenstände als Datenquelle – in etwa Smart Homes, vernetzte Fahrzeuge, Wearables, Smartwatches, Smartphones, Kundenkarten und viele weitere vernetzte Geräte und Plattformen. Da es sich um persönliche und vertrauliche Daten handelt, kommt es oft zu Konflikten bezüglich Daten- und Persönlichkeitsschutz. So möchten insbesondere öffentliche Marktteilnehmer die gesammelten Daten auswerten, um zusätzliche und tiefgreifende Erkenntnisse zu erhalten. Einen Ausweg aus diesem Interessenkonflikt bietet die Anonymisierung der Daten.
Big Data ist in Hinsicht auf Datenschutz und das Persönlichkeitsrecht kritisch zu betrachten. In vielen Fällen liegt seitens der Betroffenen kein Einverständnis zur Verarbeitung der Daten vor beziehungsweise besteht bei vielen kein direktes Bewusstsein darüber, an welcher Stelle Daten gesammelt werden. Zudem ist es an einigen Stellen auch möglich, über die gesammelten Daten Rückschlüsse auf die Person zu ziehen.
Zudem besteht schnell die Gefahr, dass aus neutralen Informationen problematische Rückschlüsse gezogen werden können. So kann der Wohnsitz in einem problematischen Stadtviertel oder die Wahl bestimmter Weiterbildungen dazu führen, dass eine Person als kreditunwürdig und risikobehaftet eingestuft wird.
Die Informationsethik beschäftigt sich mit moralischen Fragen, die durch Big Data aufgeworfen werden und zu unerwünschten Konsequenzen führen. Die Konsequenzen, die durch Big Data auftreten können, sind digitale Bevormundung und stetige Kontrolle, eingeschränkte informationelle Autonomie und mangelnde Informationsgerechtigkeit. Zusätzlich stellen Datenschutzgesetze und -einrichtungen den Verbraucherschutz sicher und verhindern ein Stück weit auch mögliche Risiken.
Wie schon angeklungen ist, bietet Big Data enorme Vorteile für Unternehmen, weshalb dort zumeist Datenverarbeitung zur Optimierung des Geschäfts vorgenommen wird. Die Datenerhebung kann ein komplizierter Vorgang sein, weshalb es sinnvoll ist, eine Strategie zu entwickeln, mit der sich die riesige Datenmenge einfach strukturieren und bearbeiten lässt.
Zunächst muss eine Big-Data-Strategie festgelegt werden. Sprich, es soll ein Plan ausgearbeitet werden, mit dem ein Überblick über die Art und Weise der Datenerfassung, Datenspeicherung, Datenverwaltung und (gemeinsamen) Datennutzung innerhalb und außerhalb der Organisation verschafft werden soll. Dadurch sollen in allen Bereichen Verbesserungen erzielt werden.
Des Weiteren sollte beachtet werden, dass jede Daten-Quelle unterschiedliche Datenarten zu unterschiedlichen Bedingungen hervorbringt. Die aus IoT-Anwendungen gewonnenen Daten werden von IT-Systemen aufgefangen. Beim Eintreffen dieser Big Data gilt es, sie zu analysieren und zu entscheiden, welche Daten gespeichert bzw. verworfen und welche noch genauer analysiert werden müssen. Bei aus Social Media stammenden Daten handelt es sich um solche in Form von Bildern, Videos, Sprache, Text und Ton. Diese Daten sind besonders nützlich für das Marketing, den Vertrieb und Support. Aufgrund ihrer un- oder halbstrukturierten Form stellen diese Daten eine Herausforderung bei der Nutzung und Analyse dar. Daneben gibt es auch öffentlich zugängliche Daten aus offenen Datenquellen, die in riesigen Mengen zur Verfügung stehen. Ansonsten wird Big Data auch aus Data Lakes oder Datenquellen in Clouds bzw. von Lieferanten oder Kunden geschöpft.
Moderne Computersysteme sind mit der nötigen Schnelligkeit, Rechenleistung und Flexibilität ausgestattet und sind somit in der Lage riesige Datenmengen und unterschiedliche Arten von Big Data zu verarbeiten. Zudem sollte ein Unternehmen über die nötigen Methoden zur Integration der Daten verfügen und dabei gleichzeitig die Datenqualität sicherstellen, für Data Governance und sachgerechte Speicherung sorgen und die Daten zur Analyse aufbereiten.
Es besteht zum einen die Möglichkeit, mit entsprechenden IT-Lösungen den gesamten Big Data-Bestand zu analysieren. Zum anderen kann im Voraus ermittelt werden, welche Daten relevant sind und ausgehend davon die entsprechenden Daten analysiert werden. Durch beide Analyse-Ansätze können Unternehmen wertvolle Erkenntnisse erschließen.
Es ist zudem wichtig, die enormen Datensätze zu filtern und analysieren, da das Speichern und die dafür erforderliche Speicherkapazitäten der Datensätze zu einem einen erheblichen Kostenfaktor bedeutet und zum anderen, können unbearbeitete Daten ein Haftungsgrund sein, wenn Informationen im Falle einer Compliance-Prüfung oder Klage nicht gefunden werden.
Das Sammeln und die Verarbeitung von Big Data hat neue Möglichkeiten der Unternehmensführung hervorgebracht. Die Analyse relevanter Datensätze schafft neue Einblicke in die Interessen, das Kaufverhalten und das Risikopotenzial von Kunden als auch potenziellen Interessenten.
Unternehmen können mithilfe der durch die Analyse herausgearbeiteten Informationen das Marketing, den Vertrieb und Support kundenspezifisch und ansprechend ausrichten und so Erfolge für das Unternehmen erzielen. Durch die Anwendung von Big Data ergeben sich enorme Wettbewerbsvorteile, weshalb Big Data mittlerweile ein wichtiger Bestandteil eines jeden erfolgreichen Unternehmens ist. Mit solchen Informationen gestaltet sich außerdem die Entwicklung der Industrie 4.0 einfacher, die Innovation schneller als auch die Prognose wirtschaftlicher Entwicklung zuverlässiger.