Cloud

Cloud macht aus Daten-Suchern echte Data Scientists

Noch vor einem Jahrzehnt gab es das Berufsbild des Data Scientist nicht. Mittlerweile zählt er zu den begehrtesten Jobs in der IT, gemessen an Gehalt, Arbeitszufriedenheit und Anzahl der Stellenangebote. Das Problem dabei ist, dass es einfach nicht genügend Data Scientists gibt, die den aktuellen, geschweige denn den zukünftigen Bedarf decken können. Laut einer IBM Studie  wird es weltweit im Jahr 2020 rund 700.000 offene Stellen für Data Scientists, Data Developer und Data Engineers geben.

Grund für die hohe Nachfrage an Datenanalyse-Experten ist das enorme Datenvolumen, mit dem Unternehmen heutzutage umgehen müssen. Jüngste Umfragedaten weisen darauf hin, dass Daten in Bereichen wie künstlicher Intelligenz, Analytik oder dem Internet der Dinge stark anwachsen. Etwa 20 Prozent dieser Daten sind strukturiert. Der Löwenanteil sind unstrukturierte Daten in Form von E-Mails, Social-Media-Inhalten, Bildern oder Videos. Diese sind erheblich schwieriger zu verwalten, zu sammeln und zu analysieren.

Schluss mit der 80:20-Regel
Wir leben in einer Datenökonomie – und um der Datenflut Herr zu werden, setzen immer mehr Unternehmen und Branchen weltweit auf die Cloud. Für die Datenauswertung stellen viele Unternehmen Data Scientists ein, die meist der 80:20-Regel folgen. Sie verbringen 80 Prozent ihrer Zeit damit, Daten zu finden, aufzubereiten und zu organisieren, und nur in den verbleibenden 20 Prozent kommen sie dazu, Daten tatsächlich zu analysieren.

Gut aufbereitete Daten in der Cloud sind für Data Scientists also entscheidend, um effizient zu arbeiten. Denn je weniger Zeit sie mit dem Suchen der Datenmassen verbringen, desto mehr Zeit bleibt ihnen, mit den Daten zu forschen. Data Scientists benötigen eine zentrale und zugängliche Plattform über alle Teams hinweg, bereitgestellt von ihren Unternehmen durch neue Cloud-Dienste und -Technologien. Dann verfügen sie bereits über die notwendigen Möglichkeiten, um die durch die Cloud-Technologie wachsenden Datenmengen zu analysieren und aus Informationen Einsichten für den Wandel von Unternehmen und Industrien abzuleiten. Denn im Gegensatz zum Suchen und Aufbereiten der Daten sind es gerade die Analyse und Bearbeitung der steigenden Menge an Datensätzen von Sensoren, Geräten oder Nutzern, die zur wichtigsten Aufgabe der Data Scientists gehören.

Data Scientists entlasten
Um das Verhältnis innerhalb der 80:20-Regel zugunsten der 20 Prozent Analyse zu verschieben, gibt es unterschiedliche Möglichkeiten. Beispielsweise können bestimmte Tools die Datenermittlung automatisieren und vereinfachen und ermöglichen eine langfristige Datenpflege (Datenkuration) und Daten-Governance. Intelligente Suchfunktionen erleichtern es den Data Scientists zusätzlich, die benötigten Daten zu finden. Metadaten, wie Tags, Kommentare oder numerische Angaben zur Datenqualität, können ihnen helfen, schneller zu entscheiden, ob ein Datensatz nützlich ist oder nicht. Eine integrierte Daten-Governance gibt den Data Scientists die Gewissheit, dass die Daten aus fundierten Quellen stammen und seine Modelle und Resultate auf einem soliden Datenfundament gebaut sind.

Ziel dieser Tools ist es, den Data Scientists auf Knopfdruck den benötigten Datensatz zuverlässig über die Cloud zur Verfügung zu stellen. Dadurch hat er wieder mehr Zeit für seine Forschung und kann mit seinen Daten noch mehr experimentieren. So kann er eine Vielzahl an Modellen aufstellen, anstatt sich aus Zeitgründen auf ein Modell fokussieren zu müssen, dass sich später womöglich als Sackgasse erweist.

Die Cloud gibt dem Data Scientist nicht nur mehr Spielraum, um die Daten zu testen und mit ihnen zu forschen, sondern unterstützt den Wissenschaftler auch, Modelle auf einfache Weise zu speichern. Er kann zentral auf sie zugreifen und sie beliebig erweitern, so dass Vorhandenes als Vorlage für neue Projekte genutzt werden kann und er das Rad nicht immer wieder neu erfinden muss.

Die Cloud eröffnet Data Scientists die Chance, sich viel von der Zeit zurückzuerobern, die sie bislang auf die Datensuche und Datenbereinigung aufgewendet haben. So können sie stattdessen Innovationen erarbeiten, die Unternehmen einen Wettbewerbsvorteil verschaffen und ihnen dabei helfen, sich und ihre Branche zu transformieren.

Add Comment
No Comments

Leave a Reply

Your email address will not be published.Required fields are marked *

More Cloud Stories

Robot-Recruiting: Die Chancen der technikgestützten Personalbeschaffung

Mit dem Begriff Robot Recruiting wird eine teilweise Automatisierung des Recruiting-Prozesses beschrieben. Anhand eines Algorithmus erfolgen Beurteilung und Auswahl geeigneter Bewerber. Dieser kann auch Jobinteressierten automatisiert offene Stellen empfehlen oder dem Unternehmen geeignete Bewerber vorschlagen. Kognitive Systeme können im Bereich Human Resources vielseitig eingesetzt werden. Als Bewerber steckt man viel Zeit und Mühe in die […]

Digitale Transformation: Wetter ist Geld

Wir reden nicht nur gerne über das Wetter, wir treffen auch unsere Entscheidungen danach: Während es im privaten Bereich darum geht, welche Kleidung wir tragen, wie wir unseren Flüssigkeitshaushalt managen oder ob wir schon die Heizung angestellt haben, hat das Wetter für Unternehmen eine hohe wirtschaftliche Bedeutung. Umsatzsteigerung oder auch Verluste hängen von ihm ab. […]

Software-Entwicklung in der Cloud – Abkürzung zur Digitalisierung

Software ist das Herz aller Innovationen im digitalen Zeitalter. Alle 20 Stunden wird in Berlin ein neues IT-Unternehmen gegründet. Eine neue Dating-App, ein Web-Portal für vegane Lebensmittel, eine Metasuche nach neuen Talenten für Unternehmen – an neuen, guten Ideen herrscht kein Mangel. Wie die aktuelle C-Suite-Studie 2016 des IBM Institute for Business Value gezeigt hat, […]