Datenwissenschaft wird als Disziplin betrachtet, während Data Scientists die Praktiker innerhalb dieser Disziplin sind. Data Scientists sind nicht unbedingt direkt für alle Prozesse im Data-Science-Lebenszyklus verantwortlich. Beispielsweise werden Datenpipelines in der Regel von Dateningenieuren verwaltet. Data Scientists können jedoch Empfehlungen darüber abgeben, welche Arten von Daten nützlich oder erforderlich sind. Zwar können Data Scientists maschinelle Lernmodelle erstellen, aber die Skalierung dieser Bemühungen auf einer größeren Ebene erfordert mehr Software-Engineering-Kenntnisse, damit ein Programm schneller ausgeführt werden kann. Daher ist es üblich, dass ein Data Scientist mit Ingenieuren für maschinelles Lernen zusammenarbeitet, um Modelle für maschinelles Lernen zu skalieren.

Die Aufgaben eines Data Scientist können sich häufig mit denen eines Datenanalysten überschneiden, insbesondere in der Phase der explorativen Datenanalyse und Datenvisualisierung. Die Fähigkeiten eines Data Scientist sind jedoch in der Regel breiter als die eines durchschnittlichen Datenanalysten. Genauer gesagt, nutzen Datenwissenschaftler gängige Programmiersprachen wie R und Python, um verstärkt statistische Inferenzen und Datenvisualisierungen durchzuführen.

Um diese Aufgaben zu erfüllen, benötigen Data Scientists Kenntnisse in Informatik und den reinen Naturwissenschaften, die über die von typischen Business Analysts oder Datenanalysten hinausgehen. Der Data Scientist muss auch die Besonderheiten des Unternehmens erfassen, wie z. B. Automobilbau, E-Commerce oder Gesundheitswesen.

Kurz gesagt, ein Data Scientist muss in der Lage sein:

Genug über das Unternehmen zu wissen, um sachdienliche Fragen zu stellen und Problembereiche des Unternehmens zu erkennen.

Statistik und Informatik in Verbindung mit geschäftlichem Sachverstand auf die Datenanalyse anzuwenden.

Eine breite Palette von Tools und Techniken zur Vorbereitung und Extraktion von Daten einzusetzen – von Datenbanken und SQL über Data Mining bis hin zu Datenintegrationsmethoden.

Erkenntnisse aus Big Data mithilfe von prädiktiven Analysen und künstlicher Intelligenz (KI) zu extrahieren, einschließlich Modellen für maschinelles Lernen, Verarbeitung natürlicher Sprache und Deep Learning.

Programme zur Automatisierung von Datenverarbeitung und -berechnungen zu schreiben.

Geschichten zu erzählen und zu illustrieren, die Entscheidungsträgern und Stakeholdern auf verschiedenen Ebenen des technischen Verständnisses die Bedeutung der Ergebnisse klar zu vermitteln.

Zu erläutern, wie die Ergebnisse zur Lösung von Geschäftsproblemen verwendet werden können.

Mit anderen Mitgliedern des Data-Science-Teams zusammenzuarbeiten, z. B. mit Daten- und Geschäftsanalysten, IT-Architekten, Dateningenieuren und Anwendungsentwicklern.

Diese Skills sind sehr gefragt, weshalb viele Personen, die eine Karriere im Bereich Data Science anstreben, verschiedene Data-Science-Programme, wie Zertifizierungsprogramme, Data-Science-Kurse und Studiengänge, die von Bildungseinrichtungen angeboten werden, ausprobieren.