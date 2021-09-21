Les data scientists excellent dans l’extraction d’informations et de réponses spécifiques à un secteur à partir de données. Ils possèdent des compétences en informatique et en sciences pures qui dépassent celles d’un analyste commercial ou d’un analyste de données classique, ainsi qu’une compréhension approfondie des spécificités du secteur ou de la discipline commerciale dans lequel ils travaillent (comme la construction automobile, le commerce électronique ou les soins de santé).

Un data scientist doit pouvoir :

connaître suffisamment le secteur pour poser des questions pertinentes et identifier les points faibles de l’entreprise ;





appliquer les statistiques et l’informatique, ainsi que le sens des affaires, à l’analyse des données ;





utiliser un large éventail d’outils et de techniques pour préparer et extraire des données, depuis les bases de données et le langage SQL jusqu’au data mining et aux méthodes d’intégration de données ;





extraire des informations du big data à l’aide de l’analyse prédictive et de l’intelligence artificielle (IA), y compris les modèles de machine learning, le traitement automatique du langage naturel et l’apprentissage profond ;





écrire des programmes et des algorithmes qui automatisent le traitement de données et les calculs ;





raconter et illustrer des histoires qui transmettent clairement le sens des résultats aux décideurs et aux parties prenantes à tous les niveaux de compréhension technique ;





expliquer comment les résultats peuvent être utilisés pour résoudre les problèmes métier ;





Collaborez avec les autres membres de l’équipe de science des données, comme les analystes de données et métier, les architectes informatiques, les ingénieurs de données et les développeurs d’applications.

Ces compétences sont très demandées et, par conséquent, de nombreuses personnes qui se lancent dans une carrière en science des données explorent une variété de programmes en science des données, tels que des programmes de certification, des cours en science des données et des programmes diplômants proposés par des établissements d'enseignement.

Les data scientists ne sont pas nécessairement directement responsables de tous les processus impliqués dans le cycle de vie de la science des données. Par exemple, les pipelines de données sont souvent gérés par des ingénieurs de données, mais les data scientists peuvent faire des recommandations sur le type de données utiles ou requises. Bien que les data scientists puissent créer des modèles de machine learning, la généralisation de ces efforts nécessite davantage de compétences en ingénierie logicielle afin d’optimiser un programme afin qu’il s’exécute plus rapidement. Par conséquent, les data scientists collaborent fréquemment avec des ingénieurs en machine learning pour mettre à l’échelle des modèles de machine learning.

Les responsabilités d'un data scientist peuvent souvent se chevaucher avec celles d'un analyste des données, en particulier en ce qui concerne l'analyse exploratoire des données et la visualisation des données. Toutefois, les compétences d'un data scientist sont généralement plus étendues que celles d'un analyste de données moyen. Comparativement, le data scientist utilise des langages de programmation courants, tels que R et Python, pour effectuer davantage d'inférences statistiques et de visualisation de données.