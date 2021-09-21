Los científicos de datos son expertos en extraer conocimientos y respuestas específicas de los sectores a partir de los datos. Cuentan con habilidades informáticas y de ciencias puras más allá de las de un analista empresarial o analista de datos típico, así como un profundo conocimiento de las especificidades del sector o disciplina empresarial en la que trabajan (como la fabricación de automóviles, el comercio electrónico o la sanidad).

Un científico de datos debe ser capaz de:

Conocer la empresa lo suficiente como para hacer las preguntas pertinentes e identificar los puntos débiles.





Aplicar la estadística y la informática, junto con la perspicacia empresarial, al análisis de datos.





Utilizar una amplia gama de herramientas y técnicas para preparar y extraer datos: desde bases de datos y SQL hasta minería de datos y métodos de integración de datos.





Extraer información de big data mediante análisis predictivos e inteligencia artificial (IA), incluidos modelos de machine learning, procesamiento del lenguaje natural y deep learning.





Escriba programas y algoritmos que automaticen el procesamiento de datos y los cálculos.





Contar e ilustrar historias que transmitan claramente el significado de los resultados a los responsables de la toma de decisiones y a los stakeholders en todos los niveles de comprensión técnica.





Explicar cómo pueden utilizarse los resultados para resolver problemas empresariales.





Colaborar con otros miembros del equipo de ciencia de datos, como analistas de datos y de negocio, arquitectos de TI, ingenieros de datos y desarrolladores de aplicaciones.

Estas habilidades tienen una gran demanda y, como resultado, muchas personas que se inician en una carrera de ciencia de datos exploran una variedad de programas de ciencia de datos, como programas de certificación, cursos de ciencia de datos y programas de grado ofrecidos por instituciones educativas.

Los científicos de datos no son necesariamente responsables directos de todos los procesos implicados en el ciclo de vida de la ciencia de datos. Por ejemplo, los ingenieros de datos suelen encargarse de los pipelines de datos, pero el científico de datos puede hacer recomendaciones sobre qué tipo de datos son útiles o necesarios. Aunque los científicos de datos pueden crear modelos de machine learning, la ampliación de estos esfuerzos a un nivel mayor requiere más habilidades de ingeniería de software para optimizar un programa de modo que se ejecute más rápidamente. Como resultado, es habitual que un científico de datos se asocie con ingenieros de machine learning para escalar los modelos de machine learning.

Las responsabilidades de los científicos de datos suelen solaparse con las de los analistas de datos, sobre todo en lo que respecta al análisis exploratorio y la visualización de datos. Sin embargo, las competencias de un científico de datos suelen ser más amplias que las del analista de datos medio. Comparativamente, los científicos de datos aprovechan lenguajes de programación comunes, como R y Python, para realizar más inferencia estadística y visualización de datos.