Be Equal

Mulheres na Tecnologia: Cientista de Dados

Compartilhe:

Neste segundo post da nossa série Mulheres na Tecnologia, você conhecerá o trabalho de uma cientista de dados dentro da consultoria e verá como começar seus estudos nessa área.

Conheça o trabalho de uma cientista de dados dentro da consultoria e confira 6 pontos de conhecimento para começar seus estudos nessa área.

História pessoal e cenário: a trajetória de uma cientista de dados

Eu, Bruna Meneguzzi, consultora e cientista de dados na IBM, vou contar para vocês um pouco da minha história: como entrei na ciência de dados e como vocês também podem entrar!

Meu primeiro contato com a ciência de dados foi dentro da faculdade: me formei em ciência da computação na USP. Fiquei muito feliz quando consegui entrar no estágio da IBM como cientista de dados no programa Associates. Uma área incrível, uma equipe mais ainda. Temos muitas mulheres no time, mas esse não é o cenário que costumamos encontrar no mercado de trabalho.

Segundo o Global Gap Gender Report 2021, a representatividade feminina no cargo de Analista de Dados é abaixo de 45%. Quando falamos de cargos menos abrangentes, essa porcentagem diminui.

Nos cargos de Cientista de Dados e Consultora de Dados (os que eu preencho na IBM), temos menos de 35%. Esse valor fica abaixo de 25% quando falamos de cargos de Engenheira de Dados, Especialista em Inteligência Artificial e Desenvolvedora de Big Data.

A Ciência de Dados

Em sua essência, a ciência de dados é a preparação e análise de dados visando a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão.

Em um projeto, precisamos entender os objetivos e as perguntas que queremos responder. Quando falamos de dados, as principais perguntas que nos deparamos são:

  • O que aconteceu?
  • Por que aconteceu?
  • O que vai acontecer?
  • O que fazer?

Os tipos de análise na Ciência de Dados

As perguntas apresentadas acima definem o tipo de análise que será feita. Vou mostrar quais são as análises que temos a partir de um exemplo.

Vamos supor que uma empresa de refrigerantes quer entender por que o consumo de seu produto diminuiu durante a pandemia e quais ações podem tomar para mudar esse cenário. Dessa forma, a pergunta que queremos responder é: O que fazer?

Para respondermos, podemos passar por todos os tipos de análise:

O que aconteceu nós já sabemos: as vendas do refrigerante em questão diminuíram. Nesse momento, fazemos uma Análise Descritiva. Ou seja, descrevemos o nosso cenário, verificando, por exemplo, o quanto a empresa vendia antes e o quanto passou a vender.

Vamos no perguntar, então: Por que aconteceu? Nesse ponto, fazemos uma Análise Diagnóstica: vamos entender o cenário ao redor da diminuição das vendas, verificando perfil dos compradores, alteração na renda deles, produtos similares no mercado e tentar entender o porquê de as pessoas estarem comprando menos o produto.

Podemos prever o quanto esse cenário irá se estender e como será o comportamento do preço dos ingredientes. Essa é a Análise Preditiva, que nos mostra o que irá acontecer.

Por fim, temos a Análise Prescritiva, que nos responde à pergunta principal: O que fazer? Nesse momento, resgatamos muito trabalho das análises anteriores para criarmos cenários e identificarmos ações de mudança.

O que uma cientista de dados precisa estudar? 6 pontos de conhecimento para começar na área

Vendo tudo isso, parece que precisamos saber muita coisa em cada etapa. Mas, como diria o Chapolin “calma, calma! Não criemos pânico!”. Eu trouxe os principais pontos de conhecimento e, consequentemente, o que estudar para entrar na área:

  1. Linguagem de programação: é uma base muito importante, pois usamos códigos na modelagem. O Python é a linguagem de maior uso, mas o R e a Julia também são muito utilizados;
  2. Estatística: conceitos básicos são importantes para entendermos os dados que foram coletados e como os modelos funcionam;
  3. Banco de dados: saber consultar bancos de dados é interessante, principalmente os dados guardados em tabelas (linguagem SQL);
  4. Visualização de dados: importante saber como construir gráficos e quais são as principais ferramentas utilizadas (ex: PowerBI);
  5. Aprendizado de máquina: quanto mais modelos você conhecer, mais ferramentas você tem para resolver seus problemas;
  6. Conhecimento de negócio: dentro ou fora da consultoria, cada “cliente” tem termos e objetivos próprios aos quais devemos nos atentar.

Cada tópico desses acima possui inúmeros cursos na internet, mas a melhor dica que eu posso dar é: mergulhe na área! Conheça pessoas que trabalham, procure um mentor, pratique! A ciência de dados é conhecida pela colaboração entre seus estudiosos, então, contem conosco!

Para finalizar, prever a quantidade de café solúvel que será produzida por uma máquina, verificar padrões de perfis de clientes, criar gráficos relacionados a mapas são alguns exemplos de como a ciência de dados pode ajudar nas tomadas de decisão de uma empresa.

Saiba mais

Espero que esse post tenha sido um “mini guia” sobre a área e torço para que ela seja preenchida cada vez mais por mulheres. Se você ficou interessada por esse universo da ciência de dados e gostaria de ingressar na área, se inscreva no nosso banco de talentos.

Acompanhe os posts da série #Mulheres na Tecnologia aqui no blog!

Vamos conversar

Entre em contato com um representante da IBM.

Referências:
World Economic Forum – Global Gender Gap Report 2021

Data Science Consultant at IBM

Leia mais sobre

Descubra como o IBM Instana pode melhorar a visibilidade do seu ambiente

Observabilidade é a capacidade de entender o que está acontecendo dentro de um sistema com base nas informações que podemos medir do lado de fora dele.  Isso significa que, se um sistema é observável, podemos entender seu comportamento interno com base nas suas saídas externas. É como olhar para o painel de controle de um […]

Entendendo Observabilidade: Tudo o que você precisa saber!

Hoje eu quero falar sobre Observabilidade. Quando você escuta a palavra observabilidade, o que você pensa? Observabilidade é a capacidade de entender e diagnosticar o comportamento de um sistema a partir dos dados coletados a partir dele mesmo. Em outras palavras, é a capacidade de monitorar e compreender o que está acontecendo em seu sistema. […]

Transforme Sua Análise de Dados com a Data Fabric: Demonstração Prática

Um Data fabric ou malha de dados é uma arquitetura que simplifica o acesso aos dados, para que a organização consuma dos dados por autoatendimento. Para essa arquitetura, os ambientes, processos, utilitários e áreas geográficas dos dados são indiferentes, e ela consegue integrar recursos para gerenciamento dos dados de ponta a ponta. A malha de […]