O que é um plano de gerenciamento de dados (DMP)?

Jovem mulher concentrada trabalhando com relatório econômico

O que é um DMP?

Um plano de gerenciamento de dados (DMP) é um documento que define como os dados serão tratados ao longo do ciclo de vida de um projeto, ou seja, desde sua aquisição até o arquivamento.

Embora esses documentos sejam geralmente usados em projetos de pesquisa para atender a exigências de financiadores, também podem ser aproveitados em ambientes corporativos para criar estrutura e alinhamento entre stakeholders.

Como os DMPs destacam os tipos de dados que serão usados no projeto e abordam seu gerenciamento ao longo do ciclo de vida dos dados, stakeholders (como as equipes de controle) podem fornecer feedback claro sobre o armazenamento e a disseminação de dados sensíveis, como informações pessoalmente identificáveis (PII), logo no início de um projeto. Esses documentos ajudam as equipes a evitar riscos de conformidade e regulamentação, e podem servir como modelos sobre como abordar e gerenciar dados em projetos futuros.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

Componentes de um plano de gerenciamento de dados

Um plano de gerenciamento de dados normalmente possui cinco componentes:

1. Uma declaração de propósito
2. Definições de dados
3. Coleta e acesso a dados
4. Perguntas frequentes (FAQs)
5. Limitações dos dados de pesquisa

Cada uma dessas áreas permite que agências de pesquisa e financiadores (ou talvez sua equipe de gerenciamento de dados) avaliem o nível de risco associado a um projeto. O DMP também aborda como esse risco será gerenciado. Por exemplo, se forem utilizados dados sensíveis em um projeto, seria apropriado reutilizá-los em projetos futuros? Dependendo da sensibilidade dos dados, pode não ser apropriado — ou pode exigir consentimento adicional dos usuários.

Cada componente de um plano de gerenciamento de dados foca em um tipo específico de informação, e vamos analisar cada um deles a seguir.

1. Declaração de propósito: explica por que a equipe precisa adquirir tipos específicos de dados ao longo do projeto. Deve apresentar com clareza a pergunta que a equipe está tentando responder com esse conjunto de dados.

2. Definições de dados: as descrições dos dados ajudam os usuários finais e seus públicos a entender as convenções de nomenclatura e sua correspondência com conjuntos de dados específicos. Parte dessas informações também pode estar contida nos metadados, que normalmente identificam os dados por suas fontes e formatos de arquivo. Criar e seguir padrões predefinidos de metadados durante o processo de aquisição de dados também garante uma coleta mais consistente e uma integração mais fluida.

3. Coleta e acesso aos dados: esta seção de um DMP destaca como os dados serão coletados, armazenados e acessados a partir de um repositório. Provavelmente abordará a fonte de dados existentes ou a abordagem que será adotada para criar novos dados, como um experimento. Também deve conter informações sobre o tempo dos dados — ou seja, com que frequência serão atualizados e por quanto tempo. O tipo e a periodicidade dos dados geralmente determinam seu armazenamento e acesso por terceiros. Por exemplo, dados não estruturados exigirão um sistema não relacional, enquanto dados estruturados podem ser armazenados em um sistema relacional. Também pode haver restrições em torno do compartilhamento de dados devido à privacidade ou direitos de propriedade intelectual. Como os stakeholders do projeto esperam que dados sensíveis, como informações de identificação pessoal (PII), sejam tratados com o máximo cuidado e segurança, é importante que os responsáveis pelos dados deixem claras suas práticas de gerenciamento, especialmente nessa área. Isso incluirá respostas sobre a preservação de longo prazo, como arquivamento ou reutilização dos dados. Para dados que não sejam sensíveis, espera-se que exista um caminho para que terceiros possam acessar os dados brutos e os resultados da pesquisa.

4. Perguntas frequentes (FAQs): esta seção funciona como um "guarda-chuva" para outras questões comuns em projetos de gerenciamento de dados, como planos de compartilhamento, preferências de citação e métodos de backup. Pesquisadores ou responsáveis pelos dados podem também destacar identificadores digitais (DOI) de proprietários de projetos relacionados. Além disso, se os proprietários do projeto estiverem arquivando dados, eles também precisarão lidar com a duração da existência do arquivo. Ele existirá por um ano, cinco anos ou talvez indefinidamente?

5. Limitações dos dados de pesquisa: esta seção aborda as limitações iniciais do conjunto de dados, que restringem sua capacidade de generalização para outras populações. Por exemplo, os dados podem focar em um recorte específico, como uma região geográfica, gênero, raça, faixa etária etc.

Mixture of Experts | 12 de dezembro, episódio 85

Decodificando a IA: resumo semanal das notícias

Participe do nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Quem usa planos de gerenciamento de dados?

Planos de gerenciamento de dados são predominantemente usados em contextos acadêmicos, especialmente em programas financiados por órgãos federais como o National Institutes of Health (NIH) e a National Science Foundation (NSF). No entanto, empresas também podem utilizá-los em suas funções de pesquisa ou governança de dados. Enquanto acadêmicos e pesquisadores precisam cumprir os requisitos do financiador em solicitações de financiamento, muitas instituições de pesquisa criam uma ferramenta DMP para fornecer aos participantes o modelo relevante para seu projeto de pesquisa. Equipes de governança de dados dentro de organizações podem adotar protocolos semelhantes para receber solicitações de dados de stakeholders que defendem novas iniciativas.

Casos de uso de gerenciamento de dados

Candidaturas a subsídios

Pesquisadores dos setores público e privado recorrem a diferentes agências de fomento para patrocinar iniciativas de pesquisa e inovação. Os DMPs (planos de gerenciamento de dados) mitigam riscos para ambas as partes, garantindo que os responsáveis pelos dados tenham avaliado tanto o valor quanto sua responsabilidade pessoal (ou seja, medidas de segurança e recuperação de desastres) no gerenciamento dos dados de pesquisa.

Iniciativas de gestão de dados

Os planos de gerenciamento de dados também são extremamente úteis para novas iniciativas de dados em ambientes corporativos, ajudando todos os stakeholders a compreenderem a importância de novas fontes de dados e como elas podem se relacionar com os resultados de negócios. À medida que avanços em nuvem híbrida, inteligência artificial, internet das coisas (IoT) e edge computing continuam a impulsionar o crescimento de big data, as empresas precisarão encontrar formas de gerenciar essa complexidade em seus sistemas de dados.

Soluções relacionadas
Software e soluções de gerenciamento de dados

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

Explore soluções de gerenciamento de dados
IBM watsonx.data™

O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.

Conheça o watsonx.data
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights que ofereça vantagens para os negócios.

Conheça os serviços de análise de dados
Dê o próximo passo

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

Explore soluções de gerenciamento de dados Conheça o watsonx.data