O que é redundância de dados?

Imagem de formas variadas em um sistema de grade

Autores

Tom Krantz

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

O que é redundância de dados?

A redundância de dados ocorre quando várias cópias dos mesmos dados são armazenadas em diferentes locais, formatos ou sistemas.

Embora a redundância de dados não intencional possa levar a ineficiências, como aumento dos custos de armazenamento e inconsistências de dados, a redundância de dados intencional é um componente essencial do gerenciamento de dados eficaz. Isso é particularmente valioso nos dias de hoje, em que as organizações gerenciam grandes conjuntos de dados e volumes crescentes de dados. Cópias redundantes de dados são frequentemente fundamentais para o projeto e esquema de bancos de dados, ajudando a garantir alta disponibilidadeintegridade de dados e consistência.

A redundância de dados intencional também desempenha um papel crítico na recuperação de desastres. Por exemplo, em 2024, as violações de dados custaram às empresas uma média de US$ 4,88 milhões. Cópias de dados redundantes são cruciais em cenários de corrupção de dados ou falha de hardware, pois oferecem um backup confiável. No entanto, embora a redundância de dados e a recuperação de dados se concentram na prevenção da perda de dados, a redundância prioriza a disponibilidade de dados e a continuidade, enquanto a recuperação se concentra na restauração.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

Redundância de dados intencional versus não intencional

No gerenciamento de bancos de dados, há dois tipos de redundância de dados: intencional e não intencional:

Intencional

As organizações implementam deliberadamente a redundância de dados para melhorar a disponibilidade do sistema e proteger contra a perda de dados. Ao ajudar a garantir que os sistemas continuem funcionando mesmo em caso de falhas de hardware, a redundância de dados intencional aumenta a consistência de dados e atende aos requisitos de alta disponibilidade. Essas vantagens a tornam especialmente valiosa em sistemas de gerenciamento de bancos de dados relacionais (DBMS) e data warehouses.

Não intencional

A redundância de dados não intencional surge quando os sistemas criam dados duplicados inadvertidamente, o que leva a ineficiências. Por exemplo, cópias redundantes de dados podem aumentar os custos de armazenamento, causar discrepâncias na análise de dados e prejudicar o desempenho devido ao processo demorado de manter cópias desnecessárias de dados.

AI Academy

O gerenciamento de dados é o segredo para a IA generativa?

Explore por que é essencial ter dados de alta qualidade para utilizar a IA generativa com qualidade.

Benefícios da redundância de dados intencional

A redundância de dados intencional oferece vários principais benefícios que podem melhorar a qualidadesegurança e disponibilidade de dados:

  • Integridade de dados: cópias redundantes de dados ajudam os sistemas a se recuperarem de erros, falhas de hardware ou discrepâncias. Se um dado for corrompido, os sistemas poderão acessar rapidamente uma versão limpa e não corrompida de outra cópia, melhorando o acesso a dados e o tempo de atividade.

  • Consistência de dados: as cópias sincronizadas de dados críticos ajudam a manter as atualizações em todas as cópias de dados, evitando a inconsistência de dados. Isso é especialmente importante em ambientes que exigem altos níveis de consistência de dados, como armazenamento em nuvem ou sistemas de planejamento de recursos empresariais (ERP). 

  • Segurança de dados: cópias de dados redundantes protegem contra corrupção, perda ou violação de dados. Armazenar dados em diferentes locais ou sistemas de armazenamento ajuda a garantir que, se um sistema for comprometido, os dados ainda estejam acessíveis em outra fonte segura.

  • Eficiência operacional: a redundância de dados intencional melhora a eficiência operacional ao reduzir o downtime. Com cópias de dados redundantes, as empresas podem manter acesso a dados e a produtividade, mesmo quando ocorrem falhas ou interrupções de hardware.

 

Ferramentas e técnicas para redundância de dados intencional

Para implementar a redundância de dados intencional de forma eficaz, as organizações usam várias ferramentas e técnicas, como data replication, configurações de RAID e sistemas de arquivos distribuídos:

Configurações de RAID

A matriz redundante de discos independentes (RAID) combina várias unidades de disco rígido em uma única unidade. Essa tecnologia de armazenamento de dados melhora a redundância de dados e a tolerância a falhas, que é a capacidade do sistema de continuar funcionando mesmo durante falhas de componentes. 

O RAID 1, por exemplo, espelha os dados entre duas unidades, ajudando a garantir que, se uma unidade falhar, os dados permanecerão disponíveis. As configurações de RAID equilibram desempenho, capacidade de armazenamento e paridade, tornando-as ideais para ambientes com grandes conjuntos de dados.

Sistemas de arquivos distribuídos

Sistemas de arquivos distribuídos (DFS) armazenam dados em várias máquinas ou nós, replicando automaticamente os dados para ajudar a garantir redundância e alta disponibilidade. Essa arquitetura tolerante a falhas significa que, se um nó ou disco falhar, os dados ainda poderão ser acessados em outros nós, ajudando a garantir que o acesso a dados permaneça ininterrupto.

Replicação de dados

Data replication envolve a criação de cópias de dados em diferentes locais para ajudar a garantir a disponibilidade de dados. Pode ser em tempo real (síncrono) ou atrasado (assíncrono). A replicação de dados é crucial para fornecer acesso contínuo aos dados, especialmente em cenários de recuperação de desastres .

Riscos da redundância de dados não intencional

A redundância de dados não intencional apresenta vários riscos que podem afetar a qualidade, o desempenho e a segurança de dados, como:

  • Aumento dos custos de armazenamento: armazenar cópias de dados redundantes em vários sistemas ou locais aumenta os requisitos de espaço de armazenamento. Isso aumenta os custos de armazenamento, especialmente em ambientes de nuvem, onde o preço geralmente é baseado no volume de armazenamento de dados usado. 

  • Inconsistência de dados: quando as atualizações ou exclusões de dados não são sincronizadas corretamente, podem ocorrer inconsistências. Essas discrepâncias podem causar erros na recuperação de informações e na análise de dados, comprometendo a integridade do sistema e levando à geração de relatórios ou tomada de decisões incorretas.

  • Corrupção e perda de dados: cópias de dados redundantes, se não gerenciadas corretamente, podem aumentar o risco de corrupção de dados. Por exemplo, se a corrupção não for detectada e for replicada em todas as cópias de dados, isso afetará todo o conjunto de dados. Processos inadequados de replicação ou backup também podem deixar dados críticos vulneráveis à perda.

  • Degradação do desempenho: embora a replicação possa ajudar a garantir a consistência de dados, ela também pode introduzir latência quando as atualizações são feitas em várias cópias. Isso pode tornar a recuperação de dados mais lenta, principalmente em sistemas que lidam com grandes conjuntos de dados ou altos volumes de transações.

  • Riscos de segurança e conformidade: dados redundantes aumentam o número de vulnerabilidades potenciais, tornando os sistemas mais suscetíveis a ataques cibernéticos. Várias cópias de dados também podem violar os princípios de minimização de dados em regulamentações como a General Data Protection Regulation (GDPR) e a California Consumer Privacy Act (CCPA).

Táticas de mitigação para redundância de dados não intencional

Para lidar com a redundância de dados não intencional, as organizações podem empregar várias estratégias de mitigação, incluindo:

Normalização do banco de dados

A normalização do banco de dados organiza os dados em campos separados e relacionados para eliminar dados duplicados e reduzir a redundância. Esse processo ajuda a garantir que cada dado seja armazenado apenas uma vez, melhorando a integridade e a consistência de dados. Ela segue uma série de regras, geralmente categorizadas como primeira, segunda, terceira e quarta formas normais.

Eliminação de duplicações de dados

A deduplicação de dados identifica e remove dados duplicados em todos os sistemas, armazenando apenas uma única instância de cada entrada de dados. Ela é comumente usada em data centers e ambientes de armazenamento em nuvem para otimizar o espaço de armazenamento e reduzir os problemas de redundância.

Compressão de dados

A compactação de dados reduz o tamanho dos conjuntos de dados  ao eliminar elementos repetitivos. Essa técnica é amplamente utilizada em sistemas de backup, transmissão em rede e armazenamento em nuvem para otimizar o espaço de armazenamento e melhorar a eficiência da recuperação de dados. 

Master data management

O master data management (MDM) consolida dados de negócios essenciais em uma única fonte, melhorando a consistência de dados entre os sistemas. Ele cria um registro mestre para entradas de dados importantes, como clientes, produtos e funcionários, o que elimina dados duplicados e reduz a redundância.

Vinculação de dados

A vinculação de dados usa chaves externas em sistemas de gerenciamento de bancos de dados (DBMS) para criar relações entre campos de dados, reduzindo a redundância. Por exemplo, os dados do cliente podem ser armazenados em uma tabela "cliente", com pedidos vinculados ao cliente por meio da ID do cliente para ajudar a garantir que os dados sejam precisos e consistentes.

Redundância de dados versus recuperação de dados

Embora a redundância de dados e a recuperação de dados lidem com a perda de dados, elas atendem a propósitos diferentes. A redundância de dados é frequentemente usada como uma estratégia proativa. Ela ajuda a garantir alta disponibilidade e minimiza o downtime ao armazenar cópias de dados redundantes em vários locais.

No entanto, a recuperação de dados é um processo reativo. Ela restaura os dados após incidentes como corrupção de dados, exclusão acidental ou ataques cibernéticos. Existem vários métodos de recuperação de dados usados para recuperar dados perdidos e restaurar sistemas para um estado anterior, incluindo:

  • Backups de dados: os backups regulares armazenam cópias de dados separadamente do sistema principal, geralmente em ambientes de armazenamento externo ou em nuvem. Esses backups são essenciais para a recuperação de desastres, ajudando a garantir a restauração de dados em caso de falha ou corrupção.

  • Instantâneos: os instantâneos criam cópias pontuais de dados, capturando o estado exato dos dados no momento em que são tirados. Essa técnica facilita a recuperação de dados rápida em ambientes virtualizados e auxilia na recuperação de desastres sem a necessidade de backups completos.

  • Proteção contínua de dados: os sistemas de proteção contínua de dados (CDP) rastreiam as alterações nos dados no nível de bloco, ajudando a garantir que somente os blocos de dados modificados sejam atualizados. Os sistemas CDP operam em tempo real para preservar os dados mais recentes e incluem recursos de deduplicação para reduzir cópias de dados desnecessárias, otimizando o espaço de armazenamento.
Soluções relacionadas
Software e soluções de gerenciamento de dados

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

Explore soluções de gerenciamento de dados
IBM watsonx.data™

O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.

Conheça o watsonx.data
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights que ofereça vantagens para os negócios.

Conheça os serviços de análise de dados
Dê o próximo passo

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

Explore soluções de gerenciamento de dados Conheça o watsonx.data