O que é o etcd?

O etcd é um armazenamento de chaves-valores distribuído de código aberto usado para manter e gerenciar as informações críticas de que os sistemas distribuídos precisam para continuar funcionando. Mais notavelmente, ele gerencia os dados de configuração, dados de estado e metadados do Kubernetes, a popular plataforma de orquestração de contêineres.

Assim como todas as cargas de trabalho distribuídas, as cargas de trabalho conteinerizadas têm requisitos de gerenciamento complexos, que se tornam mais complexos à medida que a carga de trabalho escala. O Kubernetes simplifica o processo de gerenciamento dessas cargas de trabalho, ao coordenar tarefas como configuração, implementação, descoberta de serviços, balanceamento de carga, agendamento de trabalhos e monitoramento de integridade em todos os clusters, que podem ser executados em várias máquinas em vários locais.

Mas, para alcançar essa coordenação, o Kubernetes precisa de um armazenamento de dados que forneça uma fonte única e consistente da verdade sobre o status do sistema (todos os seus clusters e os pods e as instâncias de aplicações dentro deles) a qualquer momento. O etcd é o armazenamento de dados usado para criar e manter essa versão da verdade.

O etcd desempenha uma função semelhante para o Cloud Foundry(a plataforma como serviço (PaaS)de multinuvem de código aberto) e é uma opção viável para coordenar sistemas e metadados críticos em clusters de qualquer aplicação distribuída. O nome "etcd" vem de uma convenção de nomenclatura dentro da estrutura de diretórios do Linux: no UNIX, todos os arquivos de configuração do sistema para um único sistema estão contidos em uma pasta chamada "/etc;" "d" significa "distribuído".

As mais recentes notícias de tecnologia, corroboradas por insights de especialistas.

Mantenha-se atualizado sobre as tendências mais importantes (e intrigantes) do setor em IA, automação, dados e muito mais com o boletim informativo Think. Consulte a Declaração de privacidade da IBM.

Por que o etcd?

Não é uma tarefa pequena servir como a espinha dorsal de dados que mantém uma carga de trabalho distribuída em execução. Mas o etcd foi desenvolvido para a tarefa, projetado desde o início para as seguintes qualidades:

Totalmente replicado: todos os nós em um cluster do etcd têm acesso ao armazenamento de dados completo.
Altamente disponível: o etcd foi projetado para não ter um único ponto de falha e tolerar facilmente falhas de hardware e partições de rede.
Consistentemente confiável: cada "leitura" de dados retorna a "gravação" mais recente de dados em todos os clusters.
Rápido: o etcd foi comparado com 10.000 gravações por segundo.
Seguro: o etcd é compatível com autenticação automática de certificado de cliente Transport Layer Security (TLS) e Secure Socket Layer (SSL) opcional. Como o etcd armazena dados de configuração vitais e altamente confidenciais, os administradores devem implementar controles de acesso baseados em funções dentro da implementação e garantir que os membros da equipe que interagem com o etcd sejam limitados ao nível de acesso menos privilegiado necessário para executar seus trabalhos.
Simples: qualquer aplicação, desde aplicativos da web simples até mecanismos de orquestração de contêineres altamente complexos, como o Kubernetes, pode ler ou gravar dados no etcd usando ferramentas HTTP/JSON padrão.

Observe que, como o desempenho do etcd depende muito da velocidade do disco de armazenamento, é altamente recomendável usar SSDs em ambientes do etcd.

AI Academy

O gerenciamento de dados é o segredo para a IA generativa?

Explore por que é essencial ter dados de alta qualidade para utilizar a IA generativa com qualidade.

Acessar o episódio

Algoritmo de consenso Raft

O etcd é construído com base no algoritmo de consenso Raft para garantir a consistência do armazenamento de dados em todos os nós em um cluster, algo essencial para um sistema distribuído tolerante a falhas.

O Raft alcança essa consistência por meio de um nó líder que gerencia a replicação para os outros nós no cluster, chamados de seguidores. O líder aceita solicitações dos clientes, que, então, encaminha para os nós seguidores. Depois que o líder verifica que a maioria dos nós seguidores armazenou cada nova solicitação como uma entrada de log, ele aplica a entrada à sua máquina de estado local e retorna o resultado dessa execução (uma “gravação”) ao cliente. Se os seguidores travarem ou os pacotes de rede forem perdidos, o líder tentará novamente até que todos os seguidores tenham armazenado todas as entradas de log de forma consistente.

Se um nó seguidor não receber uma mensagem do líder dentro de um intervalo de tempo especificado, é realizada uma eleição para escolher um novo líder. O seguidor declara-se candidato, e os outros seguidores votam nele ou em qualquer outro nó com base em sua disponibilidade. Depois que o novo líder é eleito, começa a gerenciar a replicação, e o processo se repete. Esse processo permite que todos os nós do etcd mantenham cópias do armazenamento de dados altamente disponíveis e de forma consistente.

etcd e Kubernetes

O etcd está incluído entre os principais componentes do Kubernetes e serve como o principal armazenamento de chaves-valores para criar um cluster do Kubernetes funcional e tolerante a falhas. O servidor de APIs do Kubernetes armazena os dados de estado de cada cluster no etcd. O Kubernetes usa a função "watch" do etcd para monitorar esses dados e se reconfigurar quando ocorrem alterações. A função "watch" armazena valores que representam o estado real e ideal do cluster e pode iniciar uma resposta quando eles divergirem.

Para ter uma visão geral de alto nível de como o Kubernetes gerencia clusters, serviços e nós de trabalho, confira nosso vídeo "Kubernetes explicado":

CoreOS e a história e manutenção do etcd

O etcd foi criado pela mesma equipe responsável por projetar o CoreOS Container Linux, um sistema operacional de contêineres amplamente usado, que pode ser executado e gerenciado de forma eficiente em escala maciça. Originalmente, eles criaram o etcd no Raft para coordenar várias cópias do Container Linux simultaneamente, para garantir o tempo de atividade ininterrupto das aplicações.

Em dezembro de 2018, a equipe doou o etcd para a Cloud Native Computing Foundation (CNCF), uma organização sem fins lucrativos neutra que mantém o código fonte, domínios, serviços hospedados, infraestrutura de nuvem e outras propriedades do projeto do etcd como recursos de código aberto para a comunidade de desenvolvimento de nuvem baseada em contêineres. CoreOS se fundiu com o Red Hat.

etcd versus ZooKeeper versus Consul

Outros bancos de dados foram desenvolvidos para gerenciar informações de coordenadas entre clusters de aplicações distribuídas. Os dois mais comumente comparados ao etcd são o ZooKeeper e Consul.

ZooKeeper

O ZooKeeper foi originalmente criado para coordenar dados e metadados de configuração nos clusters do Apache Hadoop. (O Apache Hadoop é uma framework de código aberto, ou coleção de aplicações, para armazenar e processar grandes volumes de dados em clusters de hardware comum.) O ZooKeeper é mais antigo que o etcd, e as lições aprendidas no trabalho com o ZooKeeper influenciaram o projeto do etcd.

Como resultado, o etcd tem alguns recursos importantes que o ZooKeeper não tem. Por exemplo, ao contrário do ZooKeeper, o etcd pode fazer o seguinte:

Permite a reconfiguração dinâmica dos membros do cluster.
Permanece estável ao executar operações de leitura/gravação sob cargas elevadas.
Mantém um modelo de dados de controle de concorrência de várias versões.
Oferece monitoramento de chaves confiável que nunca descarta eventos sem emitir uma notificação.
Usa primitivas de concorrência que separam conexões de sessões.
É compatível com uma ampla variedade de linguagens e frameworks (o ZooKeeper tem seu próprio protocolo Jute RPC personalizado, compatível com ligações de linguagem limitadas).

Consul

O Consul é uma solução de rede de serviços para sistemas distribuídos, cujos recursos estão em algum lugar entre os do etcd e a malha de serviços do Istio para Kubernetes. Assim como o etcd, o Consul inclui um armazenamento de chaves-valores distribuído com base no algoritmo Raft e é compatível com interfaces de programação de aplicativos em HTTP/JSON. Ambos oferecem configuração dinâmica de associação ao cluster, mas o Consul não faz um controle tão forte contra várias versões simultâneas de dados de configuração, e o tamanho máximo do banco de dados com o qual ele trabalhará de forma confiável é menor.

etcd versus Redis

Assim como o etcd, o Redis é uma ferramenta de código aberto, mas suas funcionalidades básicas são diferentes.

O Redis é um armazenamento de dados na memória e pode funcionar como um banco de dados, cache ou message broker. O Redis é compatível com uma variedade maior de tipos e estruturas de dados do que o etcd e tem um desempenho de leitura/gravação muito mais rápido.

Mas o etcd tem tolerância superior a falhas, recursos mais fortes de failover e disponibilidade contínua de dados e, o mais importante, o etcd persiste todos os dados armazenados no disco, sacrificando essencialmente a velocidade para obter maior confiabilidade e consistência garantida. Por esses motivos, o Redis é mais adequado para servir como um sistema de cache de memória distribuída do que para armazenar e distribuir informações de configuração do sistema.

Renderização 3D de uma espiral de vários ícones alinhados, como uma câmera, um botão de volume e uma prancheta

Leia o guia do líder de dados para saber como tornar os dados de sua organização preparados para IA.

Recursos

Renderização 3D de vários ícones alinhados, como um microfone e uma câmera

Agentes de IA baseados em dados. O seu já está pronto?

Seus dados são sua vantagem competitiva. Saiba como liberá-los de forma segura e gerar ROI mensurável com base na IA neste breve webinar.

Gerenciamento de dados explicado

O Techsplainers da IBM detalha os fundamentos dos dados para IA, desde os conceitos-chave até os casos de uso do mundo real. Episódios claros e rápidos ajudam você a aprender os fundamentos com agilidade.

Renderização 3D de vários ícones alinhados, como um botão de volume e uma área de transferência

Unifique e acesse seus dados para ajudar a escalar sua IA

Aprenda por que o caminho para dados preparados para IA geralmente começa com o acesso efetivo a dados estruturados e não estruturados, e os desafios que podem impedir os líderes de dados.

Custos indiretos jurídicos transformados em insights estratégicos

Saiba como um agente jurídico impulsionado por IA ajuda a acelerar a tomada de decisão, reduzir o trabalho manual e melhorar a conformidade.

AI Academy: Construindo uma estratégia de dados para IA corporativa

Neste episódio, Cathy Reese explica como as organizações de hoje precisam de uma estratégia de dados preparada para a IA avançada e que exigirá que elas aproveitem seus ativos de dados de maior qualidade.

Renderização 3D de vários ícones alinhados, como uma câmera e aviões de papel

O data lakehouse híbrido e aberto para IA

Simplifique o acesso aos dados e automatize sua gestão. Conheça o poder da integração de uma estratégia de data lakehouse à sua arquitetura de dados, incluindo a otimização dos custos das suas cargas de trabalho e a escalabilidade da IA e da análise, com todos os seus dados, em qualquer lugar.

Relatório do custo das violações de dados 2025

Os custos das violações de dados atingiram novo patamar. Receba insights atualizados sobre ameaças à cibersegurança e seus impactos financeiros nas organizações.

Representação 3D de duas linhas de vários ícones, como uma câmera, um botão de volume e uma área de transferência

O guia do líder de dados para preparar dados para IA

Entenda as etapas praticáveis que os líderes de dados podem seguir para superar os desafios dos dados, estabelecer a base para uma estrutura de dados confiável e preparar os dados da organização para a IA.

Representação 3D de vários ícones alinhados, como uma câmera, botão de volume e uma área de transferência

Como a diretoria executiva está transformando informações em impacto

Explore insights de 1.700 CDOs neste relatório de setores para líderes de dados.

Soluções relacionadas

IBM StreamSets

Crie e gerencie pipelines de dados de streaming inteligentes por meio de uma interface gráfica intuitiva, facilitando a integração sem dificuldades dos dados em ambientes híbridos e de multinuvem.

Explore o StreamSets

IBM watsonx.data™

O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.

Conheça o watsonx.data

Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights, que traz vantagem para os negócios.

Conheça os serviços de análise de dados

Dê o próximo passo

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

O que é o etcd?

O que é o etcd?

As mais recentes notícias de tecnologia, corroboradas por insights de especialistas.

Agradecemos sua inscrição!

Por que o etcd?

O gerenciamento de dados é o segredo para a IA generativa?

Algoritmo de consenso Raft

etcd e Kubernetes

CoreOS e a história e manutenção do etcd

etcd versus ZooKeeper versus Consul

ZooKeeper

Consul

etcd versus Redis

Recursos