O que é armazenamento de dados?

Visão aérea de alunos trabalhando em equipamentos elétricos na mesa da sala de aula

Autores

Stephanie Susnjara

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

O que é armazenamento de dados?

Armazenamento de dados refere-se a mídias magnéticas, ópticas ou mecânicas que registram e preservam informações digitais para operações contínuas ou futuras.

Existem dois tipos de informações digitais: dados de input e dados de saída. Os usuários fornecem os dados de input, e os computadores geram os dados de saída. No entanto, a CPU de um computador não pode realizar cálculos nem gerar dados de saída sem os dados de input fornecidos pelo usuário. 

Os usuários podem inserir dados de input diretamente em um computador. Contudo, desde os primórdios da era dos computadores, percebeu-se que inserir dados manualmente de forma contínua é uma tarefa demorada e exaustiva. Uma solução de curto prazo foi a memória de computador, também conhecida como memória de acesso aleatório (RAM). Entretanto, sua capacidade de armazenamento e retenção de memória é limitada. A memória somente de leitura (ROM), como o próprio nome sugere, permite apenas a leitura dos dados, não necessariamente a edição. Ela controla as funções básicas de um computador. 

Embora cientistas da computação tenham realizado avanços significativos na memória de computadores com o desenvolvimento da RAM dinâmica (DRAM) e da RAM síncrona (SDRAM), essas tecnologias ainda são limitadas em custo, espaço e retenção de memória. Quando o computador é desligado, a RAM também perde a capacidade de reter dados. A solução? Armazenamento de dados.

Com espaço de armazenamento de dados, os usuários podem salvar dados em um dispositivo. Assim, mesmo que o computador seja desligado, os dados serão preservados. Em vez de inserir manualmente dados toda vez, os usuários podem instruir o computador a buscar dados de dispositivos de armazenamento. Os computadores podem ler dados de input de diversas fontes conforme necessário e, em seguida, criar e salvar os dados de saída nas mesmas fontes ou em outros locais de armazenamento. Os usuários também podem compartilhar o armazenamento de dados com outras pessoas. 

Hoje, organizações e usuários precisam de armazenamento de dados para atender a necessidades computacionais de alto nível em análise de big data, inteligência artificial (IA), aprendizado de máquina (ML) e a Internet das coisas (IoT). O outro lado da necessidade de vasto armazenamento de dados é a proteção contra perda de dados causada por desastres, falhas ou fraudes. Assim, para evitar a perda de dados, as organizações também podem utilizar o armazenamento de dados como uma solução de backup e restauração.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

Como funciona o armazenamento de dados?

Em termos simples, computadores modernos ou terminais se conectam a dispositivos de armazenamento diretamente ou por meio de uma rede. Os usuários instruem os computadores a acessar dados desses dispositivos e a armazenar dados neles. No entanto, em um nível fundamental, o armazenamento de dados se baseia em dois princípios: a forma em que os dados são capturados e os dispositivos nos quais eles são gravados e armazenados.

IBM Storage FlashSystem

IBM Storage FlashSystem: otimização do VMware para ter melhor custo, simplicidade e resiliência

Saiba como o IBM FlashSystem otimiza os ambientes VMware visando a economia, a simplicidade e a resiliência. Esta sessão destaca como o FlashSystem pode melhorar a segurança, a acessibilidade e o desempenho dos dados, fazendo dele a solução ideal para infraestruturas modernas de TI.

Dispositivos de armazenamento de dados

Para armazenar dados, independentemente da forma, os usuários precisam de dispositivos de armazenamento. Os dispositivos de armazenamento de dados se dividem em duas categorias principais: armazenamento de área direta e armazenamento baseado em rede.

O armazenamento direto, também conhecido como armazenamento de conexão direta (DAS), é, como o nome indica, o armazenamento localizado na área imediata e diretamente conectado à máquina de computação que o acessa. Frequentemente, apenas essa máquina está conectada ao dispositivo. O DAS também pode oferecer serviços locais decentes de backup, mas o compartilhamento é limitado. Os dispositivos DAS incluem disquetes, discos ópticos — discos compactos (CDs) e discos de vídeo digitais (DVDs) —, discos rígidos (HDD), pen drives e unidades de estado sólido (SSD).

O armazenamento baseado em rede permite que vários computadores acessem os dados por meio de uma rede, sendo mais adequado para compartilhamento e colaboração. Sua capacidade de armazenamento externo também é melhor para backups e proteção de dados. Duas configurações padrão de armazenamento baseado em rede são o armazenamento de conexão direta (NAS) e a rede de área de armazenamento (SAN).

O NAS é frequentemente um dispositivo único composto por contêineres de armazenamento redundantes ou por uma matriz redundante de discos independentes (RAID). Já o armazenamento SAN pode ser uma rede de múltiplos dispositivos de vários tipos, incluindo armazenamento em SSD e flash, armazenamento híbrido, armazenamento híbrido em nuvem, armazenamento em nuvem e softwares e appliances de backup.

Qual é a diferença entre NAS e SAN?

Veja como NAS e SAN se diferenciam:

NAS

  • Dispositivo de armazenamento único ou RAID
  • Sistema de armazenamento de arquivos
  • Rede ethernet TCP/IP
  • Usuários limitados
  • Velocidade limitada
  • Opções limitadas de expansão
  • Baixo custo e configuração fácil

SAN

  • Rede de vários dispositivos
  • Sistema de armazenamento em bloco
  • Rede Fibre Channel
  • Otimizado para múltiplos usuários
  • Desempenho mais rápido
  • Altamente expansível
  • Custo mais elevado e configuração complexa

Tipos de dispositivos e sistemas de armazenamento

SSD e armazenamento flash

Armazenamento flash é uma tecnologia de unidade de estado sólido que utiliza chips de memória flash para gravar e armazenar dados. Um disco de estado sólido (SSD) armazena dados usando memória flash. Comparado aos discos rígidos (HDDs), um sistema de estado sólido não possui peças móveis e apresenta menos latência, resultando em menos falhas. Como a maioria dos SSDs modernos é baseada em flash, armazenamento flash e sistema de estado sólido são considerados sinônimos.

Armazenamento híbrido

Os SSDs e flash oferecem maior taxa de transferência que os HDDs, mas as matrizes all-flash podem ser mais caras. Muitas organizações adotam uma abordagem híbrida, mesclando a velocidade do flash com a capacidade de armazenamento das unidades de disco rígido. Uma infraestrutura de armazenamento equilibrada permite aplicar a tecnologia adequada para diferentes necessidades de armazenamento. O armazenamento híbrido oferece uma forma econômica de transição dos HDDs tradicionais sem a necessidade de migrar totalmente para flash.

Armazenamento em nuvem

Armazenamento em nuvem oferece uma alternativa escalável e econômica ao armazenamento de arquivos em discos rígidos locais ou redes de armazenamento. Provedores de serviços em nuvem (CSPs) — como Google Cloud, Microsoft Azure, IBM Cloud e Amazon Web Services (AWS) — permitem que você armazene dados e arquivos em uma localização externa, acessível pela internet pública ou por uma conexão privada dedicada. O provedor hospeda, protege, gerencia e mantém os servidores e a infraestrutura associada, garantindo acesso aos dados sempre que necessário.

armazenamento em nuvem híbrida

Armazenamento em nuvem híbrida combina elementos de nuvens públicas e privadas. Com armazenamento em nuvem híbrida, as organizações podem escolher em qual nuvem armazenar seus dados. Por exemplo, dados altamente regulamentados, sujeitos a requisitos rigorosos de arquivamento e replicação, são mais adequados para um ambiente de nuvem privada, enquanto dados menos sensíveis podem ser armazenados na nuvem pública. Algumas organizações usam nuvens híbridas para complementar suas redes de armazenamento internas com armazenamento em nuvem pública.

Software e dispositivos de backup de armazenamento

Armazenamento de backup e appliances protegem contra a perda de dados causada por desastres, falhas ou fraudes. Eles fazem cópias periódicas de dados e aplicações em um dispositivo secundário separado e utilizam essas cópias para recuperação de desastres. Os appliances de backup variam de HDDs e SSDs a unidades de fita e servidores.

Provedores de serviços em nuvem (CSPs) também oferecem armazenamento de backup como serviço, chamado backup-as-a-service (BaaS). Como a maioria das soluções "as-a-service", o BaaS oferece uma opção de baixo custo para proteger dados, armazenando-os em uma localização remota com escalabilidade.

Formas de armazenamento de dados

Os dados podem ser gravados e armazenados em três formas principais: armazenamento de arquivos, armazenamento em blocos e armazenamento de objetos.

Para uma comparação mais aprofundada dos tipos de armazenamento de dados, consulte "Armazenamento de objeto versus arquivo versus Block Storage: qual é a diferença?" e confira o vídeo a seguir.

Armazenamento de arquivos

Armazenamento de arquivos, ou armazenamento baseado em arquivos, é uma metodologia hierárquica de armazenamento usada para organizar e armazenar dados. Em outras palavras, os dados são armazenados em arquivos, que são organizados em pastas, que por sua vez são organizadas em uma hierarquia de diretórios e subdiretórios.

Armazenamento de bloco

Armazenamento em blocos, às vezes chamado de armazenamento em nível de bloco, é uma tecnologia para armazenar dados em blocos. Os blocos são armazenados como peças separadas, cada uma com um identificador único. Desenvolvedores preferem o armazenamento em blocos para situações de computação que exigem transferência de dados rápida, eficiente e confiável.

Armazenamento de objetos

Armazenamento de objetos, frequentemente chamado de armazenamento baseado em objetos, é uma arquitetura de armazenamento de dados projetada para lidar com grandes volumes de dados não estruturados. Esses dados não seguem — ou não podem ser facilmente organizados em — um banco de dados relacional tradicional com linhas e colunas. Exemplos incluem e-mails, vídeos, fotos, páginas da web, arquivos de áudio, dados de sensores e outros conteúdos de mídia e web (textuais ou não textuais). Outros casos de uso incluem a construção de aplicações nativas de nuvem ou a transformação de aplicações legadas em aplicações de próxima geração na nuvem utilizando armazenamento de objetos baseado em nuvem como repositório de dados persistente.

Redes de área de armazenamento e armazenamento de dados para empresas

A memória de computador e o armazenamento local podem não fornecer capacidade de armazenamento suficiente, proteção de dados, acesso para múltiplos usuários, velocidade e desempenho adequados para aplicações corporativas. Por isso, a maioria das organizações utiliza alguma forma de rede de área de armazenamento (SAN) em conjunto com um sistema de armazenamento conectado à rede (NAS).

Às vezes chamada de "rede por trás dos servidores", uma rede de área de armazenamento (SAN) é uma rede especializada e de alta velocidade que conecta servidores e dispositivos de armazenamento. Ela consiste em uma infraestrutura de comunicação que fornece conexões físicas, permitindo que qualquer dispositivo atravesse a rede usando elementos interconectados, como switches e directors.

A SAN também pode ser vista como uma extensão do conceito de barramento de armazenamento. Esse conceito possibilita a interconexão de dispositivos de armazenamento e servidores usando elementos semelhantes, como redes locais (LANs) e redes de longa distância (WANs). Uma SAN também inclui uma camada de gerenciamento que organiza as conexões, os elementos de armazenamento e os sistemas computacionais. Essa camada garante transferências de dados seguras e robustas.

Tradicionalmente, apenas um número limitado de dispositivos de armazenamento podia ser conectado a um servidor. Em contrapartida, uma SAN introduziu flexibilidade de rede, permitindo que um ou vários servidores heterogêneos, distribuídos por múltiplos data centers, compartilhem uma mesma unidade de armazenamento. A SAN elimina a conexão dedicada tradicional entre um servidor e um dispositivo de armazenamento, bem como a ideia de que o servidor é o proprietário e gerenciador direto dos dispositivos de armazenamento. Assim, uma rede pode incluir vários dispositivos, como discos, fitas magnéticas e armazenamento óptico — e a unidade de armazenamento pode estar localizada longe dos servidores que a utilizam.

Componentes da SAN

A infraestrutura de armazenamento é a base sobre a qual a informação se sustenta. Portanto, ela deve apoiar os objetivos de negócios e o modelo de negócios da empresa. Uma infraestrutura SAN proporciona maior disponibilidade de rede, acessibilidade aos dados e capacidade de gerenciamento do sistema. Nesse ambiente, simplesmente adicionar mais dispositivos de armazenamento ou dispositivos mais rápidos não é suficiente. Uma boa SAN começa com um bom projeto.

Fibre Channel

O primeiro elemento a considerar em qualquer implementação de SAN é a conectividade entre os componentes de armazenamento e de servidor, que normalmente utilizam Fibre Channel — uma tecnologia de transferência de dados de alta velocidade. As SANs, assim como as LANs, interconectam as interfaces de armazenamento em muitas configurações de rede e através de maiores distâncias.

Infraestrutura de servidor

A infraestrutura de servidores é a razão fundamental de todas as soluções de SAN, e essa infraestrutura inclui uma combinação de plataformas de servidores. Iniciativas como a consolidação de servidores e o e-commerce aumentam a necessidade por SANs, tornando o armazenamento em rede ainda mais crítico.

Sistema de armazenamento

Um sistema de armazenamento pode ser composto por sistemas de discos e sistemas de fitas. O sistema de discos pode incluir HDDs, SSDs ou unidades flash. O sistema de fitas pode incluir unidades de fita, carregadores automáticos de fitas e bibliotecas de fitas.

Sistema de rede

A conectividade SAN compreende componentes de hardware e software que interconectam dispositivos de armazenamento e servidores. O hardware pode incluir hubs, switches, directors e roteadores.

Armazenamento definido por software (SDS) e tecnologias relacionadas

Atualmente, o armazenamento de dados evoluiu para uma abordagem baseada em software, com foco no armazenamento definido por software (SDS) e em tecnologias relacionadas que aumentam a agilidade e a eficiência no gerenciamento de dados. Segundo um relatório da Technavio, o mercado global de armazenamento definido por software (SDS) deve crescer em USD 105,07 bilhões entre 2024 e 2029.1

Armazenamento definido por software (SDS)

O armazenamento definido por software (SDS) é um tipo de armazenamento de dados em que uma camada de software desacopla os recursos de armazenamento do hardware físico subjacente da infraestrutura. O SDS utiliza virtualização para criar um pool unificado de recursos de armazenamento que pode ser alocado dinamicamente por meio de automação ou manualmente por meio de um dashboard de API.

Diferentemente dos sistemas NAS ou SAN tradicionais, o SDS oferece flexibilidade para atender às demandas complexas dos processos de transformação digital. Por exemplo, o SDS pode simplificar significativamente as tarefas relacionadas ao gerenciamento de armazenamento, automatizando atividades como provisionamento, monitoramento e troubleshooting.

Virtualização do armazenamento

Virtualização de armazenamento refere-se ao agrupamento de recursos de armazenamento físico de vários sistemas de armazenamento, de modo que pareça que todo o armazenamento está em um único dispositivo. Em contraste, o SDS abstrai os serviços de armazenamento e os separa do próprio dispositivo. Os usuários gerenciam a virtualização de armazenamento por meio de um console para garantir a segurança, a confiabilidade e a eficiência de seus dados e recursos de armazenamento em ambientes virtualizados de servidores e desktops.

Armazenamento hiperconvergente

Armazenamento hiperconvergente é uma arquitetura de armazenamento de dados na qual os recursos de SDS são agrupados e gerenciados dentro de uma infraestrutura hiperconvergente (HCI).

O armazenamento hiperconvergente integra todo o armazenamento diretamente ao stack da HCI, juntamente com as funções de computação e de rede. Por meio da virtualização, a HCI desvincula os recursos de armazenamento dos hardwares individuais, tornando o armazenamento hiperconvergente muito mais flexível e escalável do que as soluções de armazenamento tradicionais.

Segurança do armazenamento de dados

A segurança do armazenamento de dados protege os dados em ambientes locais e em nuvem contra violações de dados, ataques cibernéticos e outras ameaças de segurança.

Violações de dados são onerosas e representam uma ameaça contínua para empresas. De acordo com o relatório do custo das violações de dados da IBM, o custo médio global de uma violação de dados naquele ano foi de USD 4,45 milhões, um aumento de 15% em três anos. O relatório também revelou que as organizações que utilizam extensivamente IA e automação de segurança economizaram, em média, USD 1,76 milhão em comparação com aquelas que não utilizam.

As empresas implementam medidas de segurança de dados para aumentar a visibilidade no armazenamento de dados. Os recursos de hardware e software de segurança de armazenamento incluem permissões especiais, criptografia, mascaramento de dados e redação de arquivos sensíveis. As soluções mais recentes de software de segurança de armazenamento também ajudam a automatizar relatórios para agilizar auditorias e atender a requisitos regulatórios.

Além disso, a resiliência cibernética — a capacidade de uma organização de prevenir, resistir e se recuperar de incidentes de segurança cibernética — tornou-se parte integrante da segurança de armazenamento de dados. A resiliência cibernética leva a segurança de dados a um novo nível ao combinar continuidade de negócios e recuperação de desastres (BCDR), segurança de sistemas de informação e resiliência organizacional para ajudar as organizações a se protegerem contra ameaças e a salvaguardar seus dados.

Hoje, setores que precisam preservar registros e manter a integridade dos dados (por exemplo, saúde, governo) podem optar pelo armazenamento imutável, que protege os dados armazenados ao impedir quaisquer alterações ou modificações por um período definido ou indefinido. Esses sistemas de arquivos permitem que os dados armazenados sejam acessados repetidamente após sua criação, mas não modificados, ajudando a proteger os dados contra adulterações, ataques cibernéticos e ransomware.

.
Soluções relacionadas
IBM Storage DS8000

O IBM Storage DS8900F é o sistema de armazenamento mais rápido, confiável e seguro para sistemas IBM Z e servidores IBM Power.

Explore Storage DS8000
Soluções de armazenamento de dados para empresas

O IBM Storage é uma família de soluções que inclui hardware de armazenamento de dados, armazenamento definido por software e software de gerenciamento de armazenamento.

Explore as soluções de armazenamento de dados
Serviços de suporte a hardware e software  

A IBM oferece suporte proativo para servidores web e infraestrutura de data centers, reduzindo o downtime e melhorando a disponibilidade de TI.

Serviços de servidores web
Dê o próximo passo

Desde o gerenciamento de ambientes de nuvem híbrida até a garantia de resiliência de dados, as soluções de armazenamento da IBM possibilitam que você extraia insights de seus dados e mantenha uma proteção robusta contra ameaças.

Explore as soluções de armazenamento de dados Faça um tour pelo produto