Visão geral

O que é a integração de dados?

A integração de dados é um grupo de processos técnicos e de negócios, como ETL, replicação de dados e virtualização de dados, que combinam dados de fontes distintas em um conjunto de dados significativos e valiosos para a inteligência de negócios e análise de negócios. Uma solução completa de integração de dados fornece dados de várias fontes locais e da cloud para oferecer suporte a um pipeline de dados confiáveis prontos para negócios do DataOps.

As soluções de integração de dados da IBM, incluindo a integração de dados na plataforma do IBM Cloud Pak® for Data, oferecem soluções escaláveis e multicloud para acelerar sua jornada para a IA. Extraia grandes volumes de dados de várias fontes, transforme-os em qualquer estilo e carregue-os no armazém de dados corporativos ou em fontes de cloud.

Os produtos de integração de dados da IBM também podem ser usados de forma independente ou como serviços gerenciados na IBM Cloud®.

Veja porque a IBM foi reconhecida como líder no Gartner Magic Quadrant for Data Integration Tools de 2021.

Andre De Locht explica a integração de dados

Dados decodificados em 30 segundos: O que é Integração de Dados? (00:30)

A IBM foi classificada em segundo lugar no caso de uso do Data Fabric

Veja os motivos no relatório do Gartner Critical Capabilities for Data Integration Tools de 2021.

Casos de uso da integração de dados

Integração de dados do cliente

silhueta de uma pessoa dentro de um hexágono

Conecte dados de bancos de dados e sistemas distribuídos para impulsionar o gerenciamento de relacionamento com o cliente (CRM) e entregar o que os clientes querem ou precisam.

Integração de dados da área de saúde

prancheta de prontuário médico

Combine dados clínicos, genômicos, de radiologia e de imagem para insights rápidos e disponibilize-os para tratamento de pacientes, tratamento de coorte e análises de saúde da população.

Integração de big data

hexágonos aninhados

Use armazéns de dados sofisticados que entregam uma visão unificada de big data de inúmeras fontes para simplificar os processos de inteligência de negócios.

Por que escolher a IBM para soluções de integração de dados?

Plataforma de software livre

Alcance a escala corporativa e obtenha segurança com uma plataforma de integração de dados em execução no Red Hat® OpenShift®.

Automação impulsionada por IA

Acelere a entrega e reduza o TCO com a automação de tarefas baseada em IA.

Implementação multicloud

Aproveite a tecnologia de contêiner para executar a integração de dados em ambientes híbridos e de multicloud.

IBM DataStage

Líder em ETL, o IBM® DataStage® é uma ferramenta de integração de dados altamente escalável para projetar, desenvolver e executar tarefas que movimentam e transformam dados de implementação local e em cloud.

Com uma arquitetura moderna baseada em contêineres do Red Hat OpenShift, o IBM DataStage para IBM Cloud Pak for Data combina esta integração de dados líder no mercado com DataOps, governança e análises em uma única plataforma de dados e IA. Entregue dados confiáveis em escala entre os ambientes híbridos ou multicloud.

Saiba mais

Técnicas de integração de dados

A integração de dados é fundamental para ajudar as empresas a consolidar os dados em uma visão única e confiável para análise e, finalmente, para expandir os negócios. Por exemplo, uma visão unificada dos dados do cliente pode alimentar estratégias de marketing bem-sucedidas. Diferentes técnicas são usadas no processo de integração de dados, incluindo:

  • Extrair, transformar, carregar (ETL): extraia, transforme e carregue dados de diversas fontes em um único armazenamento de dados que é carregado em um data warehouse ou outro sistema de destino. Transformar ou limpar e preparar os dados brutos em uma área de preparo em vez usar o sistema de origem melhora o desempenho e reduz a chance de corrupção de dados.
  • Extrair, carregar, transformar (ELT): extraia e carregue dados brutos de locais de fonte de dados para o armazenamento de dados de destino, onde poderão ser transformados quando necessário. Muitas vezes, o sistema de destino para ELT é um data lake, que pode armazenar quantidades massivas de dados estruturados e não estruturados, ou um data warehouse em cloud. Este método é ideal para oferecer suporte à inteligência artificial (IA), ao machine learning, à análise preditiva e aos aplicativos que usam dados em tempo real.
  • Replicação de dados: ofereça recursos complementares, como sincronização ou distribuição de dados de tempo real usando captura de dados de baixo impacto baseada em log.
  • Virtualização de dados: obtenha acesso a dados de diversas fontes criando uma visuaização virtual para usuários de negócios que precisam acessar e consultar dados sob demanda.

Desafios de integração de dados

Muitas organizações estão enfrentando grandes volumes dados provenientes de diferentes sistemas, como bancos de dados relacionais ou serviços de dados de streaming. A inteligência de negócios necessária para uma melhor tomada de decisão está oculta dentro de todos esses dados, mas processos sólidos de integração de dados devem ser seguidos para ter certeza de que os dados são gerenciados e governados, e em última análise, sejam confiáveis. Seus esforços de integração podem ser prejudicados por:

Latência de dados em ambientes multicloud
A transferência de volumes de dados por ambientes multicloud e de data lake pode ser lento e pode evitar que você use esses dados em tempo real em seus aplicativos ou sistemas operacionais.

A complexidade e o custo de múltiplas ferramentas
O gerenciamento de diversas ferramentas de integração de dados consome muito tempo de seus recursos e pode gerar alto custo para o seu negócio.

Processos manuais e fluxos de trabalho
As tarefas manuais como codificação e design de tarefas podem atrasar o desenvolvimento de aplicativos e atualizações. Os processos manuais também devem ser projetados para cada ambiente de cloud, portanto, se você estiver trabalhando com várias clouds, isso aumenta o tempo de desenvolvimento e os custos.

Baixa qualidade de dados e governança
Os dados provenientes de diversas fontes podem ser difíceis de governar e podem colocar o seu negócio em risco. Os dados confiáveis e limpos também são necessários para modelos de IA eficazes.

Integração de dados na cloud

Os repositórios de dados incluem ambientes locais, cloud e data lake. Muitas vezes, as organizações também usam clouds de diferentes fornecedores para atender a necessidades específicas de armazenamento ou implementação de aplicativos. A prática de integrar dados em todos esses ambientes para obter uma visualização unificada é a integração de dados na cloud.

A complexidade da integração de dados na cloud requer uma abordagem modernizada. Uma solução robusta de integração de dados multicloud deve:

  • Simplificar e acelerar a sincronização de diversas fontes de dados em ambientes híbridos de multicloud
  • Localizar tempos de execução mais próximos de fontes de dados
  • Usar os serviços integrados de análise e IA em diferentes plataformas de cloud
  • Automatizar o design de tarefas e use conectores pré-construídos para obter acesso mais rápido a fontes de dados
  • Incluir qualidade de dados sequencial para gerenciar a governança e a conformidade

O IBM DataStage for IBM Cloud Pak for Data pode proporcionar esta abordagem modernizada.

Integração de dados versus integração de aplicativos

A integração de dados e de aplicativos podem parecer semelhantes, mas os conceitos são muito diferentes. Como mencionado anteriormente, a integração de dados é a prática de localizar e recuperar informações de fontes de dados díspares e entregá-las em uma estrutura de visualização unificada. A integração de aplicativo vincula diretamente vários aplicativos independentes para que eles possam trabalhar uns com os outros, muitas vezes através de APIs modernas ou arquiteturas tradicionais orientadas a serviços. Os dados e fluxos de trabalho são combinados e otimizados, ajudando a superar a lacuna entre sistemas locais e aplicativos baseados em cloud.

Integração de dados versus migração de dados

A migração de dados é simplesmente o processo de transferência de dados entre tipos de armazenamento. Isso pode incluir transferir dados de ambientes locais para a cloud. A integração de dados, no entanto, é mais complexa à medida que os dados passam pelo processo de ETL ou ELT para prepará-los para análise.

Produtos relacionados

IBM Cloud Pak for Data

Integre todos os seus dados, seja no local ou em qualquer cloud, para mantê-los mais seguros em sua fonte com esta plataforma de dados multicloud flexível.

IBM InfoSphere Master Data Management

Obtenha gerenciamento de dados principais para um ou mais domínios, incluindo clientes, fornecedores, produtos, contas e mais.

IBM InfoSphere Data Replication

Ajude a replicar dados em uma ampla gama de fontes e destinos RDBMS e não RDBMS com baixa latência e também melhora a integridade das transações.

Próximas etapas