Blockchain e big data estão entre as principais tecnologias emergentes consideradas para revolucionar vários setores, mudando radicalmente a forma como as empresas e as organizações são administradas. Pode-se presumir que essas tecnologias são mutuamente exclusivas, cada uma criando caminhos únicos e aplicadas de forma independente umas das outras.
Mas isso estará errado.
A blockchain, assim como a ciência de dados, está transformando gradualmente a forma como vários setores operam. E enquanto a ciência de dados se concentra em aproveitar os dados para uma administração adequada, a blockchain garante a confiança dos dados ao manter um livro-razão descentralizado.
A questão é: existe um lugar em que esses dois conceitos se interceptam?
O que será alcançado quando essas duas tecnologias forem aplicadas simultaneamente?
Simplificando, como a blockchain pode revolucionar a ciência de dados?
Para responder a essas perguntas, será útil ter um melhor entendimento de blockchain e ciência de dados separados um do outro.
A blockchain é basicamente um livro-razão não confiável que registra transações econômicas de forma que elas não possam ser manipuladas. A tecnologia ganhou destaque como resultado do interesse em bitcoin e criptomoedas em geral, mas desde então encontrou relevância no registro não apenas de transações de criptomoedas, mas qualquer coisa de valor. Conhecendo os recursos dessa tecnologia emergente, desenvolvedores e entusiastas da tecnologia começaram a trabalhar na criação de caso de uso após caso de uso para a blockchain.
A demanda por desenvolvedores de blockchain aumentou nos últimos anos, assim como projetos trabalhando em diferentes aplicações de blockchain. Relatórios de plataformas de freelancer como a UpWork mantiveram as habilidades em blockchain como as habilidades mais exigidas. De forma semelhante, profissionais de outras áreas como estudos jurídicos têm uma grande vantagem se possuem habilidades em blockchain — ou pelo menos tiverem compreensão da tecnologia.
Boletim informativo do setor
Mantenha-se atualizado sobre as tendências mais importantes e fascinantes do setor em IA, automação, dados e muito mais com o boletim informativo da Think. Consulte a declaração de privacidade da IBM.
Sua inscrição será entregue em inglês. Você pode encontrar um link para cancelar a inscrição em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa declaração de privacidade da IBM para obter mais informações.
A ciência de dados procura extrair conhecimento e insights de dados estruturados e dados não estruturados. Este campo engloba estatística, análise de dados, aprendizado de máquina e outros métodos avançados usados para entender e analisar processos reais usando dados.
Os dados são frequentemente descritos como o novo petróleo na linguagem econômica, razão pela qual empresas líderes, incluindo os famosos GAFAs (Google, Amazon, Facebook e Apple), estão no controle de cargas de dados. Algumas aplicações comuns da ciência de dados são vistas em protocolos de mecanismos da Internet, anúncios digitais e serviços de recomendação. A análise de dados, um aspecto fundamental da ciência de dados, foi considerada relevante no setor de saúde para rastrear o tratamento de pacientes e o fluxo de equipamentos; em viagens para jogos para melhorar a experiência do consumidor; para gerenciamento de energia, bem como em muitos outros setores.
Há também uma demanda aparentemente insaciável por cientistas de dados que possam fornecer mais insights com dados e ajudar a resolver mais problemas. Isso é ainda mais evidente ao considerar big data, um aspecto avançado da ciência de dados que lida com quantidades extremamente grandes de dados que não podem ser tratadas pelos métodos tradicionais de processamento de dados.
Ao contrário de áreas como fintech, saúde e cadeia de suprimentos, onde a blockchain agora é muito familiar, a tecnologia não foi explorada extensivamente em aspectos da ciência de dados. Para alguns, a relação entre os conceitos não é clara, se não inexistente.
Para começar, tanto a blockchain quanto a ciência de dados lidam com dados: a ciência de dados analisa dados para obter insights praticáveis, enquanto a blockchain registra e valida dados. Ambos fazem uso de algoritmos criados para governar interações com vários segmentos de dados. Um tema comum que você logo notará é: “ciência de dados para previsão; blockchain para integridade de dados.”
A ciência de dados, assim como qualquer avanço tecnológico, tem seus próprios desafios e limitações que, quando abordados, liberarão todos os seus recursos. Alguns dos principais desafios para a ciência de dados incluem dados inacessíveis, privacidade de dados e dados sujos.
O controle de dados "sujos" (ou informações errôneas) é uma área na qual a tecnologia blockchain pode impactar positivamente o campo da ciência de dados em grande medida. De acordo com uma pesquisa de 2017 com 16.000 profissionais de dados, a inclusão de dados sujos, como dados duplicados ou incorretos, foi identificada como o maior desafio para a ciência de dados. Através de criptografia e algoritmo de consenso descentralizados, a blockchain valida os dados tornando quase impossível de manipular devido ao enorme poder que será necessário.
Novamente por meio de seu sistema descentralizado, a tecnologia blockchain garante a segurança e a privacidade dos dados. A maioria dos dados é armazenada em servidores centralizados que muitas vezes são alvo de atacantes cibernéticos; os vários relatórios de hackers e violações de segurança mostram a extensão da ameaça. A blockchain, por outro lado, restaura o controle dos dados para os indivíduos que os geram, tornando uma tarefa difícil para os cibercriminosos acessarem e manipularem dados em larga escala.
Se grande é a quantidade, diz Maria Weinberger, da Janexter, blockchain é a qualidade. Isso segue o entendimento de que a blockchain está focada em validar dados, enquanto a ciência de dados ou big data envolve fazer previsões a partir de grandes quantidades de dados.
A blockchain trouxe uma maneira totalmente nova de gerenciar e operar com dados — não mais em uma perspectiva central, onde todos os dados devem ser reunidos, mas de uma maneira descentralizada, onde os dados podem ser analisados diretamente das edges dos dispositivos individuais. A blockchain se integra a outras tecnologias avançadas, como soluções em nuvem, inteligência artificial (IA) e Internet das coisas (IoT).
Além disso, os dados validados gerados por meio da tecnologia blockchain vêm estruturados e completos, além do fato de serem imutáveis, como mencionamos anteriormente. Outra área importante onde os dados gerados pela blockchain se tornam um impulso para o big data é na integridade dos dados, uma vez que a blockchain determina a origem dos dados por meio de suas cadeias vinculadas.
Existem pelo menos cinco maneiras específicas de como os dados da blockchain podem ajudar cientistas de dados em geral.
Os dados registrados na blockchain são confiáveis porque devem ter passado por um processo de verificação que garante sua qualidade. Também proporciona transparência, já que as atividades e transações que ocorrem na rede blockchain podem ser rastreadas.
No ano passado, a Lenovo apresentou esse caso de uso da tecnologia blockchain para detectar documentos e formulários fraudulentos. As gigantes do PC usaram a tecnologia blockchain para validar documentos físicos que foram codificados com assinaturas digitais. As assinaturas digitais são processadas por computadores e a autenticidade do documento é verificada por meio de um registro de blockchain.
Na maioria das vezes, a integridade dos dados é garantida quando os detalhes da origem e as interações relativas a um bloco de dados são armazenados na blockchain e automaticamente verificados antes que possam ser aplicados.
Como a blockchain utiliza um algoritmo de consenso para verificar as transações, é impossível que uma única unidade represente uma ameaça à rede de dados. Um nó (ou unidade) que começa a agir de forma anormal pode ser facilmente identificado e eliminado da rede.
Como a rede é muito distribuída, é quase impossível que uma única parte gere poder computacional suficiente para alterar os critérios de validação e permitir dados indesejados no sistema. Para alterar as regras da blockchain, a maioria dos nós deve ser agrupada para criar um consenso. Isso não será possível de ser alcançado por um único ator ruim.
Os dados da blockchain, assim como outros tipos de dados, podem ser analisados para revelar insights valiosos sobre os comportamentos, tendências e, como tal, podem ser usados para prever resultados futuros. Além disso, a blockchain fornece dados estruturados coletados de indivíduos ou dispositivos individuais.
Na análise preditiva, os cientistas de dados se baseiam em grandes conjuntos de dados para determinar com boa exatidão o resultado de eventos sociais, como preferências do cliente, valor vitalício do cliente, preços dinâmicos e taxas de rotatividade no que se refere às empresas. No entanto, isso não se limita a insights de negócios, pois quase qualquer evento pode ser previsto com a análise de dados correta, sejam sentimentos sociais ou marcadores de investimento.
E devido à natureza distribuída da blockchain e ao enorme poder computacional disponível por meio dela, cientistas de dados, mesmo em Organizações menores, podem realizar extensas tarefas de análise preditiva. Esses cientistas de dados podem usar o poder computacional de vários milhares de computadores conectados em uma blockchain como um serviço baseado em nuvem para analisar resultados sociais em uma escala que não teria sido possível de outra forma.
Como tem sido exibido em sistemas financeiros e de pagamento, a blockchain possibilita transações internacionais em tempo real. Vários bancos e inovadores de fintech agora estão explorando a blockchain porque ela permite a liquidação rápida (na verdade, em tempo real) de grandes valores, independentemente das barreiras geográficas.
Da mesma maneira, organizações que exigem análise de dados em tempo real em grande escala podem contar com um sistema habilitado para blockchain para alcançar seus objetivos. Com a blockchain, os bancos e outras organizações podem observar mudanças nos dados em tempo real, possibilitando a tomada de decisões rápidas, seja para bloquear uma transação suspeita ou rastrear atividades anormais.
Nesse sentido, os dados obtidos de estudos de dados podem ser armazenados em uma rede blockchain. Dessa forma, as equipes de projeto não repetem a análise de dados já realizada por outras equipes ou reutilizam erroneamente dados que já foram usados. Além disso, uma blockchain platform pode ajudar cientistas de dados a monetizar seu trabalho, provavelmente negociando resultados de análises armazenados na plataforma.
A blockchain, como foi observado, está em seus estágios iniciais, embora possa parecer não devido à euforia que a tecnologia obteve em um curto período. Seria de se esperar que, à medida que a tecnologia amadurecesse e houvesse mais inovações ao seu redor, mais casos de uso concretos fossem identificados e explorados — a ciência de dados sendo uma área que se beneficiará com isso.
Dito isso, foram levantados alguns desafios sobre seu impacto na ciência de dados, especialmente em big data, que exige que quantidades excepcionalmente grandes de dados sejam tratadas. Uma preocupação é que a aplicação da blockchain nesse sentido será muito cara de prosseguir. Isso ocorre porque o armazenamento de dados em uma blockchain é caro em comparação com os meios tradicionais. Os blocos lidam com quantidades relativamente pequenas de dados em comparação com os grandes volumes de dados coletados por segundo para big data e outras tarefas de análise de dados.
Como a blockchain evolui para lidar com essas preocupações e prosseguir para revolucionar o espaço da ciência de dados será particularmente interessante porque, como vimos, a tecnologia tem um enorme potencial para transformar a forma como gerenciamos e usamos dados.
De tempos em tempos, convidamos líderes de pensamento setoriais, especialistas acadêmicos e parceiros a compartilhar suas opiniões e insights sobre as tendências atuais em blockchain para o blog Blockchain Pulse. Embora as opiniões contidas nesses posts do blog sejam próprias e não reflitam necessariamente as opiniões da IBM, este blog se esforça para receber todos os pontos de vista da conversa.
IBM® Blockchain Platform: a Hyperledger Fabric Support Edition fornece SLAs e suporte corporativo 24 horas por dia, 7 dias por semana para a Hyperledger Fabric, o padrão de fato para plataformas de blockchain corporativas da Linux Foundation.
A IBM Blockchain ajuda os parceiros da cadeia de suprimentos a compartilhar dados confiáveis por meio de soluções de blockchain autorizadas, aumentando a transparência e a confiança.
A IBM® Consulting é uma consultoria global que trabalha lado a lado com os clientes para projetar, construir e operar negócios de alto desempenho.