O que é Claude AI?

Um desenho azul de vários cubos representando uma rede de computadores

O que é Claude AI?

O Claude AI (Claude) é um chatbot de inteligência artificial (IA) generativa e uma família de grandes modelos de linguagem (LLMs) desenvolvidos pela empresa de pesquisa Anthropic. O Claude se destaca em processamento de linguagem natural (NLP) e é multimodal: aceita entradas de texto, áudio e visuais e pode responder a perguntas, resumir documentos e gerar textos longos, diagramas, animações, código de programas e muito mais.

O Claude segue a filosofia da IA constitucional da Anthropic: um código de normas éticas que a empresa acredita que diferencia o Claude de modelos de IA concorrentes, como o ChatGPT e o Gemini do Google. Os princípios da IA constitucional estão focados na segurança da IA, projetados para orientar o Claude no fornecimento de respostas mais úteis, evitando comportamentos prejudiciais, como o viés da IA.

O Claude 3, lançado em maio de 2024, inclui um chatbot IA gratuito e dois premium.

  • O Claude 3.5 Sonnet é a base da versão gratuita do Claude AI. Sua ênfase na velocidade permite que ele processe rapidamente consultas de usuários e outras tarefas que exigem recuperação de dados urgente. De acordo com a Anthropic, o Claude 3.5 Sonnet é duas vezes mais rápido que o Claude 3 Opus, uma das duas ofertas premium.
  • O Claude 3 Opus é um dos dois modelos do Claude atualmente disponíveis para usuários do Claude Pro. Oferece serviços detalhados de processamento de documentos e geração de conteúdo, especializando-se em tarefas complexas. Embora mais lento que o Claude 3.5 Sonnet, o Opus corre um risco menor de alucinações: quando um modelo de IA fornece informações incorretas como se fossem factualmente corretas.
  • O Claude 3 Haiku é a segunda oferta premium do Claude. É o menor e mais rápido dos três, e é ideal para resumir documentos longos, atendimento ao cliente em tempo real e geração de texto simples.

Para que serve o Claude?

Cada um dos três modelos do Claude 3 tem seus próprios casos de uso especializados. Em geral, as pessoas podem usar o Claude AI para ajudar em uma ampla gama de tarefas, incluindo:

  • Respostas a perguntas e pesquisa
  • Revisão e edição
  • Sumarização de documentos, incluindo PDFs e documentos do Word
  • Geração de texto e conteúdo
  • Tradução de idiomas
  • Criação de planos de negócios
  • Processamento de imagens e áudio
  • Geração e revisão de trechos de código

Ao contrário do Claude 2 e 1, o Claude 3 é multimodal: ele pode processar conteúdo de imagem e áudio junto com prompts baseados em texto. Por exemplo, o Claude 3 pode gerar descrições de produtos de comércio eletrônico com base em imagens. Embora o Claude 3 não possa gerar conteúdo que não seja de texto por conta própria, sua integração multimodal é uma das várias novas funcionalidades que permitem competir com o GPT-4.

Como o Claude AI funciona?

Assim como o Gemini e o ChatGPT da OpenAI, a família Claude de sistemas de IA da Anthropic é baseada na arquitetura de transformação da rede neural. Mas, diferentemente de seus concorrentes, o Claude aplica os princípios da IA constitucional para governar o comportamento.

  • Os modelos de transformadores são excelentes para desenhar conexões entre palavras distantes em uma sequência de entradas do usuário, permitindo que entendam melhor o contexto e gerem respostas longas.
  • A IA constitucional é um conjunto orientador de princípios de redução de danos projetados para tornar o Claude mais benéfico com menos riscos.

O que são modelos de transformadores?

Os transformadores são um tipo de modelo de IA construído para processamento de linguagem natural de alto desempenho. Eles funcionam aplicando algoritmos matemáticos complexos para prever estatisticamente a resposta mais provável a uma consulta do usuário. O fluxo de trabalho pode ser dividido em quatro etapas básicas.

O transformador divide uma consulta do usuário em tokens. Cada token representa uma palavra inteira ou uma parte de uma palavra. Normalmente, o preço dos modelos de IA é o custo por token. A janela de contexto do Claude Pro tem 200 mil tokens1, o que significa que ele pode processar consultas de usuários com até 200 mil tokens.

  1. Cada token é plotado em um espaço vetorial tridimensional por meio de processos matemáticos. Os tokens avaliados como mais semelhantes em significado são plotados mais próximos no espaço, ajudando os LLMs a entender as entradas. O resultado desse processo é chamado de embedding de vetores.
  2. Transformadores como o Claude e o GPT-4 aplicam mecanismos de autoatenção para autodirecionar recursos para as partes mais relevantes de uma consulta de usuário e contexto de processos.
  3. O modelo aplica algoritmos probabilísticos para gerar a resposta mais provável a uma entrada. Modelos de IA como o Claude na verdade não “sabem” de nada. Em vez disso, combinam seus dados de treinamento com advanced statistics para produzir os resultados mais prováveis dos prompts.

O que é IA constitucional?

A IA constitucional2 é um conjunto de princípios de ética e segurança em IA criado pela Anthropic, startup de IA. Ao projetar o Claude, a Anthropic obteve entradas de aproximadamente 1.000 pessoas, pedindo-lhes que votassem e sugerissem regras para a operação ética da IA generativa e o uso da IA responsável. A montagem final das regras formou a base do processo de treinamento do Claude.

As três primeiras regras da IA constitucional são:

  • Escolha a resposta menos perigosa ou odiosa.
  • Escolha a resposta mais confiável, honesta e próxima da verdade possível.
  • Escolha a resposta que melhor transmite intenções claras.

Enquanto outros modelos têm o conteúdo avaliado por treinadores humanos em um processo chamado aprendizado por reforço do feedback humano (RLHF), o de Claude foi treinado com RLHF e um segundo modelo de IA. O aprendizado por reforço do feedback de IA (RLAIF) encarregou o modelo “treinador” de comparar o comportamento do Claude com o da IA constitucional e corrigi-lo adequadamente.

O RLAIF automatiza a parte de ajuste de comportamento do processo de treinamento, tornando mais barato e eficiente incentivar o comportamento ético. O resultado pretendido é que o Claude faria um ajuste fino em si mesmo, aprendendo a evitar prompts prejudiciais e, ao mesmo tempo, gerando respostas úteis aos prompts que considera que podem ser respondidos.

Quem é a Anthropic AI?

A Anthropic é uma startup de IA fundada em 2021 por vários ex-pesquisadores e executivos da OpenAI, incluindo os irmãos Daniela e Dario Amodei. A Amazon e o Google investiram bilhões de dólares na empresa, enquanto a OpenAI continua a contar com o apoio da Microsoft.

Os irmãos Amodei se separaram da OpenAI em 2021, um ano antes da OpenAI lançar o GPT-3.5. Esse é o mesmo modelo de IA que continua a impulsionar a ferramenta gratuita de IA ChatGPT atualmente. Junto com outros ex-pesquisadores da OpenAI, os irmãos Amodei fundaram a Anthropic IA e começaram a trabalhar no que se tornaria o Claude AI.

A funcionalidade definidora da Anthropic é sua abordagem declarada à IA ética, representada pelo processo de treinamento de IA constitucional.

Os benefícios do Claude versus ChatGPT e Gemini

Ao lançar o Claude 3, a Anthropic AI realizou uma série de testes de benchmarking de LLMs para avaliar seus modelos em relação aos de seus dois principais concorrentes: OpenAI e Google. Tanto nesses testes quanto em outros, o Claude demonstrou várias vantagens importantes:

  • Janela de contexto maior
  • Forte desempenho em muitos testes
  • Nenhuma retenção de dados de entrada ou saída

Janela de contexto maior

Capaz de atender prompts de até 200.000 tokens (aproximadamente 350 páginas de texto), o Claude pode se lembrar e usar mais informações ao criar respostas relevantes. Em comparação, o GPT-4 Turbo e o GPT-4o limitam os usuários a 128.000 tokens.

A capacidade do Claude de reter mais informações permite que os usuários criem prompts detalhados e repletos de dados. Quanto mais dados houver na sequência de entrada, mais relevante poderá ser a resposta de um modelo de IA.

Forte desempenho em muitos testes

Quando a Anthropic testou o Claude 3 em relação ao GPT-4 e ao Gemini 1.03, o Claude 3 Opus tinha o melhor desempenho em todos os benchmarks de avaliação selecionados. O Gemini 1.0 Ultra saiu na frente em quatro dos seis testes de visão, embora a família de modelos Claude tenha tido um desempenho comparável.

No entanto, o GPT-4o e o Gemini 1.5 não foram incluídos no pool de testes. Ao revelar o GPT-4o em maio de 20244, a OpenAI realizou um benchmarking que viu seu novo modelo principal superar o Claude 3 Opus em cinco dos seis testes realizados.

Nenhuma retenção de dados de entrada ou saída

Usuários preocupados com a privacidade de dados podem apreciar a política de retenção de dados da Anthropic5: eles afirmam que todas as entradas e saídas do usuário são excluídas após 30 dias. A política de dados do Gemini for Google Cloud do Google6 diz que a empresa não treinará seus modelos com prompts de usuários.

Em comparação, a OpenAI pode reter e usar dados do usuário7 para treinar ainda mais seus modelos. As políticas dos aplicativos Gemini do Google8 permitem que a empresa retenha os dados do usuário, a menos que o usuário desative manualmente essa opção.

Desvantagens do Claude

Embora o desempenho geral do Claude seja forte quando comparado à concorrência, ele também tem alguns pontos fracos que podem atrasar sua aceitação pela população em geral.

  • Geração de imagens limitada
  • Sem navegação na internet

Geração de imagens limitada

Em comparação com o GPT-4o, o Claude tem menos capacidade de criar imagens. Embora a Claude possa produzir fluxogramas interativos, diagramas de relacionamento de entidades e gráficos, ele não chega à geração completa de imagens.

Sem navegação na internet

Devido à integração da Microsoft com o Bing, o GPT-4 consegue pesquisar na internet ao responder às consultas dos usuários. Embora o Claude seja atualizado regularmente com novos dados de treinamento, sua base de conhecimento está sempre atrasada vários meses até que a Anthropic decida abrir o Claude para a internet da mesma maneira.

Soluções relacionadas
Modelos de base

Explore a biblioteca de modelos de base da IBM no portfólio do watsonx para escalar a IA generativa com confiança na sua empresa.

Conheça o watsonx.ai
Soluções de inteligência artificial

Use a IA a serviço da sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.

Explore as soluções de IA
Consultoria e serviços em IA

Reinvente os fluxos de trabalho e as operações críticas adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor comercial.

Explore os serviços de IA
Dê o próximo passo

Explore a biblioteca da IBM de modelos de base no portfólio do IBM® watsonx para escalar a IA generativa para os seus negócios com confiança.

Explore o watsonx.ai Explore as soluções de IA
Notas de rodapé

1. How large is Claude Pro’s Context Window? Anthropic, 2024 

2. Collective Constitutional AI: Aligning a Language Model with Public Input, Anthropic, 17 de outubro de 2023 

3. Introducing the next generation of Claude, Anthropic, 4 de março de 2024 

4. Hello GPT-4o, OpenAI, 13 de maio de 2024 

5. How long do you store personal data?, Anthropic, 2024 

6. How Gemini for Google Cloud uses your data, Google, 10 de setembro de 2024 

7. How your data is used to improve model performance, OpenAI, 17 de setembro de 2024 

8. Gemini Apps Privacy Hub, Google, 28 de agosto de 2024