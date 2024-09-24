O Claude AI (Claude) é um chatbot de inteligência artificial (IA) generativa e uma família de grandes modelos de linguagem (LLMs) desenvolvidos pela empresa de pesquisa Anthropic. O Claude se destaca em processamento de linguagem natural (NLP) e é multimodal: aceita entradas de texto, áudio e visuais e pode responder a perguntas, resumir documentos e gerar textos longos, diagramas, animações, código de programas e muito mais.
O Claude segue a filosofia da IA constitucional da Anthropic: um código de normas éticas que a empresa acredita que diferencia o Claude de modelos de IA concorrentes, como o ChatGPT e o Gemini do Google. Os princípios da IA constitucional estão focados na segurança da IA, projetados para orientar o Claude no fornecimento de respostas mais úteis, evitando comportamentos prejudiciais, como o viés da IA.
O Claude 3, lançado em maio de 2024, inclui um chatbot IA gratuito e dois premium.
Cada um dos três modelos do Claude 3 tem seus próprios casos de uso especializados. Em geral, as pessoas podem usar o Claude AI para ajudar em uma ampla gama de tarefas, incluindo:
Ao contrário do Claude 2 e 1, o Claude 3 é multimodal: ele pode processar conteúdo de imagem e áudio junto com prompts baseados em texto. Por exemplo, o Claude 3 pode gerar descrições de produtos de comércio eletrônico com base em imagens. Embora o Claude 3 não possa gerar conteúdo que não seja de texto por conta própria, sua integração multimodal é uma das várias novas funcionalidades que permitem competir com o GPT-4.
Assim como o Gemini e o ChatGPT da OpenAI, a família Claude de sistemas de IA da Anthropic é baseada na arquitetura de transformação da rede neural. Mas, diferentemente de seus concorrentes, o Claude aplica os princípios da IA constitucional para governar o comportamento.
Os transformadores são um tipo de modelo de IA construído para processamento de linguagem natural de alto desempenho. Eles funcionam aplicando algoritmos matemáticos complexos para prever estatisticamente a resposta mais provável a uma consulta do usuário. O fluxo de trabalho pode ser dividido em quatro etapas básicas.
O transformador divide uma consulta do usuário em tokens. Cada token representa uma palavra inteira ou uma parte de uma palavra. Normalmente, o preço dos modelos de IA é o custo por token. A janela de contexto do Claude Pro tem 200 mil tokens1, o que significa que ele pode processar consultas de usuários com até 200 mil tokens.
A IA constitucional2 é um conjunto de princípios de ética e segurança em IA criado pela Anthropic, startup de IA. Ao projetar o Claude, a Anthropic obteve entradas de aproximadamente 1.000 pessoas, pedindo-lhes que votassem e sugerissem regras para a operação ética da IA generativa e o uso da IA responsável. A montagem final das regras formou a base do processo de treinamento do Claude.
As três primeiras regras da IA constitucional são:
Enquanto outros modelos têm o conteúdo avaliado por treinadores humanos em um processo chamado aprendizado por reforço do feedback humano (RLHF), o de Claude foi treinado com RLHF e um segundo modelo de IA. O aprendizado por reforço do feedback de IA (RLAIF) encarregou o modelo "treinador" de comparar o comportamento do Claude com o da IA constitucional e corrigi-lo adequadamente.
O RLAIF automatiza a parte de ajuste de comportamento do processo de treinamento, tornando mais barato e eficiente incentivar o comportamento ético. O resultado pretendido é que o Claude faria um ajuste fino em si mesmo, aprendendo a evitar prompts prejudiciais e, ao mesmo tempo, gerando respostas úteis aos prompts que considera que podem ser respondidos.
A Anthropic é uma startup de IA fundada em 2021 por vários ex-pesquisadores e executivos da OpenAI, incluindo os irmãos Daniela e Dario Amodei. A Amazon e o Google investiram bilhões de dólares na empresa, enquanto a OpenAI continua a contar com o apoio da Microsoft.
Os irmãos Amodei se separaram da OpenAI em 2021, um ano antes da OpenAI lançar o GPT-3.5. Esse é o mesmo modelo de IA que continua a impulsionar a ferramenta gratuita de IA ChatGPT atualmente. Junto com outros ex-pesquisadores da OpenAI, os irmãos Amodei fundaram a Anthropic IA e começaram a trabalhar no que se tornaria o Claude AI.
A funcionalidade definidora da Anthropic é sua abordagem declarada à IA ética, representada pelo processo de treinamento de IA constitucional.
Ao lançar o Claude 3, a Anthropic AI realizou uma série de testes de benchmarking de LLMs para avaliar seus modelos em relação aos de seus dois principais concorrentes: OpenAI e Google. Tanto nesses testes quanto em outros, o Claude demonstrou várias vantagens importantes:
Capaz de atender prompts de até 200.000 tokens (aproximadamente 350 páginas de texto), o Claude pode se lembrar e usar mais informações ao criar respostas relevantes. Em comparação, o GPT-4 Turbo e o GPT-4o limitam os usuários a 128.000 tokens.
A capacidade do Claude de reter mais informações permite que os usuários criem prompts detalhados e repletos de dados. Quanto mais dados houver na sequência de entrada, mais relevante poderá ser a resposta de um modelo de IA.
Quando a Anthropic testou o Claude 3 em relação ao GPT-4 e ao Gemini 1.03, o Claude 3 Opus tinha o melhor desempenho em todos os benchmarks de avaliação selecionados. O Gemini 1.0 Ultra saiu na frente em quatro dos seis testes de visão, embora a família de modelos Claude tenha tido um desempenho comparável.
No entanto, o GPT-4o e o Gemini 1.5 não foram incluídos no pool de testes. Ao revelar o GPT-4o em maio de 20244, a OpenAI realizou um benchmarking que viu seu novo modelo principal superar o Claude 3 Opus em cinco dos seis testes realizados.
Usuários preocupados com a privacidade de dados podem apreciar a política de retenção de dados da Anthropic5: eles afirmam que todas as entradas e saídas do usuário são excluídas após 30 dias. A política de dados do Gemini for Google Cloud do Google6 diz que a empresa não treinará seus modelos com prompts de usuários.
Em comparação, a OpenAI pode reter e usar dados do usuário7 para treinar ainda mais seus modelos. As políticas dos aplicativos Gemini do Google8 permitem que a empresa retenha os dados do usuário, a menos que o usuário desative manualmente essa opção.
Embora o desempenho geral do Claude seja forte quando comparado à concorrência, ele também tem alguns pontos fracos que podem atrasar sua aceitação pela população em geral.
Em comparação com o GPT-4o, o Claude tem menos capacidade de criar imagens. Embora a Claude possa produzir fluxogramas interativos, diagramas de relacionamento de entidades e gráficos, eea não chega à geração completa de imagens.
Devido à integração da Microsoft com o Bing, o GPT-4 consegue pesquisar na internet ao responder às consultas dos usuários. Embora o Claude seja atualizado regularmente com novos dados de treinamento, sua base de conhecimento está sempre atrasada vários meses até que a Anthropic decida abrir o Claude para a internet da mesma maneira.
