¿Qué es Claude AI?

Un dibujo azul de varios cubos que representan una red informática

Autores

Staff writer

Staff Editor, AI Models

IBM Think

¿Qué es Claude AI?

Claude AI (Claude) es un chatbot de inteligencia artificial generativa (IA) y una familia de modelos de lenguaje de gran tamaño (LLM) desarrollados por la firma de investigación Anthropic. Claude destaca en el procesamiento del lenguaje natural (PLN) y es multimodal: acepta entradas de texto, audio y visuales y puede responder preguntas, resumir documentos y generar textos largos, diagramas, animaciones, código de programa y mucho más.

Claude se adhiere a la filosofía de IA constitucional de Anthropic: un código de normas éticas que la empresa cree que diferencia a Claude de los modelos de IA de la competencia, como ChatGPT y Gemini de Google. Los principios de la IA constitucional se centran en la seguridad de la IA, diseñados para guiar a Claude a proporcionar respuestas más útiles y evitar comportamientos nocivos como el sesgo de la IA.

Claude 3, lanzado en mayo de 2024, incluye un ai chatbot gratuito y dos chatbots de IA prémium.

Claude 3.5 Sonnet es la base de la versión gratuita de Claude AI. Su énfasis en la velocidad le permite procesar rápidamente las consultas de los usuarios y otras tareas que requieren una recuperación urgente de datos. Según Anthropic, Claude 3.5 Sonnet es el doble de rápido que Claude 3 Opus, una de las dos ofertas prémium.

Claude 3 Opus es uno de los dos modelos Claude disponibles actualmente para los usuarios de Claude Pro. Proporciona servicios exhaustivos de procesamiento de documentos y generación de contenidos, especializándose en tareas complejas. Aunque es más lento que Claude 3.5 Sonnet, Opus corre un menor riesgo de alucinaciones: cuando un modelo de IA proporciona información incorrecta como si fuera objetivamente correcta.

Claude 3 Haiku es la segunda oferta prémium de Claude. Es el más pequeño y rápido de los tres y es ideal para resumir documentos largos, servicio de atención al cliente en tiempo real y generación de texto simple.

¿Para qué se utiliza Claude?

Cada uno de los tres modelos de Claude 3 tiene sus propios casos de uso especializados. En general, las personas pueden utilizar Claude AI para ayudarles con una amplia gama de tareas, entre las que se incluyen:

Respuesta a preguntas e investigación
Revisión y edición
Resumen de documentos, incluidos documentos PDF y Word
Generación de texto y contenido
Traducción de idiomas
Creación de planes de negocios
Procesamiento de imágenes y audio
Generación y revisión de fragmentos de código

A diferencia de Claude 2 y 1, Claude 3 es multimodal: puede procesar contenido de imagen y audio junto con instrucciones basadas en texto. Por ejemplo, Claude 3 puede generar descripciones de productos de comercio electrónico basadas en imágenes. Aunque Claude 3 no puede generar contenido no textual por sí solo, su integración multimodal es una de las varias características nuevas que le permiten competir con GPT-4.

¿Cómo funciona Claude AI?

Al igual que Gemini y ChatGPT de OpenAI, la familia de sistemas de IA Claude de Anthropic se basa en la arquitectura del transformador de red neuronal. Pero a diferencia de sus competidores, Claude aplica los principios de la IA constitucional para regir su comportamiento.

Los modelos de transformador destacan en el establecimiento de conexiones entre palabras distantes en una secuencia de entrada del usuario, lo que les permite comprender mejor el contexto y generar respuestas largas.

La IA constitucional es un conjunto rector de principios de reducción de daños diseñados para que Claude sea más beneficioso con menos riesgos.

¿Qué son los modelos de transformador?

Los transformadores son un tipo de modelo de IA creado para el procesamiento del lenguaje natural de alto rendimiento. Funcionan aplicando algoritmos matemáticos complejos para predecir estadísticamente la respuesta más probable a una consulta del usuario. El flujo de trabajo se puede dividir en cuatro pasos básicos.

El transformador divide una consulta de usuario en tokens. Cada token representa una palabra completa o una parte de una palabra. Los precios de los modelos de IA suelen representarse como el coste por token. La ventana de contexto de Claude Pro es de 200 000 tokens¹, lo que significa que puede procesar consultas de usuario de hasta 200 000 tokens de longitud.

Cada token se traza en un espacio vectorial tridimensional a través de procesos matemáticos. Los tokens que se evalúan como más similares en significado se trazan más juntos en el espacio, lo que ayuda a los LLM a comprender las entradas de los usuarios. El resultado de este proceso se denomina embedding vectorial.
Transformadores como Claude y GPT-4 aplican mecanismos de autoatención para autodirigir recursos en las partes más relevantes de una consulta de usuario y contexto de proceso.
El modelo aplica algoritmos probabilísticos para generar la respuesta más probable a una entrada. Los modelos de IA como Claude en realidad no "saben" nada, sino que combinan sus datos de entrenamiento con estadísticas avanzadas para obtener los resultados más probables de las instrucciones.

¿Qué es la IA constitucional?

La IA constitucional² es un conjunto de principios de seguridad y ética de la IA creados por la startup de IA Anthropic. Al diseñar Claude, Anthropic recabó las opiniones de aproximadamente 1000 personas, a quienes pidió que votaran y sugirieran normas para el funcionamiento ético de la IA generativa y el uso responsable de la IA . El conjunto final de normas constituyó la base del proceso de entrenamiento de Claude.

Las tres primeras reglas de la IA constitucional son:

Elija la respuesta menos peligrosa u odiosa.
Elija la respuesta más fiable, honesta y cercana a la verdad posible.
Elija la respuesta que mejor transmita intenciones claras.

Mientras que otros modelos someten su contenido a la revisión de entrenadores humanos en un proceso llamado aprendizaje por refuerzo a partir de feedback humano (RLHF), Claude se entrenó con RLHF y con un segundo modelo de IA. El aprendizaje por refuerzo a partir de feedback de IA (RLAIF) encargó al modelo "entrenador" la tarea de comparar el comportamiento de Claude con el de la IA constitucional y corregirlo en consecuencia.

El RLAIF automatiza la parte de ajuste del comportamiento del proceso de entrenamiento, lo que hace que sea más barato y más eficiente fomentar el comportamiento ético. El resultado previsto es que Claude se afinará a sí mismo, aprendiendo a evitar las instrucciones perjudiciales mientras genera respuestas útiles a las instrucciones que considera responsables.

¿Quién es Anthropic AI?

Anthropic es una startup de IA fundada en 2021 por varios exinvestigadores y ejecutivos de OpenAI, incluidos los hermanos Daniela y Dario Amodei. Amazon y Google han invertido miles de millones de dólares en la empresa, mientras que OpenAI sigue disfrutando del respaldo de Microsoft.

Los hermanos Amodei se separaron de OpenAI en 2021, un año antes de que OpenAI lanzara GPT-3.5. Este es el mismo modelo de IA que sigue impulsando la herramienta gratuita de IA ChatGPT en la actualidad. Junto con otros antiguos investigadores de OpenAI, los hermanos Amodei fundaron Anthropic AI y comenzaron a trabajar en lo que se convertiría en Claude AI.

La característica definitoria de Anthropic es su enfoque declarado de la IA ética, representado por el proceso de entrenamiento de IA constitucional.

Los beneficios de Claude vs. ChatGPT y Gemini

Al lanzar Claude 3, Anthropic AI realizó una serie de pruebas comparativas de LLM para comparar sus modelos con los de sus dos principales competidores: OpenAI y Google. Tanto en esas pruebas como en otras, Claude demostró varias ventajas clave:

Ventana de contexto más grande
Alto rendimiento en muchas pruebas
Sin retención de datos de entrada o salida

Mayor ventana de contexto

Capaz de responder a instrucciones de hasta 200 000 tokens(aproximadamente 350 páginas de texto), Claude puede recordar y utilizar más información al crear respuestas relevantes. En comparación, GPT-4 Turbo y GPT-4o limitan a los usuarios a 128 000 tokens.

La capacidad de Claude para retener más información permite a los usuarios crear instrucciones detalladas y llenas de datos. Cuantos más datos contenga la secuencia de entrada, más relevante puede ser la respuesta de un modelo de IA.

Alto rendimiento en muchas pruebas

Cuando Anthropic probó Claude 3 frente a GPT-4 y Gemini 1.0³, Claude 3 Opus obtuvo el mejor rendimiento en todos los puntos de referencia de evaluación seleccionados. Gemini 1.0 Ultra se impuso en cuatro de las seis pruebas de visión, aunque la familia de modelos Claude obtuvo resultados comparables.

Sin embargo, GPT-4o y Gemini 1.5 no se incluyeron en el grupo de pruebas. Al presentar GPT-4o en mayo de 2024⁴, OpenAI realizó una evaluación comparativa en la que su nuevo modelo insignia superó a Claude 3 Opus en cinco de las seis pruebas realizadas.

Sin retención de datos de entrada o salida

Los usuarios preocupados por la protección de datos pueden apreciar la política de retención de datos de Anthropic⁵: afirman que todas las entradas y resultados de los usuarios se eliminan después de 30 días. La política de datos de Gemini para Google Cloud⁶ de Google dice que la empresa no entrenará sus modelos con instrucciones de los usuarios.

En comparación, OpenAI puede retener y utilizar los datos de los usuarios⁷ para entrenar aún más sus modelos. Las políticas de Google Gemini Apps⁸ permiten a la empresa conservar los datos de los usuarios a menos que el usuario desactive manualmente esta opción.

Las desventajas de Claude

Aunque el rendimiento general de Claude es sólido en comparación con la competencia, también tiene un puñado de debilidades que pueden retrasar su aceptación por parte de la población en general.

Generación limitada de imágenes
No puede navegar por internet

Generación limitada de imágenes

En comparación con GPT-4o, Claude tiene menos capacidad para crear imágenes. Aunque Claude puede producir diagramas de flujo interactivos, diagramas de relación de entidades y gráficos, no llega a generar imágenes completas.

Sin navegación por internet

Gracias a la integración de Microsoft con Bing, GPT-4 puede buscar en internet al responder a las consultas de los usuarios. Aunque Claude se actualiza periódicamente con nuevos datos de entrenamiento, su base de conocimientos siempre está retrasada varios meses hasta que Anthropic decide abrir Claude a internet de la misma manera.

Cómo elegir el modelo fundacional adecuado

Aprenda a elegir el enfoque correcto en la preparación de conjuntos de datos y el empleo de modelos fundacionales.

Recursos

Explore IBM Granite

Descubra IBM Granite, nuestra familia de modelos de IA abiertos, de alto rendimiento y fiables, diseñados para la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de lenguaje, código, series temporales y límites de protección.

Cómo elegir el modelo fundacional adecuado

Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.

Descubra el potencial de los LLM

Busque artículos, blogs y tutoriales de IBM Developer y profundice en ellos para ampliar sus conocimientos sobre los LLM.

La guía del CEO para la optimización de modelos

Aprenda a impulsar continuamente a los equipos para que mejoren el rendimiento de los modelos y superen a la competencia utilizando las últimas técnicas e infraestructuras de IA.

Un enfoque diferenciado de los modelos fundacionales de la IA

Explore el valor de los modelos fundacionales de nivel empresarial que proporcionan confianza, rendimiento y beneficios rentables a todos los sectores.

Desbloquee el poder de la IA generativa + ML

Aprenda a incorporar la IA generativa, el machine learning y los modelos fundacionales en sus operaciones empresariales para mejorar el rendimiento.

IA en Acción 2024

Lea acerca de las 2000 organizaciones a las que encuestamos sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo puede adelantarse.

Soluciones relacionadas

Modelos fundacionales

Explore la biblioteca de modelos fundacionales de IBM en la cartera de watsonx para escalar la IA generativa para su negocio con confianza.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA

Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA

Dé el siguiente paso

Explore la biblioteca de modelos fundacionales de IBM en la cartera de IBM watsonx para escalar la IA generativa para su negocio con confianza.

Explore watsonx.ai

Explore las soluciones de IA

Notas a pie de página

1. How large is Claude Pro's Context Window? Anthropic. 2024.

2. Collective Constitutional AI: Aligning a Language Model with Public Input. Anthropic. 17 de octubre de 2023.

3. Introducing the next generation of Claude. Anthropic. 4 de marzo de 2024.

4. Hello GPT-4o. OpenAI. 13 de mayo de 2024.

5. How long do you store personal data?. Anthropic. 2024.

6. How Gemini for Google Cloud uses your data. Google. 10 de septiembre de 2024.

7. How your data is used to improve model performance. OpenAI. 17 de septiembre de 2024.

8. Gemini Apps Privacy Hub. Google. 28 de agosto de 2024.