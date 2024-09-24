Claude AI (Claude) es un chatbot de inteligencia artificial generativa (IA) y una familia de modelos de lenguaje de gran tamaño (LLM) desarrollados por la firma de investigación Anthropic. Claude destaca en el procesamiento del lenguaje natural (PLN) y es multimodal: acepta entradas de texto, audio y visuales y puede responder preguntas, resumir documentos y generar textos largos, diagramas, animaciones, código de programa y mucho más.
Claude se adhiere a la filosofía de IA constitucional de Anthropic: un código de normas éticas que la empresa cree que diferencia a Claude de los modelos de IA de la competencia, como ChatGPT y Gemini de Google. Los principios de la IA constitucional se centran en la seguridad de la IA, diseñados para guiar a Claude a proporcionar respuestas más útiles y evitar comportamientos nocivos como el sesgo de la IA.
Claude 3, lanzado en mayo de 2024, incluye un ai chatbot gratuito y dos chatbots de IA prémium.
Cada uno de los tres modelos de Claude 3 tiene sus propios casos de uso especializados. En general, las personas pueden utilizar Claude AI para ayudarles con una amplia gama de tareas, entre las que se incluyen:
A diferencia de Claude 2 y 1, Claude 3 es multimodal: puede procesar contenido de imagen y audio junto con instrucciones basadas en texto. Por ejemplo, Claude 3 puede generar descripciones de productos de comercio electrónico basadas en imágenes. Aunque Claude 3 no puede generar contenido no textual por sí solo, su integración multimodal es una de las varias características nuevas que le permiten competir con GPT-4.
Al igual que Gemini y ChatGPT de OpenAI, la familia de sistemas de IA Claude de Anthropic se basa en la arquitectura del transformador de red neuronal. Pero a diferencia de sus competidores, Claude aplica los principios de la IA constitucional para regir su comportamiento.
Los transformadores son un tipo de modelo de IA creado para el procesamiento del lenguaje natural de alto rendimiento. Funcionan aplicando algoritmos matemáticos complejos para predecir estadísticamente la respuesta más probable a una consulta del usuario. El flujo de trabajo se puede dividir en cuatro pasos básicos.
El transformador divide una consulta de usuario en tokens. Cada token representa una palabra completa o una parte de una palabra. Los precios de los modelos de IA suelen representarse como el coste por token. La ventana de contexto de Claude Pro es de 200 000 tokens1, lo que significa que puede procesar consultas de usuario de hasta 200 000 tokens de longitud.
La IA constitucional2 es un conjunto de principios de seguridad y ética de la IA creados por la startup de IA Anthropic. Al diseñar Claude, Anthropic recabó las opiniones de aproximadamente 1000 personas, a quienes pidió que votaran y sugirieran normas para el funcionamiento ético de la IA generativa y el uso responsable de la IA . El conjunto final de normas constituyó la base del proceso de entrenamiento de Claude.
Las tres primeras reglas de la IA constitucional son:
Mientras que otros modelos someten su contenido a la revisión de entrenadores humanos en un proceso llamado aprendizaje por refuerzo a partir de feedback humano (RLHF), Claude se entrenó con RLHF y con un segundo modelo de IA. El aprendizaje por refuerzo a partir de feedback de IA (RLAIF) encargó al modelo "entrenador" la tarea de comparar el comportamiento de Claude con el de la IA constitucional y corregirlo en consecuencia.
El RLAIF automatiza la parte de ajuste del comportamiento del proceso de entrenamiento, lo que hace que sea más barato y más eficiente fomentar el comportamiento ético. El resultado previsto es que Claude se afinará a sí mismo, aprendiendo a evitar las instrucciones perjudiciales mientras genera respuestas útiles a las instrucciones que considera responsables.
Anthropic es una startup de IA fundada en 2021 por varios exinvestigadores y ejecutivos de OpenAI, incluidos los hermanos Daniela y Dario Amodei. Amazon y Google han invertido miles de millones de dólares en la empresa, mientras que OpenAI sigue disfrutando del respaldo de Microsoft.
Los hermanos Amodei se separaron de OpenAI en 2021, un año antes de que OpenAI lanzara GPT-3.5. Este es el mismo modelo de IA que sigue impulsando la herramienta gratuita de IA ChatGPT en la actualidad. Junto con otros antiguos investigadores de OpenAI, los hermanos Amodei fundaron Anthropic AI y comenzaron a trabajar en lo que se convertiría en Claude AI.
La característica definitoria de Anthropic es su enfoque declarado de la IA ética, representado por el proceso de entrenamiento de IA constitucional.
Al lanzar Claude 3, Anthropic AI realizó una serie de pruebas comparativas de LLM para comparar sus modelos con los de sus dos principales competidores: OpenAI y Google. Tanto en esas pruebas como en otras, Claude demostró varias ventajas clave:
Capaz de responder a instrucciones de hasta 200 000 tokens(aproximadamente 350 páginas de texto), Claude puede recordar y utilizar más información al crear respuestas relevantes. En comparación, GPT-4 Turbo y GPT-4o limitan a los usuarios a 128 000 tokens.
La capacidad de Claude para retener más información permite a los usuarios crear instrucciones detalladas y llenas de datos. Cuantos más datos contenga la secuencia de entrada, más relevante puede ser la respuesta de un modelo de IA.
Cuando Anthropic probó Claude 3 frente a GPT-4 y Gemini 1.03, Claude 3 Opus obtuvo el mejor rendimiento en todos los puntos de referencia de evaluación seleccionados. Gemini 1.0 Ultra se impuso en cuatro de las seis pruebas de visión, aunque la familia de modelos Claude obtuvo resultados comparables.
Sin embargo, GPT-4o y Gemini 1.5 no se incluyeron en el grupo de pruebas. Al presentar GPT-4o en mayo de 20244, OpenAI realizó una evaluación comparativa en la que su nuevo modelo insignia superó a Claude 3 Opus en cinco de las seis pruebas realizadas.
Los usuarios preocupados por la protección de datos pueden apreciar la política de retención de datos de Anthropic5: afirman que todas las entradas y resultados de los usuarios se eliminan después de 30 días. La política de datos de Gemini para Google Cloud6 de Google dice que la empresa no entrenará sus modelos con instrucciones de los usuarios.
En comparación, OpenAI puede retener y utilizar los datos de los usuarios7 para entrenar aún más sus modelos. Las políticas de Google Gemini Apps8 permiten a la empresa conservar los datos de los usuarios a menos que el usuario desactive manualmente esta opción.
Aunque el rendimiento general de Claude es sólido en comparación con la competencia, también tiene un puñado de debilidades que pueden retrasar su aceptación por parte de la población en general.
En comparación con GPT-4o, Claude tiene menos capacidad para crear imágenes. Aunque Claude puede producir diagramas de flujo interactivos, diagramas de relación de entidades y gráficos, no llega a generar imágenes completas.
Gracias a la integración de Microsoft con Bing, GPT-4 puede buscar en internet al responder a las consultas de los usuarios. Aunque Claude se actualiza periódicamente con nuevos datos de entrenamiento, su base de conocimientos siempre está retrasada varios meses hasta que Anthropic decide abrir Claude a internet de la misma manera.
Descubra IBM Granite, nuestra familia de modelos de IA abiertos, de alto rendimiento y fiables, diseñados para la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de lenguaje, código, series temporales y límites de protección.
Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.
Busque artículos, blogs y tutoriales de IBM Developer y profundice en ellos para ampliar sus conocimientos sobre los LLM.
Aprenda a impulsar continuamente a los equipos para que mejoren el rendimiento de los modelos y superen a la competencia utilizando las últimas técnicas e infraestructuras de IA.
Explore el valor de los modelos fundacionales de nivel empresarial que proporcionan confianza, rendimiento y beneficios rentables a todos los sectores.
Aprenda a incorporar la IA generativa, el machine learning y los modelos fundacionales en sus operaciones empresariales para mejorar el rendimiento.
Explore la biblioteca de modelos fundacionales de IBM en la cartera de watsonx para escalar la IA generativa para su negocio con confianza.
Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.
Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.
Explore la biblioteca de modelos fundacionales de IBM en la cartera de IBM watsonx para escalar la IA generativa para su negocio con confianza.
1. How large is Claude Pro's Context Window? Anthropic. 2024.
2. Collective Constitutional AI: Aligning a Language Model with Public Input. Anthropic. 17 de octubre de 2023.
3. Introducing the next generation of Claude. Anthropic. 4 de marzo de 2024.
4. Hello GPT-4o. OpenAI. 13 de mayo de 2024.
5. How long do you store personal data?. Anthropic. 2024.
6. How Gemini for Google Cloud uses your data. Google. 10 de septiembre de 2024.
7. How your data is used to improve model performance. OpenAI. 17 de septiembre de 2024.
8. Gemini Apps Privacy Hub. Google. 28 de agosto de 2024.