Ya está aquí nuestra tercera generación de modelos de lenguaje de IA. Estos modelos listos para uso empresarial, adecuados para su propósito y de código abierto, ofrecen un rendimiento excepcional frente a los puntos de referencia de seguridad y en una amplia gama de tareas empresariales, desde la ciberseguridad hasta RAG.
Modelos de lenguaje de base y ajustados a las instrucciones diseñados para flujos de trabajo agénticos, RAG, resumen de textos, análisis y extracción de textos, clasificación y generación de contenidos.
Modelos de solo decodificación diseñados para tareas generativas de código, incluidas la generación, la explicación y la edición de código, entrenados con código escrito en 116 lenguajes de programación.
Ligero y preentrenado para la previsión de series temporales, optimizado para funcionar de manera eficaz en una amplia gama de configuraciones de hardware.
Proteja la IA con Granite Guardian, para garantizar la seguridad de los datos de la empresa y mitigar los riesgos en una variedad de solicitudes de usuarios y respuestas LLM, con el máximo rendimiento en más de 15 puntos de referencia de seguridad.
Elija el modelo adecuado, desde parámetros por debajo del billón hasta 34B, de código abierto bajo Apache 2.0.
No sacrifique el rendimiento en aras del coste. Granite supera a los modelos comparables1 en una gran variedad de tareas empresariales.
Cree una IA responsable con un conjunto completo de capacidades de detección de riesgos y daños, transparencia y protección de la propiedad intelectual.
Implemente modelos Granite de código abierto en producción con Red Hat Enterprise Linux AI y watsonx, que le proporcionan el soporte y las herramientas necesarias para implementar con confianza la IA a escala. Construya más rápido con capacidades como la llamada a herramientas, 12 lenguajes, adaptadores multimodales (próximamente) y mucho más.
Descubra cómo crear un agente de IA que pueda responder preguntas
En este tutorial, utilizará el modelo IBM Granite-3.0-8B-Instruct ahora disponible en watsonx.ai para realizar llamadas a funciones personalizadas.
Cuantifique un modelo preentrenado de varias formas diferentes para mostrar el tamaño de los modelos y comparar su rendimiento en una tarea.
Utilice el marco Ragas para evaluar la generación aumentada de recuperación (RAG) en Python utilizando LangChain
Pronostique el futuro en función del aprendizaje con el modelo Granite TinyTimeMixer (TTM)
Convierta texto en una representación estructurada y genere una consulta SQL semánticamente correcta
Prompt sintoniza un modelo Granite en Python mediante un conjunto de datos sintéticos que contenga reseñas positivas y negativas de clientes
Este informe presenta Granite 3.0 y divulga los detalles técnicos de la formación previa y posterior para acelerar el desarrollo de modelos fundacionales abiertos.
Formados en 12 idiomas + 116 lenguajes de programación, los nuevos modelos Granite 3.0 8B y 2B ya están aquí. Explore los nuevos puntos de referencia en rendimiento, seguridad y protección + los últimos tutoriales.
Los usuarios de SAP ya pueden aprovechar la potencia de IBM watsonx e IBM Granite, empezando por Granite.13b.chat, el modelo de lenguaje de gran tamaño, disponible a través del centro de IA generativa en SAP AI core en SAPBusiness Technology Platform (SAP BTP).
Un informe del Centro de Investigación sobre Modelos Fundacionales de la Universidad de Stanford demostró que el modelo de IBM obtuvo una puntuación perfecta del 100 % en varias categorías diseñadas para medir la apertura real de los modelos.
IBM cree en la creación, implementación y utilización de modelos de IA que impulsen la innovación en toda la empresa de manera responsable. La plataforma de datos e IA IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones, y empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y técnicas de tokenización, todo ello antes de la fase de entrenamiento del modelo.
Durante el proceso de entrenamiento con datos, trabajamos para evitar desajustes en los resultados del modelo y utilizamos ajustes supervisados para facilitar el seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante prompt engineering. Seguimos desarrollando los modelos Granite en varias direcciones, incluidas otras modalidades, contenidos específicos del sector y anotaciones de datos adicionales para el entrenamiento, al tiempo que implementamos salvaguardas regulares y continuas de protección de datos para los modelos desarrollados por IBM.
Dada la rápida evolución del panorama tecnológico de la IA generativa, se espera que nuestros procesos integrales evolucionen y mejoren continuamente. Como testimonio del rigor que IBM pone en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que proporciona para el hardware y los productos de software de IBM.
Además, a diferencia de otros proveedores de grandes modelos de lenguaje y en consonancia con el enfoque estándar de IBM en materia de indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen de los modelos desarrollados por IBM. Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en los resultados del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante ingeniería rápida.
Entre los modelos watsonx que actualmente gozan de estas protecciones figuran:
(1) Familia Slate de modelos solo con codificador.
(2) Familia Granite de modelo solo con decodificador.
1Rendimiento de los modelos Granite realizados por IBM Research frente a los principales modelos abiertos, tanto en el ámbito académico como en el empresarial - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models