IBM modelos de base
En IBM watsonx.ai, puede utilizar modelos base de IBM creados con integridad y diseñados para la empresa.
La familia Granite de modelos de base de IBM incluye modelos de solo decodificador que pueden predecir y generar lenguaje de forma eficiente.
Los modelos se han creado con datos de confianza que tienen las características siguientes:
- Procedente de conjuntos de datos de calidad en dominios como finanzas (SEC Filings), derecho (Free Law), tecnología (Stack Exchange), ciencia ( arXiv, DeepMind Matemáticas), literatura (Proyecto Gutenberg ( PG-19)), y más.
- Cumple con los rigurosos estándares de gobierno y autorización de datos de IBM .
- Se ha borrado el odio, el abuso y la blasfemia, la duplicación de datos y los URL incluidos en la lista de elementos bloqueados, entre otras cosas.
IBM se compromete a crear una IA abierta, fiable, selectiva y potenciadora. Para más información sobre las protecciones contractuales relacionadas con la indemnización IBM, consulte el Acuerdo de Relación con el Cliente IBM. Para más información sobre la descripción del servicio IBM watsonx.ai con varios proveedores de nube, consulte:
Los siguientes modelos de base de IBM están disponibles en watsonx.ai:
- granite-4-h-small
- granite-4-h-tiny
- granite-4-h-micro
- granite-3-3-2b-instruct
- granite-3-3-8b-instruct
- granite-3-2-8b-instruct
- granite-3-1-8b-base
- granite-3-1-8b-instruct
- granite-3-8b-instruct
- granite-3-8b-base
- granite-7b-lab
- granite-8b-japanese
- granite-13b-chat-v2
- granite-20b-multilingual
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-20b-code-base-schema-linking
- granite-20b-code-base-sql-gen
- granite-34b-code-instruct
- granite-guardian-3-8b
- granite-ttm-512-96-r2
- granite-ttm-1024-96-r2
- granite-ttm-1536-96-r2
- granite-vision-3-3-2b
Para obtener más información sobre los modelos de codificador desarrollados por IBM, consulte Modelos de codificador compatibles.
Para obtener detalles sobre los modelos de base de terceros, consulte Modelos de base de terceros.
Cómo elegir un modelo
Para revisar los factores que pueden ayudarle a elegir un modelo, como las tareas e idiomas compatibles, consulte Elegir un modelo y Puntos de referencia del modelo Foundation.
Un modelo base obsoleto se resalta con un icono de advertencia de obsolescencia. Para obtener más información sobre la obsolescencia y retirada de modelos, consulte Ciclo de vida del modelo base.
Detalles del modelo de base
Los modelos básicos de watsonx.ai admiten una serie de casos de uso tanto para lenguajes naturales como para lenguajes de programación. Para ver los tipos de tareas que estos modelos pueden hacer, revise y pruebe las indicaciones de muestra. Para ver los detalles de precios de los modelos básicos de implementación a pedido, consulte Tarifas de facturación por hora para modelos de implementación a pedido.
- Más información
- Lea los siguientes recursos:
Granite 4 modelos
Los modelos de cimientos Granite 4.0 pertenecen a la familia de modelos IBM Granite. Los modelos granite-4-h-small, granite-4-h-micro y granite-4-h-tiny son modelos de seguimiento de instrucciones diseñados para capacidades estructuradas y de contexto largo. Los modelos utilizan el ajuste fino, el aprendizaje por refuerzo y la fusión de modelos para mejorar el rendimiento. 4.0Granite Ofrece una mejor gestión de las instrucciones y el uso de herramientas, lo que lo hace muy adecuado para tareas empresariales.
- Uso
Está diseñado para responder a instrucciones generales y puede utilizarse para crear asistentes de IA para múltiples dominios, incluidas las aplicaciones empresariales. El modelo es capaz de realizar tareas generativas comunes, incluyendo resumen, clasificación de texto, extracción de texto, respuesta a preguntas, generación aumentada por recuperación (RAG), tareas de llamada a funciones, código Fill-In-the-Middle (FIM) y casos de uso de diálogo multilingüe.
- Size
- Pequeño: 30.000 millones de parámetros
- Pequeño: 7 mil millones de parámetros
- Micro: 3 mil millones de parámetros
- Pequeño: 30.000 millones de parámetros
- Disponibilidad
- Pequeño: Proporcionado por IBM implementado en hardware multitenant e implementado bajo demanda para uso dedicado.
- Pequeño: Implementación bajo demanda para uso dedicado.
- Micro: Implementación bajo demanda para uso dedicado.
- Nivel de precios API
- Pequeño: Nivel de entrada: Clase 18 Nivel
de salida: Clase 5
Para obtener detalles sobre los precios de implementacióngranite-4-h-smallen hardware multitenant, consulte la Tabla 2. - Para obtener información detallada sobre los precios del uso dedicado, consulte las tarifas de facturación por hora para los modelos de implementación bajo demanda.
- Pequeño: Nivel de entrada: Clase 18 Nivel
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida):
- granite-4-h-small: 131 072
- granite-4-h-tiny: 131 072
- granite-4-h-micro: 131 072
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, neerlandés y chino. Los usuarios pueden ajustar los modelos Granite 4.0 más allá de estos idiomas.
- Información de ajuste de instrucciones
Los modelos Granite 4 se ajustan a partir de Granite-4.0-H-Small-Base utilizando una combinación de conjuntos de datos de instrucciones de código abierto con licencia permisiva y conjuntos de datos sintéticos recopilados internamente.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
Granite Instruir 3.3 Modelos
Los modelos de base de la colección Granite Instruct pertenecen a la familia de modelos IBM Granite. Los modelos de cimientos granite-3-3-2b-instruct y granite-3-3-8b-instruct son los modelos de cimientos Granite 3.3 Instruct. Estos modelos se basan en versiones anteriores para mejorar las capacidades de razonamiento, matemáticas, codificación y seguimiento de instrucciones.
- Uso
Diseñado para sobresalir en tareas de contexto largo y seguimiento de instrucciones, como resumen, resolución de problemas, traducción de textos, razonamiento, tareas de codificación, llamada de funciones, etc. Puede integrarse en asistentes de IA de diversos ámbitos.
- Tamaños
- 2000 millones de parámetros
- 8 mil millones de parámetros
- Disponibilidad
- granite-3-3-2b-instruct: Despliegue bajo demanda para uso exclusivo.
- granite-3-3-8b-instruct: Implementación bajo demanda para uso dedicado.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Pruébela
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida)
- 2b: 131 072
- 8b: 131 072
Nota: El número máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 16 384.
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, neerlandés y chino. Sin embargo, los usuarios pueden ajustar estos modelos Granite para idiomas distintos a estos 12.
- Lenguajes de programación soportados
Los modelos de la Unidad de Respuesta Rápida ( Granite Instruct ) están entrenados con código escrito en 116 lenguajes de programación.
- Información de ajuste de instrucciones
Los Granite Instruct modelos son modelos base Granite Instruct ajustados, entrenados con más de 12 billones de tokens, utilizando una combinación de datos de instrucción de código abierto con licencia permisiva y datos de instrucción propietarios.
- Arquitectura del modelo
decodificador
- Licencia
Consulte la descripción del servicio watsonx.ai en AWS :
Consulte las descripciones de los dos servicios que componen watsonx.ai en IBM Cloud :
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-3-2-8b-instruct
Granite 3.2 Instruct es un modelo básico de contexto largo que se ha ajustado para mejorar las capacidades de razonamiento. La capacidad de razonamiento es configurable, lo que significa que puede controlar cuándo se aplica el razonamiento.
- Uso
Capaz de realizar tareas generativas comunes, incluidas tareas relacionadas con el código, llamadas a funciones y diálogos multilingües. Se especializa en tareas de razonamiento y contexto extenso, como resumir documentos largos o transcripciones de reuniones. Puede responder a preguntas con respuestas basadas en el contexto proporcionado por documentos extensos.
- Size
8 mil millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso dedicado
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Pruébela
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 131 072
Nota: El número máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 16 384.
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, holandés y chino
- Información de ajuste de instrucciones
Basado en Granite-3.1-8B-Instruct, el modelo se entrenó utilizando una combinación de conjuntos de datos de código abierto con licencia permisiva y datos sintéticos generados internamente diseñados para tareas de razonamiento.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-3-1-8b-base
El modelo de base « granite-3-1-8b-base » es un modelo básico que pertenece a la familia de modelos « IBM » « Granite » « 3.1 ». El modelo amplía la longitud del contexto de granite-3-8b-base.
- Uso
El Granite 3.1 modelo base es un modelo autorregresivo preentrenado destinado a tareas de ajuste, resumen, clasificación de texto, extracción, respuesta a preguntas y otras tareas de contexto largo.
Puede utilizar el
granite-3-1-8b-basemodelo base para realizar ajustes precisos.- Size
8 mil millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso exclusivo.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 131 072
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, neerlandés y chino. Los usuarios pueden ajustar los modelos Granite 3.1 para idiomas distintos a estos 12 idiomas.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
Modelos de Granite Instruct 3.1
Los modelos de base de la colección Granite Instruct pertenecen a la familia de modelos IBM Granite. El modelo granite-3-8b-instruct base es un modelo base « Granite3.1 Instruct». El modelo se basa en iteraciones anteriores para proporcionar un mejor soporte para las tareas de codificación y las funciones intrínsecas de los agentes.
El modelo granite-3-1-8b-instruct base es un modelo base de Instruct ( Granite3.1 ) que está disponible para su implementación bajo demanda.
- Uso
Granite Instruct los modelos de base están diseñados para sobresalir en tareas de seguimiento de instrucciones, como resumen, resolución de problemas, traducción de textos, razonamiento, tareas de código, llamada de funciones y más.
- Tamaños
8 mil millones de parámetros
- Disponibilidad
granite-3-8b-instruct: Proporcionado por IBM implementado en hardware multitenant.
granite-3-1-8b-instruct: Implementar bajo demanda para uso dedicado.
El modelo de base « granite-3-8b-instruct » ha quedado obsoleto. Véase Ciclo de vida del modelo Foundation.
- Nivel de precios API
Clase 12 para la
granite-3-8b-instructimplementación del modelo multitenant. Para obtener más información sobre los precios, consulte la tabla 2a.Para obtener información detallada sobre los precios del modelo
granite-3-1-8b-instructde implementación bajo demanda, consulte la Tabla 4.- Pruébela
Experimenta con muestras:
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida):
- granite-3-8b-instruct: 131 072
El máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 8192.
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, holandés, chino (simplificado).
- Lenguajes de programación soportados
Los Granite Instruct modelos se entrenan con código escrito en 116 lenguajes de programación.
- Información de ajuste de instrucciones
Los Granite Instruct modelos son modelos base Granite Instruct ajustados, entrenados con más de 12 billones de tokens, utilizando una combinación de datos de instrucción de código abierto con licencia permisiva y datos de instrucción propietarios.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-3-8b-base
El modelo de base Granite 8b es un modelo base que pertenece a la familia de modelos IBM Granite. El modelo se entrena con 10 billones de tokens procedentes de diversos dominios, y luego se entrena con 2 billones de tokens de datos de alta calidad que se eligen cuidadosamente para mejorar el rendimiento del modelo en tareas específicas.
- Uso
El modelo base de la base de datos de la Granite 3.0 es un modelo de referencia que puede personalizar para crear modelos especializados para escenarios de aplicación específicos.
- Size
8 mil millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso exclusivo.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 4096
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, holandés, chino (simplificado).
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-7b-lab
IBM proporciona el modelo de base granite-7b-lab. El modelo de base de la Fundación de la Academia de Ciencias de Nueva York ( granite-7b-lab ) utiliza un novedoso método de ajuste de alineación de la investigación de la Universidad de Columbia ( IBM ). La alineación a gran escala para modelos de base ( chatBots,, LAB) es un método para añadir nuevas habilidades a los modelos de base existentes mediante la generación de datos sintéticos para dichas habilidades. A continuación, los datos se pueden utilizar para ajustar el modelo base.
- Uso
Admite tareas de propósito general, como extracción, resumen, clasificación y más. Siga las pautas indicadas para obtener consejos sobre su uso. Para más información, consulte Solicitar un granite-7b-lab.
- Size
7 mil millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso exclusivo.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Pruébela
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 8192
Nota: El número máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 4096.
- Idiomas naturales admitidos
Inglés
- Información de ajuste de instrucciones
El modelo de la fundación granite-7b-lab se entrena de forma iterativa utilizando la metodología de alineación a gran escala para chatbots (LAB).
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-8b-japanese
El modelo de granite-8b-japanese es proporcionado por IBM. El modelo base granite-8b-japanese es una variante de instruct que se inicializa a partir del modelo japonés Granite Base 8 Billion previamente entrenado y está entrenado para comprender y generar texto en japonés.
- Uso
Útil para tareas de uso general en idioma japonés, como clasificación, extracción, preguntas y respuestas, y para la traducción de idiomas entre japonés e inglés.
- Size
8 mil millones de parámetros
- Disponibilidad
- Implementación bajo demanda para uso exclusivo, excepto en el centro de datos de Fráncfort.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Pruébela
Experimenta con muestras:
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 4096
- Idiomas naturales admitidos
Inglés, japonés
- Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. El modelo de aprendizaje profundo ( granite-8b-japanese ) se entrenó previamente con un billón de tokens de texto en inglés y un billón de tokens de texto en japonés ( 0.5 ).
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-13b-chat-v2
El modelo de granite-13b-chat-v2 es proporcionado por IBM. Este modelo está optimizado para casos de uso de diálogo y funciona bien con agentes virtuales y aplicaciones de chat.
Uso : genera una salida de diálogo como un chatbot. Utiliza un formato de aviso específico para cada modelo. Incluye una palabra clave en su salida que puede utilizarse como secuencia de parada para producir respuestas sucintas. Siga las pautas indicadas para obtener consejos sobre su uso. Para más información, consulte Solicitar un granite-13b-chat-v2.
- Size
13 mil millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso exclusivo.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Pruébela
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 8192
- Idiomas naturales admitidos
Inglés
- Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. Los datos utilizados para entrenar los modelos se someten primero a revisiones de gobernanza de datos e IBM es y se les filtra el texto que está marcado por odio, abuso o blasfemia por el filtro HAP desarrollado por la Fundación contra la Difamación ( IBM ). IBM comparte información sobre los métodos de formación y los conjuntos de datos utilizados.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
granite-20b-multilingual
Un modelo básico de la familia de joyas de Tiffany & Co. ( IBM ) Granite. El modelo de la fundación granite-20b-multilingual se basa en el modelo básico de 20 000 millones de dólares de la Fundación Granite, y está entrenado para comprender y generar texto en inglés, alemán, español, francés y portugués.
- Uso
Tareas de respuesta a preguntas, resumen, generación, extracción y clasificación en dominios cerrados en inglés, alemán, español, francés y portugués.
- Size
20 000 millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso exclusivo.
- Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
- Pruébela
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 8192
- Idiomas naturales admitidos
Inglés, alemán, español, francés y portugués
- Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. Los datos utilizados para entrenar los modelos se someten primero a revisiones de gobernanza de datos e IBM es y se les filtra el texto que está marcado por odio, abuso o blasfemia por el filtro HAP desarrollado por la Fundación contra la Difamación ( IBM ). IBM comparte información sobre los métodos de formación y los conjuntos de datos utilizados.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
Modelos de Granite Code
Los Granite Code modelos son modelos básicos de la familia IBMGranite. Los modelos básicos son modelos que siguen instrucciones y se ajustan mediante una combinación de compromisos de Git junto con instrucciones humanas y conjuntos de datos de instrucciones de código generados sintéticamente de código abierto.
El modelo de base granite-8b-code-instruct v2.0.0 puede procesar mensajes más grandes con una mayor longitud de ventana de contexto.
- Uso
Los siguientes modelos de base de código abierto ( Granite Code ) están diseñados para responder a instrucciones relacionadas con la codificación y pueden utilizarse para crear asistentes de codificación:
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
Los siguientes modelos de base de datos de Granite Code son versiones ajustadas a las instrucciones del modelo de base de datos de granite-20b-code-base que están diseñadas para tareas de generación de texto a SQL.
- granite-20b-code-base-schema-linking
- granite-20b-code-base-sql-gen
- Tamaños
- 3000 millones de parámetros
- 8 mil millones de parámetros
- 20 000 millones de parámetros
- 34 mil millones de parámetros
- Disponibilidad
granite-8b-code-instruct : Proporcionado por IBM, implementado en hardware multitenant
Todos Granite Code los modelos: Implementación bajo demanda para uso dedicado.
- Nivel de precios API
Clase 1 para la implementación del modelo multitenant. Para obtener más información sobre los precios, consulte la tabla 2a.
Para obtener detalles sobre los precios de los modelos de implementación bajo demanda, consulte la Tabla 4.
- Pruébela
Experimenta con muestras:
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida)
granite-3b-code-instruct : 128 000
granite-8b-code-instruct : 128 000
Cuando el modelo se ejecuta únicamente en un entorno multitenant, se aplica un límite máximo de tokens nuevos, lo que significa que los tokens generados por el modelo base por solicitud están limitados a 8192.
granite-20b-code-instruct : 8192
El máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 4096.
granite-20b-code-base-schema-linking : 8192
granite-20b-code-base-sql-gen : 8192
granite-34b-code-instruct : 8192
- Idiomas naturales admitidos
Inglés
- Lenguajes de programación soportados
Los modelos Granite Code básicos admiten 116 lenguajes de programación, entre los que se incluyen PythonJavaScript, Java, C++, Go y Rust. Para ver la lista completa, consulte IBM foundation models.
- Información de ajuste de instrucciones
Estos modelos se perfeccionaron a partir de modelos básicos de Granite Code , basándose en una combinación de datos de instrucciones con licencia permisiva para mejorar las capacidades de seguimiento de instrucciones, incluidas las habilidades de razonamiento lógico y resolución de problemas.
- Arquitectura del modelo
decodificador
- Licencia
Consulte la descripción del servicio watsonx.ai en AWS :
Consulte las descripciones de los dos servicios que componen watsonx.ai en IBM Cloud :
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
- Documento de investigación sobre los modelos de código deGranite
- Escalado Granite Código modelos documento de investigación
- 3b Tarjeta modelo
- 8b Tarjeta de modelo (Multitenant)
- 8b Tarjeta de modelo (Dedicada)
- 20b Tarjeta modelo
- 20b Esquema base que vincula la tarjeta del modelo
- 20b Tarjeta del modelo base SQL gen
- 34b Tarjeta modelo
granite-guardian-3-8b
Los modelos de base de la colección Granite Guardian pertenecen a la familia de modelos IBM Granite. Los modelos Guardian Foundation de Granite son modelos Granite Instruct ajustados diseñados para detectar riesgos en las indicaciones y respuestas. El modelo básico ayuda a detectar riesgos en muchas dimensiones clave del Atlas de Riesgos de la IA.
La versión de generación e 3.1 e de los modelos se entrena con una combinación de datos sintéticos adicionales y anotados por humanos para mejorar el rendimiento en cuanto a riesgos relacionados con alucinaciones y fugas.
- Uso
Diseñado para detectar riesgos que puedan causar daño en los mensajes de texto o en las respuestas de los modelos (a modo de medidas de seguridad). Los modelos pueden utilizarse en casos de uso de generación aumentada por recuperación para evaluar la relevancia del contexto (si el contexto recuperado es relevante para la consulta), la fundamentación (si la respuesta es precisa y fiel al contexto proporcionado) y la relevancia de la respuesta (si la respuesta aborda directamente la consulta del usuario).
- Tamaños
8 mil millones de parámetros
- Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
- Nivel de precios API
Clase 12. Para más detalles, véase la tabla 2a.
- Pruébela
Experimenta con muestras:
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida)
- granite-guardian-3-8b: 131 072
Nota: El máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 8192.
- Idiomas naturales admitidos
Inglés
- Información de ajuste de instrucciones
Los Granite Guardian modelos son modelos Granite Instruct ajustados con precisión entrenados con una combinación de datos sintéticos y anotados por humanos.
- Arquitectura del modelo
decodificador
- Licencia
Consulte la descripción del servicio watsonx.ai en AWS :
Consulte las descripciones de los dos servicios que componen watsonx.ai en IBM Cloud :
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
Modelos de Granite time series
Granite time series los modelos Foundation pertenecen a la familia de modelos IBM Granite. Estos modelos son modelos compactos y preentrenados para la previsión de series temporales multivariantes de la investigación de la Universidad de Carolina del Norte ( IBM ). Las siguientes versiones están disponibles para su uso en la previsión de datos en watsonx.ai:
- granite-ttm-512-96-r2
- granite-ttm-1024-96-r2
- granite-ttm-1536-96-r2
- Uso
Puede aplicar uno de estos modelos preentrenados a sus datos de destino para obtener una previsión inicial sin tener que entrenar el modelo con sus datos. Cuando se les proporciona un conjunto de observaciones de datos históricos y cronometrados, los modelos de la fundación Granite time series , pueden aplicar su comprensión de los sistemas dinámicos para pronosticar valores de datos futuros. Estos modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y generan un conjunto de datos de previsión con hasta 96 puntos de datos por canal objetivo.
- Size
1 millón de parámetros
- Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
- Nivel de precios API
- Entrada: Clase 14
- Salida: Clase 15
Para obtener más información sobre los precios, consulte la tabla 2b.
- Pruébela
- Longitud del contexto
Puntos de datos mínimos requeridos por canal en la solicitud de API:
- granite-ttm-512-96-r2: 512
- granite-ttm-1024-96-r2: 1024
- granite-ttm-1536-96-r2: 1536
- Idiomas naturales admitidos
Inglés
- Información de ajuste de instrucciones
Los modelos de aprendizaje profundo ( Granite time series ) se entrenaron con casi mil millones de muestras de datos de series temporales de diversos ámbitos, como electricidad, tráfico, fabricación y otros.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos:
Granite Visión 3.3 2b
Granite Vision 3.3 2b es un modelo básico de lenguaje de visión compacto y eficiente que se ha creado para casos de uso empresarial. El modelo granite-vision-3-3-2b introduce nuevas funciones experimentales, como la segmentación de imágenes, la generación de etiquetas y el soporte multipágina. El modelo también ofrece una mayor seguridad en comparación con los anteriores modelos de visión Granite.
- Uso
El modelo de base granite-vision-3-3-2b está diseñado para la comprensión visual de documentos, lo que permite la extracción automatizada de contenido de tablas, gráficos, infografías, diagramas, etc.
- Size
2000 millones de parámetros
- Disponibilidad
Implementación bajo demanda para uso exclusivo.
- Nivel de precios API
Para más detalles sobre precios, consulte Tarifas de facturación por hora para modelos de despliegue bajo demanda.
- Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 131 072
- Idiomas naturales admitidos
Inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, neerlandés y chino.
- Información de ajuste de instrucciones
El modelo de base granite-vision-3-3-2b se entrenó con un conjunto de datos curados de seguimiento de instrucciones, compuesto por diversos conjuntos de datos públicos y sintéticos diseñados para apoyar una amplia gama de tareas de comprensión de documentos e imágenes en general. El modelo se entrenó afinando el modelo base granite-3-2b-instruct con las modalidades de imagen y texto.
- Arquitectura del modelo
decodificador
- Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
- watsonx.ai Descripción del servicio de tiempo de ejecución
- watsonx.ai Descripción del servicio de estudio
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
- Más información
- Lea los siguientes recursos: