Cómo determinar qué modelos e imágenes se deben replicar en tu registro de contenedores privado (Actualización de la versión 5.3.x a una versión posterior: actualización de 5.3 )
Si utilizas un registro de contenedores privado, es posible que tengas que replicar imágenes y modelos adicionales, como los modelos base, en tu registro. Las imágenes y los modelos adicionales que necesites dependerán de los servicios que tengas previsto actualizar y de las funciones que quieras activar. Antes de actualizar IBM® Software Hub, determine qué imágenes y modelos adicionales necesita replicar.
- Fase de actualización
Actualización de tu estación de trabajo de cliente
Recopilación de la información necesaria
Preparación para realizar una actualización en una red restringida
Preparación para realizar una actualización desde un registro de contenedores privado
Actualización del software necesario
Actualización de los componentes compartidos del clúster
Preparación para actualizar una instancia
Actualización de una instancia
- ¿Quién debe realizar esta tarea?
Equipo de operaciones : El equipo IBM Software Hub de operaciones debe determinar qué imágenes y modelos adicionales se deben replicar.
- ¿Cuándo tienes que terminar esta tarea?
Realiza esta tarea antes de realizar cualquiera de las siguientes:
- Duplicar el contenido en un registro de contenedores privado.
- Actualiza IBM Software Hub tu clúster.
Repítelo tantas veces como sea necesario. Es posible que tengas que repetir esta tarea si tienes previsto actualizar varias instancias de IBM Software Hub, sobre todo si las instancias incluyen servicios diferentes.
Acerca de esta tarea
Algunas imágenes y modelos no se replican de forma predeterminada al replicar las imágenes de un servicio en tu registro de contenedores privado. En algunos casos, las imágenes o los modelos no se replican porque solo son necesarios para habilitar funciones opcionales. En otros casos, los modelos no se duplican porque hay una gran cantidad de modelos entre los que elegir, y duplicarlos todos requeriría una cantidad considerable de espacio de almacenamiento.
Además, si un servicio depende de un modelo disponible a través watsonx.ai™Inference foundation models del componente (el watsonx_ai_ifm componente), dicho modelo no se duplica de forma predeterminada al duplicar las imágenes del servicio.
- ¿Qué servicios incluyen imágenes opcionales?
- ¿Qué servicios requieren que se activen funciones opcionales?
- ¿Qué servicios requieren modelos que no se replican de forma predeterminada?
Esta tarea también indica el grupo que debes especificar para duplicar cada modelo o imagen. Utiliza esta información para configurar la variable IMAGE_GROUPS de entorno.
Procedimiento
Consulte la siguiente tabla para determinar si los servicios que tiene previsto actualizar utilizan modelos y si estos son opcionales u obligatorios.
| Servicio | Imágenes opcionales o modelos de base |
|---|---|
| AI Factsheets | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Analytics Engine powered by Apache Spark | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Cognos Analytics | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Cognos Dashboards | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Data Gate | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Data Privacy | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Data Product Hub | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Data Refinery | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Data Replication | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| DataStage | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Data Virtualization | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Db2 | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Db2 Big SQL | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Db2 Data Management Console | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Db2 Warehouse | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Decision Optimization | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| EDB Postgres | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Execution Engine for Apache Hadoop | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| IBM Knowledge Catalog | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| IBM Knowledge Catalog Premium | Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo base necesario. |
| IBM Knowledge Catalog Standard | Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo base necesario. |
| IBM Manta Data Lineage | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| IBM Master Data Management | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| IBM StreamSets | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Informix | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| MANTA Automated Data Lineage | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| MongoDB | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| OpenPages | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Orchestration Pipelines | Puedes elegir si deseas duplicar las imágenes opcionales. Consulte las imágenes opcionales de « Orchestration Pipelines ». |
| Planning Analytics | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Product Master | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| RStudio® Server Runtimes | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| SPSS Modeler | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Synthetic Data Generator | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Voice Gateway | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Watson Discovery | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Watson Machine Learning | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Watson OpenScale | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Watson Speech services | Puedes elegir qué modelos duplicar. Consulte: |
| Watson Studio | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| Watson Studio Runtimes | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx.ai | Puedes elegir qué modelos duplicar. |
| watsonx Assistant | Puedes elegir qué modelos duplicar. Consulte los modelos de base en watsonx Assistant. |
| watsonx™ BI | Debes replicar el modelo requerido. Consulte los modelos básicos de BI de « watsonx ». |
| watsonx Code Assistant™ | Debes replicar el modelo requerido. |
| watsonx Code Assistant for Red Hat® Ansible® Lightspeed | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx Code Assistant for Z | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx Code Assistant for Z Agentic | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx Code Assistant for Z Code Explanation | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx Code Assistant for Z Code Generation | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx Code Assistant for Z Understand | Los requisitos dependen de la versión a IBM Software
Hub la que vayas a actualizar:
|
| watsonx.data™ | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx.data Premium | Debes duplicar los modelos necesarios. |
| watsonx.data integration | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx.data intelligence | Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo base necesario. |
| watsonx.governance™ | No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada. |
| watsonx Orchestrate | Puedes elegir qué modelos de base quieres replicar. |
Modelos para IBM Knowledge Catalog Standard
Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo especificado.
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| granite-3-8b-instruct |
|
ibmwxGranite38BInstruct |
Imágenes opcionales para Orchestration Pipelines
Puedes elegir si deseas replicar las imágenes opcionales para Orchestration Pipelines:
| Imagen | Características que ofrece la imagen | Grupo de imágenes |
|---|---|---|
run-bash-script |
Ejecuta scripts de Bash que no utilicen ningún paquete de OpenSSH ni paquetes Db2 binarios. | ibmwsprbsnossh |
Modelos para Watson Speech to Text
Si tiene previsto habilitar las mejoras, debe replicar el modelo especificado.
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| mistral-small-3-1-24b-instruct-2503 |
|
ibmwxMistralSmall3124BInstruct2503 |
Además, puedes elegir qué modelos de lenguaje quieres replicar.
| Idioma | Modelos incluidos | Grupo de imágenes |
|---|---|---|
| Holandés (nl) | Neerlandés, belga (nl-BE)
|
ibmwatsonspeech-stt-nl |
| Inglés [en] | Inglés, Australia (en-AU)
|
Las plantillas siempre se incluyen al duplicar las imágenes para Watson Speech services. |
| Inglés [en] | Inglés internacional (en)
|
ibmwatsonspeech-stt-en |
| Francés [fr] | Francés (fr-FR)
|
ibmwatsonspeech-stt-fr |
| Alemán (de) | Alemán (de-DE)
|
ibmwatsonspeech-stt-de |
| Italiano [it] | Italiano (it-IT)
|
ibmwatsonspeech-stt-it |
| Japonés (ja) | Japonés (ja-JP)
|
ibmwatsonspeech-stt-ja |
| Coreano (ko) | Coreano (ko-KR)
|
ibmwatsonspeech-stt-ko |
| Portugués (pt) | Portugués (pt-PT)
|
ibmwatsonspeech-stt-pt |
| Español (es) | Español, argentino (es-AR)
|
ibmwatsonspeech-stt-es |
| Otros idiomas | Árabe estándar moderno (ar-MS)
|
ibmwatsonspeech-stt-misc |
| Modelos híbridos obsoletos | Árabe estándar moderno (AR-MS)
|
ibmwatsonspeech-stt-hybrid |
Modelos para Watson Text to Speech
Puedes elegir qué modelos de lenguaje quieres replicar.
| Idioma | Modelos incluidos | Grupo de imágenes |
|---|---|---|
| Inglés [en] | Inglés (EE. UU.) (en-US) Voces neuronales expresivas:
Voces neuronales mejoradas ( V3 ):
|
Las plantillas siempre se incluyen al duplicar las imágenes para Watson Speech services. |
| Inglés [en] | Inglés, Australia (en-AU) Voces neuronales expresivas:
Voces naturales:
Inglés, Canadá (en-CA) Voces naturales: Inglés, Reino Unido (en-GB)
Voces neuronales expresivas:
Voces neuronales mejoradas ( V3 ):
Voces naturales: Inglés (EE. UU.) (en-US)
Voces neuronales expresivas:
Voces neuronales mejoradas ( V3 ):
Voces naturales:
|
ibmwatsonspeech-tts-en |
| Francés [fr] | Francés (fr-FR) Voces neuronales mejoradas ( V3 ): Francés, canadiense (fr-CA)
Voces neuronales mejoradas ( V3 ):
|
ibmwatsonspeech-tts-fr |
| Alemán (de) | Alemán (de-DE) Voces neuronales mejoradas ( V3 ):
|
ibmwatsonspeech-tts-de |
| Español (es) | Español, castellano (es-ES) Voces neuronales mejoradas ( V3 ): Español, Latinoamérica (es-LA)
Voces neuronales mejoradas ( V3 ):
Voces naturales: Español, EE. UU. (es-US)
Voces neuronales mejoradas ( V3 ):
|
ibmwatsonspeech-tts-es |
| Otros idiomas | Neerlandés (nl-NL) Voces neuronales mejoradas ( V3 ): Italiano (it-IT)
Voces neuronales mejoradas ( V3 ): Japonés (ja-JP)
Voces neuronales mejoradas ( V3 ): Coreano (ko-KR)
Voces neuronales mejoradas ( V3 ): Portugués (Brasil) (pt-br)
Voces neuronales expresivas:
Voces neuronales mejoradas ( V3 ):
Voces naturales:
|
ibmwatsonspeech-tts-misc |
Modelos para watsonx.ai
Puedes elegir qué modelos quieres duplicar.
- Modelos fundacionales
- Modelos de incrustación
- Modelos de reordenación
- Modelos de extracción de texto
- modelos de serie temporal
- Modelos base disponibles para ajustar
- Modelos fundacionales
Modelo Descripción Grupo de imágenes allam-1-13b-instruct Estado: Disponible
Un modelo lingüístico bilingüe de gran tamaño para el árabe y el inglés, inicializado con pesos de « Llama-2 » y ajustado para realizar tareas de conversación. ibmwxAllam113bInstructcodestral-2501 Estado: Disponible
Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxCodestral2501codestral-2508 Estado: Disponible
Ideal para la generación de código y la finalización de código mediante el método «fill-in-the-middle» (FIM) de alta precisión. El modelo base está optimizado para entornos de ingeniería de producción, como aquellos sensibles a la latencia, que tienen en cuenta el contexto y que se pueden implementar de forma autónoma. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxCodestral2508codestral-22b Estado: Retirado
Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxCodestral22Bdevstral-medium-2507 Estado: Disponible
El modelo básico « devstral-medium-2507 » de Mistral AI es un modelo de alto rendimiento para la generación de código y el razonamiento agencial. Ideal para la generalización entre distintos estilos de indicaciones y el uso de herramientas en agentes de código y marcos de trabajo. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxDevstralMedium2507devstral-medium-2512 Estado: Disponible
5.3.1 y más tarde
El modelo base « devstral-medium-2512 » de Mistral AI es un modelo con capacidad de actuación propio de la familia de modelos Devstral 2, diseñado para tareas de ingeniería de software, que destaca por su capacidad para utilizar herramientas destinadas a explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxDevstralMedium2512devstral-small-2512 Estado: Disponible
5.3.1 y más tarde
El modelo base « devstral-small-2512 » de Mistral AI es un modelo con capacidad de actuación propio de la familia de modelos Devstral 2, diseñado para tareas de ingeniería de software, que destaca por su capacidad para utilizar herramientas destinadas a explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software. ibmwxDevstralSmall2512flan-t5-xl-3b Estado: Retirado
Uso general con indicaciones de «zero-shot» o «few-shot». ibmwxGoogleFlanT5xlgpt-oss-20b Estado: Disponible
Los modelos base gpt-oss son modelos de peso abierto de la red « OpenAI’s », diseñados para un razonamiento potente, tareas de tipo agente, ajuste fino y diversos casos de uso para desarrolladores. ibmwxGptOss20Bgpt-oss-120b Estado: Disponible
Los modelos base gpt-oss son modelos de peso abierto de la red « OpenAI’s », diseñados para un razonamiento potente, tareas de tipo agente, ajuste fino y diversos casos de uso para desarrolladores. ibmwxGptOss120Bgranite-4-h-micro Estado: Disponible
Los modelos de base de « Granite » ( 4.0 ) pertenecen a la familia de modelos de « IBM » ( Granite ). El « granite-4-h-micro » es un modelo base de 3000 millones de parámetros diseñado para ofrecer capacidades de procesamiento de datos estructurados y contextos largos. El modelo es ideal para seguir instrucciones y seleccionar herramientas. ibmwxGranite4HMicrogranite-4-h-small Estado: Disponible
Los modelos de base de « Granite » ( 4.0 ) pertenecen a la familia de modelos de « IBM » ( Granite ). El modelo « granite-4-h-small » es un modelo base de 30 000 millones de parámetros diseñado para ofrecer capacidades de procesamiento de datos estructurados y contextos largos. El modelo es ideal para seguir instrucciones y utilizar herramientas. ibmwxGranite4HSmallgranite-4-h-tiny Estado: Disponible
Los modelos de base de « Granite » ( 4.0 ) pertenecen a la familia de modelos de « IBM » ( Granite ). El modelo « granite-4-h-tiny » es un modelo optimizado para instrucciones de contexto largo con 7 000 millones de parámetros, desarrollado mediante un conjunto variado de técnicas con un formato de chat estructurado, entre las que se incluyen el ajuste fino supervisado, la alineación de modelos mediante aprendizaje por refuerzo y la fusión de modelos. Este modelo es ideal para seguir instrucciones y utilizar herramientas. ibmwxGranite4HTinygranite-13b-instruct-v2 Estado: Retirado
Modelo de uso general de IBM, optimizado para casos de uso de preguntas y respuestas. ibmwxGranite13bInstructv2granite-3-3-8b-instruct Estado: Disponible
Un modelo denso basado únicamente en un decodificador, entrenado mediante el método « IBM », que resulta especialmente adecuado para tareas generativas. ibmwxGranite338BInstructgranite-3-2-8b-instruct Estado: Disponible
Un modelo basado únicamente en texto capaz de razonar. Puedes elegir si quieres activar el razonamiento, según tus necesidades. ibmwxGranite328BInstructgranite-3-2b-instruct Estado: Disponible
Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite32BInstructgranite-3-8b-instruct Estado: Disponible
Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite38BInstructgranite-docling-258M Estado: Disponible
Granite Docling es un modelo multimodal de conversión de imagen a texto muy eficaz para la conversión de documentos. El modelo conserva las características principales de Docling y, al mismo tiempo, mantiene una integración perfecta con los documentos de Docking para garantizar una compatibilidad total. ibmwxGraniteDocling258Mgranite-guardian-3-2b Estado: Disponible
Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGraniteGuardian32bgranite-guardian-3-8b Estado: Disponible
Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGraniteGuardian38bgranite-guardian-3-2-5b Estado: Disponible
La serie de modelos « Granite » es una familia de modelos densos basados únicamente en decodificadores y entrenados mediante el método « IBM », que resultan especialmente adecuados para tareas generativas. Este modelo no se puede utilizar a través de la API. ibmwxGraniteGuardian325bgranite-3b-code-instruct Estado: Disponible
Un modelo entrenado con 3000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite3bCodeInstructgranite-8b-code-instruct Estado: Disponible
Un modelo entrenado con 8000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite8bCodeInstructgranite-20b-code-instruct Estado: Disponible
Un modelo entrenado con 20 000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite20bCodeInstructgranite-20b-code-base-schema-linking Estado: Disponible
Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite20bCodeBaseSchemaLinkinggranite-20b-code-base-sql-gen Estado: Disponible
Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite20bCodeBaseSqlGengranite-34b-code-instruct Estado: Disponible
Un modelo entrenado con 34 000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite34bCodeInstructgranite-vision-3-2-2b Estado: Obsoleto
Granite 3.2 Vision es un modelo de entrada de imágenes y salida de texto capaz de interpretar imágenes, como gráficos, para aplicaciones empresariales en tareas de visión artificial. ibmwxGraniteVision322Bgranite-vision-3-3-2b Estado: Disponible
Granite 3.2 Vision es un modelo de entrada de imágenes y salida de texto capaz de interpretar imágenes, como gráficos, para aplicaciones empresariales en tareas de visión artificial. ibmwxGraniteVision322Bibm-defense-3-3-8b-instruct Estado: Disponible
El modelo de defensa « IBM » ( watsonx.ai ) es una versión especializada y perfeccionada del modelo básico de « IBM » ( granite-3-3-8b-instruct ). El modelo se ha desarrollado a partir de los fiables datos de defensa de código abierto de Jane's para apoyar las operaciones de defensa e inteligencia. ibmwxDefensemodelibm-defense-4-0-micro Estado: Disponible
El « ibm-defense-4-0-micro » es un modelo de lenguaje a gran escala (LLM) especializado en defensa, ajustado mediante un modelo de la Universidad de California en San Francisco ( IBM ) Granite. Este modelo está diseñado para funcionar con los datos de defensa de Janes Foundation, proporcionando resultados rápidos, fiables y contextualizados para tareas de importancia crítica en las organizaciones de defensa. Atención: Para descargar y utilizar este modelo, debe adquirir por separado la licencia del modelo « IBM » de « watsonx.ai Defense».ibmwxDefensemodelibm-defense-4-0-small Estado: Disponible
5.3.1 y más tarde
El « ibm-defense-4-0-small » es un modelo de lenguaje a gran escala orientado a la defensa, ajustado mediante un modelo « IBM » Granite. Este modelo está diseñado para funcionar con los datos de defensa de Janes Foundation, proporcionando resultados rápidos, fiables y contextualizados para tareas de importancia crítica en las organizaciones de defensa. Atención: Para descargar y utilizar este modelo, debe adquirir por separado la licencia del modelo « IBM » de « watsonx.ai Defense».ibmwxIbmDefense40Smalljais-13b-chat Estado: Retirado
Modelo base de uso general para tareas generativas en árabe. ibmwxCore42Jais13bChatllama-4-maverick-17b-128e-instruct-fp8 Estado: Disponible
La colección de modelos Llama 4 está compuesta por modelos de IA multimodales de forma nativa que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Maverick17B128EInstructFp8llama-4-maverick-17b-128e-instruct-int4 Estado: Disponible
La colección de modelos Llama 4 está formada por modelos de IA multimodal que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Maverick17B128EInstructInt4llama-4-scout-17b-16e-instruct Estado: Retirado
La colección de modelos Llama 4 está compuesta por modelos de IA multimodales de forma nativa que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Scout17B16EInstructllama-4-scout-17b-16e-instruct-int4 Estado: Disponible
La colección de modelos Llama 4 está compuesta por modelos de IA multimodales de forma nativa que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Scout17b16eInstructInt4llama-3-3-70b-instruct Estado: Disponible
Una actualización de vanguardia del modelo « Llama 3.1» ( 70B ) que incorpora los últimos avances en técnicas de posformado. ibmwxLlama3370BInstructllama-3-2-1b-instruct Estado: Disponible
Un modelo generativo de texto preentrenado y ajustado con 1000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y generación de código. ibmwxLlama321bInstructllama-3-2-3b-instruct Estado: Disponible
Un modelo generativo de texto preentrenado y ajustado con 3000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlama323bInstructllama-3-2-11b-vision-instruct Estado: Disponible
Un modelo generativo de texto preentrenado y ajustado con 11 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlama3211bVisionInstructllama-3-2-90b-vision-instruct Estado: Disponible
Un modelo generativo de texto preentrenado y ajustado con 90 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlama3290bVisionInstructllama-guard-3-11b-vision Estado: Disponible
Un modelo generativo de texto preentrenado y ajustado con 11 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlamaGuard311bVisionllama-3-1-8b-instruct Estado: Disponible
Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada. ibmwxLlama318bInstructllama-3-1-70b-instruct Estado: Disponible
Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada. ibmwxLlama3170bInstructllama-3-405b-instruct Estado: Retirado
El modelo base de código abierto más grande de Meta hasta la fecha, con 405 000 millones de parámetros, optimizado para casos de uso relacionados con el diálogo. ibmwxLlama3405bInstructllama-2-13b-chat Estado: Retirado
Uso general con indicaciones de «zero-shot» o «few-shot». Optimizado para situaciones de diálogo. ibmwxMetaLlamaLlama213bChatministral-8b-instruct Estado: Disponible
Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxMinistral8BInstructministral-14b-instruct-2512 Estado: Disponible
5.3.1 y más tarde
ministral-14b-instruct-2512 es el modelo base más grande de la familia Ministral 3 de Mistral AI. El modelo ofrece prestaciones de vanguardia y un rendimiento comparable al de su homólogo de mayor tamaño, el modelo « mistral-small-3-2-24b-instruct-2506 ». ibmwxMinistral14BInstruct2512mistral-medium-2505 Estado: Disponible
Mistral Medium 3 ofrece capacidades multimodales y una longitud de contexto ampliada de hasta 128k. El modelo es capaz de procesar y comprender información visual y documentos extensos, y es compatible con numerosos idiomas. ibmwxMistralMedium2505mistral-small-3-1-24b-instruct-2503 Estado: Disponible
Basándose en Mistral Small 3 (2501), Mistral Small 3.1 (2503) incorpora capacidades de comprensión visual de última generación y mejora las capacidades de contexto prolongado, por lo que resulta adecuado para la invocación de funciones y los agentes. ibmwxMistralSmall3124BInstruct2503mistral-small-3-2-24b-instruct-2506 Estado: Disponible
El modelo base « mistral-small-3-2-24b-instruct-2506 » es una mejora del modelo « mistral-small-3-1-24b-instruct-2503 », que ofrece un mejor seguimiento de las instrucciones y un mayor rendimiento en la ejecución de herramientas. ibmwxMistralSmall3224BInstruct2506mistral-small-24b-instruct-2501 Estado: Retirado
Mistral Small 3 (2501) establece un nuevo referente en la categoría de modelos de lenguaje a gran escala de tamaño reducido, con menos de 70 000 millones de parámetros. Con 24 000 millones de parámetros, el modelo alcanza un nivel de rendimiento de vanguardia comparable al de modelos de mayor tamaño. ibmwxMistralSmall24BInstruct2501mistral-small-instruct Estado: Retirado
Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxMistralSmallInstructmistral-large-instruct-2411 Estado: Disponible
El modelo de lenguaje a gran escala (LLM) más avanzado desarrollado por Mistral Al, con capacidades de razonamiento de vanguardia que pueden aplicarse a cualquier tarea basada en el lenguaje, incluidas las más sofisticadas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxMistralLargeInstruct2411mistral-large-2512 Estado: Disponible
5.3.1 y más tarde
El modelo base « mistral-large-2512 », también conocido como Mistral Large 3, es un modelo multimodal de última generación, de uso general y basado en una mezcla granular de expertos, con 41 000 millones de parámetros activos y un total de 675 000 millones de parámetros. El modelo se entrena desde cero con 3000 GPU NVIDIA H200. ibmwxMistralLarge2512mistral-large Estado: Retirado
Un modelo de lenguaje de gran tamaño desarrollado por Mistral Al con capacidades de razonamiento de vanguardia que pueden aplicarse a cualquier tarea basada en el lenguaje, incluidas las más sofisticadas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxMistralLargemistral-medium-2505 Estado: Disponible
Mistral Medium 3 ofrece capacidades multimodales y una longitud de contexto ampliada de hasta 128k. El modelo es capaz de procesar y comprender información visual y documentos extensos, y es compatible con numerosos idiomas. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxMistralMedium2505mixtral-8x7b-instruct-v01 Estado: Retirado
El modelo de idioma de gran tamaño (LLM) Mixtral-8x7B es una mezcla dispersa generativa preentrenada de expertos. ibmwxMistralaiMixtral8x7bInstructv01pixtral-large-instruct-2411 Estado: Disponible
Un modelo multimodal de 124 000 millones de parámetros basado en Mistral Large 2, que demuestra una capacidad de comprensión de imágenes de vanguardia. Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.ibmwxPixtralLargeInstructpixtral-12b Estado: Obsoleto
Un modelo de 12 000 millones de parámetros, preentrenado y ajustado para tareas generativas en los ámbitos del texto y la imagen. El modelo está optimizado para casos de uso multilingües y ofrece un rendimiento sólido en la generación de contenido creativo. ibmwxPixtral12bvoxtral-small-24b-2507 Estado: Disponible
Voxtral Small es una versión mejorada de Mistral Small 3.1, que incorpora funciones de audio y lectura de texto de última generación, y es capaz de procesar hasta 30 minutos de audio. ibmwxVoxtralSmall24B2507- Modelos de incrustación
Modelo Descripción Grupo de imágenes all-minilm-l6-v2 Estado: Disponible
Utiliza all-minilm-l6-v2 como generador de frases y párrafos cortos. A partir de un texto de entrada, el modelo genera un vector que recoge la información semántica del texto. ibmwxAllMinilmL6V2all-minilm-l12-v2 Estado: Disponible
Utiliza all-minilm-l12-v2 como generador de frases y párrafos cortos. A partir de un texto de entrada, el modelo genera un vector que recoge la información semántica del texto. ibmwxAllMinilmL12V2granite-embedding-107m-multilingual Estado: Disponible
Un modelo de 107 millones de parámetros de la suite « Granite Embeddings», proporcionado por IBM. El modelo se puede utilizar para generar representaciones de texto de alta calidad a partir de una entrada determinada, como una consulta, un fragmento o un documento. ibmwxGranite107MMultilingualRtrvrgranite-embedding-278m-multilingual Estado: Disponible
Un modelo de 278 millones de parámetros de la suite « Granite Embeddings», proporcionado por IBM. El modelo se puede utilizar para generar representaciones de texto de alta calidad a partir de una entrada determinada, como una consulta, un fragmento o un documento. ibmwxGranite278MMultilingualRtrvrgranite-embedding-english-reranker-r2 Estado: Disponible
Un modelo de 149 millones de parámetros de la suite « Granite Embeddings», proporcionado por IBM. El modelo se ha entrenado para la reordenación de fragmentos, siguiendo el método « granite-embedding-english-r2 » para su uso en flujos de trabajo RAG. ibmwxGraniteEmbeddingEnglishRerankerR2multilingual-e5-large Estado: Disponible
Un modelo integrado creado por Microsoft y facilitado por Hugging Face. El modelo « multilingual-e5-large » resulta útil para tareas como la recuperación de pasajes o de información, la similitud semántica, la minería de textos paralelos y la recuperación de paráfrasis. ibmwxMultilingualE5Largeslate-30m-english-rtrvr Estado: Disponible
Los modelos de incrustación de slate proporcionados por IBM están diseñados para generar incrustaciones a partir de diversas entradas, como consultas, fragmentos o documentos. ibmwxSlate30mEnglishRtrvrslate-125m-english-rtrvr Estado: Disponible
Los modelos de incrustación de slate proporcionados por IBM están diseñados para generar incrustaciones a partir de diversas entradas, como consultas, fragmentos o documentos. ibmwxSlate125mEnglishRtrvr- Modelos de reordenación
Modelo Descripción Grupo de imágenes ms-marco-MiniLM-L-12-v2 Estado: Disponible
Un modelo de reordenación creado por Microsoft y facilitado por Hugging Face. A partir de un texto de consulta y un conjunto de fragmentos de documentos, el modelo clasifica la lista de fragmentos de mayor a menor relevancia con respecto a la consulta. ibmwxMsMarcoMinilmL12V2- Modelos de extracción de texto
Modelo Descripción Grupo de imágenes wdu Estado: Disponible
Un conjunto de modelos de procesamiento de texto en lenguaje natural representados por el identificador «wdu». Las plantillas siempre se incluyen al duplicar las imágenes para watsonx.ai. - modelos de serie temporal
Modelo Descripción Grupo de imágenes granite-ttm-512-96-r2 Estado: Disponible
Los modelos de series temporales « Granite » son modelos compactos preentrenados para la predicción de series temporales multivariantes desarrollados por IBM Research, también conocidos como «Tiny Time Mixers» (TTM). Los modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y, de forma predeterminada, generan un conjunto de datos de previsión con 96 puntos de datos por canal. ibmwxGraniteTimeseriesTtmV1granite-ttm-1024-96-r2 Estado: Disponible
Los modelos de series temporales « Granite » son modelos compactos preentrenados para la predicción de series temporales multivariantes desarrollados por IBM Research, también conocidos como «Tiny Time Mixers» (TTM). Los modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y, de forma predeterminada, generan un conjunto de datos de previsión con 96 puntos de datos por canal. ibmwxGraniteTimeseriesTtmV1granite-ttm-1536-96-r2 Estado: Disponible
Los modelos de series temporales « Granite » son modelos compactos preentrenados para la predicción de series temporales multivariantes desarrollados por IBM Research, también conocidos como «Tiny Time Mixers» (TTM). Los modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y, de forma predeterminada, generan un conjunto de datos de previsión con 96 puntos de datos por canal. ibmwxGraniteTimeseriesTtmV1- Modelos base disponibles para ajustar
Modelo Descripción Grupo de imágenes granite-3-1-8b-base Estado: Disponible
Granite 3.1 8b base es un modelo autorregresivo básico preentrenado con una longitud de contexto de 128k, destinado a ser ajustado. Método de afinación: Afinación completa, afinación « LoRA »
ibmwxGranite318BBasellama-3-1-8b-instruct Estado: Disponible
Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada. Método de afinación: Afinación completa, afinación « LoRA »
ibmwxLlama318bInstructllama-3-1-70b-instruct Estado: Disponible
Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada. Método de afinación: Afinación completa, afinación « LoRA »
ibmwxLlama3170bInstructllama-3-1-70b-gptq Estado: Disponible
Llama 3.1 70b es un modelo generativo de texto preentrenado con 70 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y generación de código. Método de ajuste: ajuste fino « QLoRA »
ibmwxLlama3170BGptq
Modelos base para watsonx Assistant
Puedes elegir qué modelos de base quieres duplicar en función de las funciones que desees utilizar:
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| ibm-granite-8b-unified-api-model-v2 |
|
No aplicable. Este modelo se duplica automáticamente al duplicar las imágenes de watsonx Assistant. |
| granite-3-8b-instruct |
|
ibmwxGranite38BInstruct |
| llama-3-1-70b-instruct |
|
ibmwxLlama3170bInstruct |
| llama-3-3-70b-instruct 5.3.1 y, a partir de entonces, este modelo solo se puede utilizar con IBM Software Hub la versión 5.3.1 o posterior. |
|
ibmwxLlama3370BInstruct |
Modelos base para watsonx BI
Debes replicar los modelos de base necesarios.
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| granite-3-8b-instruct | Ofrece recomendaciones, análisis y resúmenes sobre tus datos empresariales regulados. | granite-3-8b-instruct |
| slate-30m-english-rtrvr | Busca elementos, métricas, columnas, preguntas y valores de filtro semánticamente similares para responder a preguntas de negocio. | ibmwxSlate30mEnglishRtrvr |
Modelos base para watsonx Code Assistant
Debes replicar los modelos de base necesarios.
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| granite-3-3-8b-instruct | Asistencia en programación en otros lenguajes distintos de Java. |
ibmwxGranite338BInstruct |
| ibm-granite-20b-code-javaenterprise-v2 | Ayuda con la programación en Java. | No aplicable. Este modelo se duplica automáticamente al duplicar las imágenes de watsonx Code Assistant. |
| ms-marco-MiniLM-L-12-v2 | Un modelo de reordenación creado por Microsoft y facilitado por Hugging Face. A partir de un texto de consulta y un conjunto de fragmentos de documentos, el modelo clasifica la lista de fragmentos de mayor a menor relevancia con respecto a la consulta. | ibmwxMsMarcoMinilmL12V2 |
Modelos base para watsonx Code Assistant for Z Understand
5.3.0 En IBM Software Hub la versión 5.3.0, el modelo requerido se replica automáticamente.
5.3.1 y, a partir de IBM Software Hub la versión 5.3.1, es necesario duplicar los modelos necesarios.
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| mistral-medium-2508 |
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
|
ibmwxMistralMedium2508 |
| ms-marco-MiniLM-L-12-v2 |
|
ibmwxMsMarcoMinilmL12V2 |
| slate-125m-english-rtrvr |
|
ibmwxSlate125mEnglishRtrvr |
Modelos base para watsonx.data intelligence
Si tienes pensado habilitar funciones basadas en IA generativa en la CPU o la GPU, debes replicar el modelo especificado. (No es necesario duplicar el modelo especificado si tiene previsto conectarse a una instancia remota en watsonx.ai la que se esté ejecutando dicho modelo.)
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| granite-3-8b-instruct | Ampliación de metadatos de la IA general | ibmwxGranite38BInstruct |
Modelos base para watsonx Orchestrate
Puedes elegir qué modelos de base quieres duplicar en función de las funciones que desees utilizar:
| Modelo | Características que ofrece el modelo | Grupo de imágenes |
|---|---|---|
| ibm-granite-8b-unified-api-model-v2 |
|
No aplicable. Este modelo se duplica automáticamente al duplicar las imágenes de watsonx Orchestrate. |
| granite-3-8b-instruct |
|
ibmwxGranite38BInstruct |
| llama-3-1-70b-instruct |
|
ibmwxLlama3170bInstruct |
| llama-3-2-90b-vision-instruct |
|
ibmwxLlama3290bVisionInstruct |
| slate-30m-english-rtrvr | Búsqueda semántica en el watsonx
Orchestrate catálogo. Recuerda: este modelo es necesario si tienes pensado instalar cualquiera de los siguientes modelos:
|
ibmwxSlate30mEnglishRtrvr |
Qué hacer a continuación
Ahora que ya has identificado qué modelos e imágenes opcionales debes replicar, estás listo para completar el script de actualización de las variables de entorno (actualización de la versión 5.3.x a una versión posterior 5.3 refresh).