Cómo determinar qué modelos e imágenes se deben replicar en tu registro de contenedores privado (Actualización de la versión 5.3.x a una versión posterior: actualización de 5.3 )

Si utilizas un registro de contenedores privado, es posible que tengas que replicar imágenes y modelos adicionales, como los modelos base, en tu registro. Las imágenes y los modelos adicionales que necesites dependerán de los servicios que tengas previsto actualizar y de las funciones que quieras activar. Antes de actualizar IBM® Software Hub, determine qué imágenes y modelos adicionales necesita replicar.

Fase de actualización
  • No estás aquí. Actualización de tu estación de trabajo de cliente
  • Icono «Estás aquí». Recopilación de la información necesaria
  • No estás aquí. Preparación para realizar una actualización en una red restringida
  • No estás aquí. Preparación para realizar una actualización desde un registro de contenedores privado
  • No estás aquí. Actualización del software necesario
  • No estás aquí. Actualización de los componentes compartidos del clúster
  • No estás aquí. Preparación para actualizar una instancia
  • No estás aquí. Actualización de una instancia
¿Quién debe realizar esta tarea?

Equipo de operaciones : El equipo IBM Software Hub de operaciones debe determinar qué imágenes y modelos adicionales se deben replicar.

¿Cuándo tienes que terminar esta tarea?

Realiza esta tarea antes de realizar cualquiera de las siguientes:

  • Duplicar el contenido en un registro de contenedores privado.
  • Actualiza IBM Software Hub tu clúster.

Repítelo tantas veces como sea necesario. Es posible que tengas que repetir esta tarea si tienes previsto actualizar varias instancias de IBM Software Hub, sobre todo si las instancias incluyen servicios diferentes.

Acerca de esta tarea

Algunas imágenes y modelos no se replican de forma predeterminada al replicar las imágenes de un servicio en tu registro de contenedores privado. En algunos casos, las imágenes o los modelos no se replican porque solo son necesarios para habilitar funciones opcionales. En otros casos, los modelos no se duplican porque hay una gran cantidad de modelos entre los que elegir, y duplicarlos todos requeriría una cantidad considerable de espacio de almacenamiento.

Además, si un servicio depende de un modelo disponible a través watsonx.ai™Inference foundation models del componente (el watsonx_ai_ifm componente), dicho modelo no se duplica de forma predeterminada al duplicar las imágenes del servicio.

Esta tarea te ayuda a identificar:
  • ¿Qué servicios incluyen imágenes opcionales?
  • ¿Qué servicios requieren que se activen funciones opcionales?
  • ¿Qué servicios requieren modelos que no se replican de forma predeterminada?

Esta tarea también indica el grupo que debes especificar para duplicar cada modelo o imagen. Utiliza esta información para configurar la variable IMAGE_GROUPS de entorno.

Procedimiento

Consulte la siguiente tabla para determinar si los servicios que tiene previsto actualizar utilizan modelos y si estos son opcionales u obligatorios.

Servicio Imágenes opcionales o modelos de base
AI Factsheets No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Analytics Engine powered by Apache Spark No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Cognos Analytics No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Cognos Dashboards No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Data Gate No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Data Privacy No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Data Product Hub No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Data Refinery No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Data Replication No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
DataStage No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Data Virtualization No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Db2 No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Db2 Big SQL No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Db2 Data Management Console No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Db2 Warehouse No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Decision Optimization No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
EDB Postgres No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Execution Engine for Apache Hadoop No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
IBM Knowledge Catalog No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
IBM Knowledge Catalog Premium Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo base necesario.

Consulte los modelos en IBM Knowledge Catalog Premium.

IBM Knowledge Catalog Standard Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo base necesario.

Consulte los modelos en IBM Knowledge Catalog Standard.

IBM Manta Data Lineage No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
IBM Master Data Management No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
IBM StreamSets No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Informix No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
MANTA Automated Data Lineage No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
MongoDB No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
OpenPages No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Orchestration Pipelines Puedes elegir si deseas duplicar las imágenes opcionales.

Consulte las imágenes opcionales de « Orchestration Pipelines ».

Planning Analytics No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Product Master No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
RStudio® Server Runtimes No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
SPSS Modeler No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Synthetic Data Generator No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Voice Gateway No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Watson Discovery No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Watson Machine Learning No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Watson OpenScale No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Watson Speech services Puedes elegir qué modelos duplicar. Consulte:
Watson Studio No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
Watson Studio Runtimes No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx.ai Puedes elegir qué modelos duplicar.

Ver modelos de watsonx.ai

watsonx Assistant Puedes elegir qué modelos duplicar.

Consulte los modelos de base en watsonx Assistant.

watsonx™ BI Debes replicar el modelo requerido.

Consulte los modelos básicos de BI de « watsonx ».

watsonx Code Assistant™ Debes replicar el modelo requerido.

Consulte los modelos de base en watsonx Code Assistant.

watsonx Code Assistant for Red Hat® Ansible® Lightspeed No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx Code Assistant for Z No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx Code Assistant for Z Agentic No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx Code Assistant for Z Code Explanation No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx Code Assistant for Z Code Generation No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx Code Assistant for Z Understand Los requisitos dependen de la versión a IBM Software Hub la que vayas a actualizar:
watsonx.data™ No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx.data Premium Debes duplicar los modelos necesarios.

Consulte los modelos de base en watsonx.data Premium.

watsonx.data integration No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx.data intelligence Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo base necesario.

Consulte los modelos de base en watsonx.data intelligence.

watsonx.governance™ No aplicable. Todas las imágenes se muestran invertidas de forma predeterminada.
watsonx Orchestrate Puedes elegir qué modelos de base quieres replicar.

Consulte los modelos de base en watsonx Orchestrate.

Modelos para IBM Knowledge Catalog Premium

Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo especificado.

Modelo Características que ofrece el modelo Grupo de imágenes
granite-3-8b-instruct
  • Enriquecimiento basado en IA general
  • Búsqueda de datos
ibmwxGranite38BInstruct

Modelos para IBM Knowledge Catalog Standard

Si tienes pensado habilitar funciones basadas en IA generativa, debes replicar el modelo especificado.

Modelo Características que ofrece el modelo Grupo de imágenes
granite-3-8b-instruct
  • Búsqueda de datos
ibmwxGranite38BInstruct

Imágenes opcionales para Orchestration Pipelines

Puedes elegir si deseas replicar las imágenes opcionales para Orchestration Pipelines:

Imagen Características que ofrece la imagen Grupo de imágenes
run-bash-script Ejecuta scripts de Bash que no utilicen ningún paquete de OpenSSH ni paquetes Db2 binarios. ibmwsprbsnossh

Modelos para Watson Speech to Text

Si tiene previsto habilitar las mejoras, debe replicar el modelo especificado.

Modelo Características que ofrece el modelo Grupo de imágenes
mistral-small-3-1-24b-instruct-2503
  • Añadir signos de puntuación automáticamente.
  • Utiliza las mayúsculas de forma adecuada.
ibmwxMistralSmall3124BInstruct2503

Además, puedes elegir qué modelos de lenguaje quieres replicar.

Idioma Modelos incluidos Grupo de imágenes
Holandés (nl) Neerlandés, belga (nl-BE)
  • Modelo de teléfono: nlBeTelephony
Neerlandés, Países Bajos (nl-NL)
  • Modelo multimedia: nlNlMultimedia
  • Modelo de teléfono: nlNlTelephony
ibmwatsonspeech-stt-nl
Inglés [en] Inglés, Australia (en-AU)
  • Modelo de voz de gran tamaño: enAu
  • Modelo multimedia: enAuMultimedia
  • Modelo de teléfono: enAuTelephony
Inglés, India (en-IN)
  • Modelo de voz de gran tamaño: enIn
  • Modelo de teléfono: enInTelephony
Inglés, Reino Unido (en-GB)
  • Modelo de voz de gran tamaño: enGb
  • Modelo multimedia: enGbMultimedia
  • Modelo de teléfono: enGbTelephony
Inglés (EE. UU.) (en-US)
  • Modelo de voz de gran tamaño: enUs
  • Modelo multimedia: enUsMultimedia
  • Modelo de teléfono: enUsTelephony
Las plantillas siempre se incluyen al duplicar las imágenes para Watson Speech services.
Inglés [en] Inglés internacional (en)
  • Modelo de teléfono: enWwMedicalTelephony
ibmwatsonspeech-stt-en
Francés [fr] Francés (fr-FR)
  • Modelo de voz de gran tamaño: frFr
  • Modelo multimedia: frFrMultimedia
  • Modelo de teléfono: frFrTelephony
Francés, canadiense (fr-CA)
  • Modelo de voz de gran tamaño: frCa
  • Modelo multimedia: frCaMultimedia
  • Modelo de teléfono: frCaTelephony
ibmwatsonspeech-stt-fr
Alemán (de) Alemán (de-DE)
  • Modelo de voz de gran tamaño: deDe
  • Modelo multimedia: deDeMultimedia
  • Modelo de teléfono: deDeTelephony
ibmwatsonspeech-stt-de
Italiano [it] Italiano (it-IT)
  • Modelo multimedia: itItMultimedia
  • Modelo de teléfono: itItTelephony
ibmwatsonspeech-stt-it
Japonés (ja) Japonés (ja-JP)
  • Modelo de voz de gran tamaño: jaJp
  • Modelo multimedia: jaJpMultimedia
  • Modelo de teléfono: jaJpTelephony
ibmwatsonspeech-stt-ja
Coreano (ko) Coreano (ko-KR)
  • Modelo multimedia: koKrMultimedia
  • Modelo de teléfono: koKrTelephony
ibmwatsonspeech-stt-ko
Portugués (pt) Portugués (pt-PT)
  • Modelo de voz de gran tamaño: ptPt
Portugués (Brasil) (pt-br)
  • Modelo de voz de gran tamaño: ptBr
  • Modelo multimedia: ptBrMultimedia
  • Modelo de teléfono: ptBrTelephony
ibmwatsonspeech-stt-pt
Español (es) Español, argentino (es-AR)
  • Modelo de voz de gran tamaño: esAr
Español, castellano (es-ES)
  • Modelo de voz de gran tamaño: esEs
  • Modelo multimedia: esEsMultimedia
  • Modelo de teléfono: esEsTelephony
Español (Chile) (es-CL)
  • Modelo de voz de gran tamaño: esCl
Español, Colombia (es-CO)
  • Modelo de voz de gran tamaño: esCo
Español, Latinoamérica (es-LA)
  • Modelo de teléfono: esLaTelephony
Español (México)
  • Modelo de voz de gran tamaño: esMx
Español, peruano (es-PE)
  • Modelo de voz de gran tamaño: esPe
ibmwatsonspeech-stt-es
Otros idiomas Árabe estándar moderno (ar-MS)
  • Modelo de teléfono: arMsTelephony
Chino, mandarín (zh-CN)
  • Modelo de teléfono: zhCnTelephony
Checo (cs-CZ)
  • Modelo de teléfono: csCZTelephony
Hindi (hi-IN)
  • Modelo de teléfono: hiInTelephony
Sueco (sv-SE)
  • Modelo de teléfono: svSeTelephony
ibmwatsonspeech-stt-misc
Modelos híbridos obsoletos Árabe estándar moderno (AR-MS)
  • Banda ancha: arMsBroadbandModel
Chino, mandarín (zh-CN)
  • Banda ancha: zhCnBroadbandModel
  • Banda estrecha: zhCnNarrowbandModel
Neerlandés (nl-NL)
  • Banda ancha: nlNlBroadbandModel
  • Banda estrecha: nlNlNarrowbandModel
Inglés, Australia (en-AU)
  • Banda ancha: enAuBroadbandModel
  • Banda estrecha: enAuNarrowbandModel
Inglés, Reino Unido (en-UK)
  • Banda ancha: enGbBroadbandModel
  • Banda estrecha: enGbNarrowbandModel
Inglés (EE. UU.) (en-US)
  • Banda ancha: enUsBroadbandModel
  • Banda estrecha: enUsNarrowbandModel
  • Narrowband, versión abreviada: enUsShortFormNarrowbandModel
Francés (fr-FR)
  • Banda ancha: frFrBroadbandModel
  • Banda estrecha: frFrNarrowbandModel
Francés, canadiense (fr-CA)
  • Banda ancha: frCaBroadbandModel
  • Banda estrecha: frCaNarrowbandModel
Alemán (de-DE)
  • Banda ancha: deDeBroadbandModel
  • Banda estrecha: deDeNarrowbandModel
Italiano (it-IT)
  • Banda ancha: itItBroadbandModel
  • Banda estrecha: itItNarrowbandModel
Japonés (ja-JP)
  • Banda ancha: jaJpBroadbandModel
  • Banda estrecha: jaJpNarrowbandModel
Coreano (ko-KR)
  • Banda ancha: koKrBroadbandModel
  • Banda estrecha: koKrNarrowbandModel
Portugués (Brasil) (pt-br)
  • Banda ancha: ptBrBroadbandModel
  • Banda estrecha: ptBrNarrowbandModel
Español, castellano (es-ES)
  • Banda ancha: esEsBroadbandModel
  • Banda estrecha: esEsNarrowbandModel
ibmwatsonspeech-stt-hybrid

Modelos para Watson Text to Speech

Puedes elegir qué modelos de lenguaje quieres replicar.

Idioma Modelos incluidos Grupo de imágenes
Inglés [en] Inglés (EE. UU.) (en-US)
Voces neuronales expresivas:
  • Michael: enUSMichaelExpressive
Voces neuronales mejoradas ( V3 ):
  • Michael: enUSMichaelV3Voice
Las plantillas siempre se incluyen al duplicar las imágenes para Watson Speech services.
Inglés [en] Inglés, Australia (en-AU)
Voces neuronales expresivas:
  • Heidi: enAUHeidiExpressive
  • Jack: enAUJackExpressive
Voces naturales:
  • Heidi: enAUHeidiNatural
  • Jack: enAUJackNatural

Inglés, Canadá (en-CA)

Voces naturales:
  • Hannah: enCAHannahNatural
Inglés, Reino Unido (en-GB)
Voces neuronales expresivas:
  • George enGBGeorgeExpressive
Voces neuronales mejoradas ( V3 ):
  • Charlotte enGBCharlotteV3Voice
  • James enGBJamesV3Voice
Voces naturales:
  • Chloe: enGBChloeNatural
  • George: enGBGeorgeNatural
Inglés (EE. UU.) (en-US)
Voces neuronales expresivas:
  • Allison: enUSAllisonExpressive
  • Emma: enUSEmmaExpressive
  • Lisa: enUSLisaExpressive
Voces neuronales mejoradas ( V3 ):
  • Allison: enUSAllisonV3Voice
  • Emily: enUSEmilyV3Voice
  • Henry: enUSHenryV3Voice
  • Kevin: enUSKevinV3Voice
  • Lisa: enUSLisaV3Voice
  • Olivia: enUSOliviaV3Voice
Voces naturales:
  • Ellie: enUSEllieNatural
  • Emma: enUSEmmaNatural
  • Ethan: enUSEthanNatural
  • Jackson: enUSJacksonNatural
  • Victoria: enUSVictoriaNatural
ibmwatsonspeech-tts-en
Francés [fr] Francés (fr-FR)
Voces neuronales mejoradas ( V3 ):
  • Nicolas: frFRNicolasV3Voice
  • Renee: frFRReneeV3Voice
Francés, canadiense (fr-CA)
Voces neuronales mejoradas ( V3 ):
  • Louise: frCALouiseV3Voice
ibmwatsonspeech-tts-fr
Alemán (de) Alemán (de-DE)
Voces neuronales mejoradas ( V3 ):
  • Birgit: deDEBirgitV3Voice
  • Dieter: deDEDieterV3Voice
  • Erika: deDEErikaV3Voice
ibmwatsonspeech-tts-de
Español (es) Español, castellano (es-ES)
Voces neuronales mejoradas ( V3 ):
  • Enrique: esESEnriqueV3Voice
  • Laura: esESLauraV3Voice
Español, Latinoamérica (es-LA)
Voces neuronales mejoradas ( V3 ):
  • Sofía: esLASofiaV3Voice
Voces naturales:
  • Alejandro: esLAAlejandroNatural

    5.3.1 y más adelante: Esta voz está disponible a partir de la versión 5.3.1.

  • Daniela: esLADanielaNatural

    5.3.1 y más adelante: Esta voz está disponible a partir de la versión 5.3.1.

Español, EE. UU. (es-US)

Voces neuronales mejoradas ( V3 ):

  • Sofía: esUSSofiaV3Voice
ibmwatsonspeech-tts-es
Otros idiomas Neerlandés (nl-NL)
Voces neuronales mejoradas ( V3 ):
  • Merel: nlNLMerelV3Voice
Italiano (it-IT)
Voces neuronales mejoradas ( V3 ):
  • Francesca: itITFrancescaV3Voice
Japonés (ja-JP)
Voces neuronales mejoradas ( V3 ):
  • Emi: jaJPEmiV3Voice
Coreano (ko-KR)
Voces neuronales mejoradas ( V3 ):
  • Jin: koKRJinV3Voice
Portugués (Brasil) (pt-br)
Voces neuronales expresivas:
  • Lucas: ptBRLucasExpressive
Voces neuronales mejoradas ( V3 ):
  • Isabela: ptBRIsabelaV3Voice

Voces naturales:

  • Lucas: ptBRLucasNatural
  • Camila ptBRCamilaNatural
ibmwatsonspeech-tts-misc

Modelos para watsonx.ai

Puedes elegir qué modelos quieres duplicar.

Modelos fundacionales
Modelo Descripción Grupo de imágenes
allam-1-13b-instruct

Estado: Disponible

Un modelo lingüístico bilingüe de gran tamaño para el árabe y el inglés, inicializado con pesos de « Llama-2 » y ajustado para realizar tareas de conversación. ibmwxAllam113bInstruct
codestral-2501

Estado: Disponible

Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxCodestral2501
codestral-2508

Estado: Disponible

Ideal para la generación de código y la finalización de código mediante el método «fill-in-the-middle» (FIM) de alta precisión. El modelo base está optimizado para entornos de ingeniería de producción, como aquellos sensibles a la latencia, que tienen en cuenta el contexto y que se pueden implementar de forma autónoma.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxCodestral2508
codestral-22b

Estado: Retirado

Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxCodestral22B
devstral-medium-2507

Estado: Disponible

El modelo básico « devstral-medium-2507 » de Mistral AI es un modelo de alto rendimiento para la generación de código y el razonamiento agencial. Ideal para la generalización entre distintos estilos de indicaciones y el uso de herramientas en agentes de código y marcos de trabajo.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxDevstralMedium2507
devstral-medium-2512

Estado: Disponible

5.3.1 y más tarde

El modelo base « devstral-medium-2512 » de Mistral AI es un modelo con capacidad de actuación propio de la familia de modelos Devstral 2, diseñado para tareas de ingeniería de software, que destaca por su capacidad para utilizar herramientas destinadas a explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxDevstralMedium2512
devstral-small-2512

Estado: Disponible

5.3.1 y más tarde

El modelo base « devstral-small-2512 » de Mistral AI es un modelo con capacidad de actuación propio de la familia de modelos Devstral 2, diseñado para tareas de ingeniería de software, que destaca por su capacidad para utilizar herramientas destinadas a explorar bases de código, editar múltiples archivos y potenciar agentes de ingeniería de software. ibmwxDevstralSmall2512
flan-t5-xl-3b

Estado: Retirado

Uso general con indicaciones de «zero-shot» o «few-shot». ibmwxGoogleFlanT5xl
gpt-oss-20b

Estado: Disponible

Los modelos base gpt-oss son modelos de peso abierto de la red « OpenAI’s », diseñados para un razonamiento potente, tareas de tipo agente, ajuste fino y diversos casos de uso para desarrolladores. ibmwxGptOss20B
gpt-oss-120b

Estado: Disponible

Los modelos base gpt-oss son modelos de peso abierto de la red « OpenAI’s », diseñados para un razonamiento potente, tareas de tipo agente, ajuste fino y diversos casos de uso para desarrolladores. ibmwxGptOss120B
granite-4-h-micro

Estado: Disponible

Los modelos de base de « Granite » ( 4.0 ) pertenecen a la familia de modelos de « IBM » ( Granite ). El « granite-4-h-micro » es un modelo base de 3000 millones de parámetros diseñado para ofrecer capacidades de procesamiento de datos estructurados y contextos largos. El modelo es ideal para seguir instrucciones y seleccionar herramientas. ibmwxGranite4HMicro
granite-4-h-small

Estado: Disponible

Los modelos de base de « Granite » ( 4.0 ) pertenecen a la familia de modelos de « IBM » ( Granite ). El modelo « granite-4-h-small » es un modelo base de 30 000 millones de parámetros diseñado para ofrecer capacidades de procesamiento de datos estructurados y contextos largos. El modelo es ideal para seguir instrucciones y utilizar herramientas. ibmwxGranite4HSmall
granite-4-h-tiny

Estado: Disponible

Los modelos de base de « Granite » ( 4.0 ) pertenecen a la familia de modelos de « IBM » ( Granite ). El modelo « granite-4-h-tiny » es un modelo optimizado para instrucciones de contexto largo con 7 000 millones de parámetros, desarrollado mediante un conjunto variado de técnicas con un formato de chat estructurado, entre las que se incluyen el ajuste fino supervisado, la alineación de modelos mediante aprendizaje por refuerzo y la fusión de modelos. Este modelo es ideal para seguir instrucciones y utilizar herramientas. ibmwxGranite4HTiny
granite-13b-instruct-v2

Estado: Retirado

Modelo de uso general de IBM, optimizado para casos de uso de preguntas y respuestas. ibmwxGranite13bInstructv2
granite-3-3-8b-instruct

Estado: Disponible

Un modelo denso basado únicamente en un decodificador, entrenado mediante el método « IBM », que resulta especialmente adecuado para tareas generativas. ibmwxGranite338BInstruct
granite-3-2-8b-instruct

Estado: Disponible

Un modelo basado únicamente en texto capaz de razonar. Puedes elegir si quieres activar el razonamiento, según tus necesidades. ibmwxGranite328BInstruct
granite-3-2b-instruct

Estado: Disponible

Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite32BInstruct
granite-3-8b-instruct

Estado: Disponible

Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite38BInstruct
granite-docling-258M

Estado: Disponible

Granite Docling es un modelo multimodal de conversión de imagen a texto muy eficaz para la conversión de documentos. El modelo conserva las características principales de Docling y, al mismo tiempo, mantiene una integración perfecta con los documentos de Docking para garantizar una compatibilidad total. ibmwxGraniteDocling258M
granite-guardian-3-2b

Estado: Disponible

Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGraniteGuardian32b
granite-guardian-3-8b

Estado: Disponible

Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGraniteGuardian38b
granite-guardian-3-2-5b

Estado: Disponible

La serie de modelos « Granite » es una familia de modelos densos basados únicamente en decodificadores y entrenados mediante el método « IBM », que resultan especialmente adecuados para tareas generativas. Este modelo no se puede utilizar a través de la API. ibmwxGraniteGuardian325b
granite-3b-code-instruct

Estado: Disponible

Un modelo entrenado con 3000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite3bCodeInstruct
granite-8b-code-instruct

Estado: Disponible

Un modelo entrenado con 8000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite8bCodeInstruct
granite-20b-code-instruct

Estado: Disponible

Un modelo entrenado con 20 000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite20bCodeInstruct
granite-20b-code-base-schema-linking

Estado: Disponible

Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite20bCodeBaseSchemaLinking
granite-20b-code-base-sql-gen

Estado: Disponible

Granite Los modelos están diseñados para utilizarse en una amplia gama de tareas generativas y no generativas. Utilizan una arquitectura de solo decodificador al estilo GPT, con innovaciones adicionales de IBM Research y la comunidad de código abierto. ibmwxGranite20bCodeBaseSqlGen
granite-34b-code-instruct

Estado: Disponible

Un modelo entrenado con 34 000 millones de parámetros, procedente de IBM, que permite debatir, generar y convertir código. ibmwxGranite34bCodeInstruct
granite-vision-3-2-2b

Estado: Obsoleto

Granite 3.2 Vision es un modelo de entrada de imágenes y salida de texto capaz de interpretar imágenes, como gráficos, para aplicaciones empresariales en tareas de visión artificial. ibmwxGraniteVision322B
granite-vision-3-3-2b

Estado: Disponible

Granite 3.2 Vision es un modelo de entrada de imágenes y salida de texto capaz de interpretar imágenes, como gráficos, para aplicaciones empresariales en tareas de visión artificial. ibmwxGraniteVision322B
ibm-defense-3-3-8b-instruct

Estado: Disponible

El modelo de defensa « IBM » ( watsonx.ai ) es una versión especializada y perfeccionada del modelo básico de « IBM » ( granite-3-3-8b-instruct ). El modelo se ha desarrollado a partir de los fiables datos de defensa de código abierto de Jane's para apoyar las operaciones de defensa e inteligencia. ibmwxDefensemodel
ibm-defense-4-0-micro

Estado: Disponible

El « ibm-defense-4-0-micro » es un modelo de lenguaje a gran escala (LLM) especializado en defensa, ajustado mediante un modelo de la Universidad de California en San Francisco ( IBM ) Granite. Este modelo está diseñado para funcionar con los datos de defensa de Janes Foundation, proporcionando resultados rápidos, fiables y contextualizados para tareas de importancia crítica en las organizaciones de defensa.
Atención: Para descargar y utilizar este modelo, debe adquirir por separado la licencia del modelo « IBM » de « watsonx.ai Defense».
ibmwxDefensemodel
ibm-defense-4-0-small

Estado: Disponible

5.3.1 y más tarde

El « ibm-defense-4-0-small » es un modelo de lenguaje a gran escala orientado a la defensa, ajustado mediante un modelo « IBM » Granite. Este modelo está diseñado para funcionar con los datos de defensa de Janes Foundation, proporcionando resultados rápidos, fiables y contextualizados para tareas de importancia crítica en las organizaciones de defensa.
Atención: Para descargar y utilizar este modelo, debe adquirir por separado la licencia del modelo « IBM » de « watsonx.ai Defense».
ibmwxIbmDefense40Small
jais-13b-chat

Estado: Retirado

Modelo base de uso general para tareas generativas en árabe. ibmwxCore42Jais13bChat
llama-4-maverick-17b-128e-instruct-fp8

Estado: Disponible

La colección de modelos Llama 4 está compuesta por modelos de IA multimodales de forma nativa que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Maverick17B128EInstructFp8
llama-4-maverick-17b-128e-instruct-int4

Estado: Disponible

La colección de modelos Llama 4 está formada por modelos de IA multimodal que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Maverick17B128EInstructInt4
llama-4-scout-17b-16e-instruct

Estado: Retirado

La colección de modelos Llama 4 está compuesta por modelos de IA multimodales de forma nativa que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Scout17B16EInstruct
llama-4-scout-17b-16e-instruct-int4

Estado: Disponible

La colección de modelos Llama 4 está compuesta por modelos de IA multimodales de forma nativa que permiten experiencias basadas en texto y multimodales. Estos modelos utilizan una arquitectura de «mezcla de expertos» para ofrecer un rendimiento líder en el sector en la comprensión de textos e imágenes. ibmwxLlama4Scout17b16eInstructInt4
llama-3-3-70b-instruct

Estado: Disponible

Una actualización de vanguardia del modelo « Llama 3.1» ( 70B ) que incorpora los últimos avances en técnicas de posformado. ibmwxLlama3370BInstruct
llama-3-2-1b-instruct

Estado: Disponible

Un modelo generativo de texto preentrenado y ajustado con 1000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y generación de código. ibmwxLlama321bInstruct
llama-3-2-3b-instruct

Estado: Disponible

Un modelo generativo de texto preentrenado y ajustado con 3000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlama323bInstruct
llama-3-2-11b-vision-instruct

Estado: Disponible

Un modelo generativo de texto preentrenado y ajustado con 11 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlama3211bVisionInstruct
llama-3-2-90b-vision-instruct

Estado: Disponible

Un modelo generativo de texto preentrenado y ajustado con 90 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlama3290bVisionInstruct
llama-guard-3-11b-vision

Estado: Disponible

Un modelo generativo de texto preentrenado y ajustado con 11 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y la generación de código. ibmwxLlamaGuard311bVision
llama-3-1-8b-instruct

Estado: Disponible

Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada. ibmwxLlama318bInstruct
llama-3-1-70b-instruct

Estado: Disponible

Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada. ibmwxLlama3170bInstruct
llama-3-405b-instruct

Estado: Retirado

El modelo base de código abierto más grande de Meta hasta la fecha, con 405 000 millones de parámetros, optimizado para casos de uso relacionados con el diálogo. ibmwxLlama3405bInstruct
llama-2-13b-chat

Estado: Retirado

Uso general con indicaciones de «zero-shot» o «few-shot». Optimizado para situaciones de diálogo. ibmwxMetaLlamaLlama213bChat
ministral-8b-instruct

Estado: Disponible

Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxMinistral8BInstruct
ministral-14b-instruct-2512

Estado: Disponible

5.3.1 y más tarde

ministral-14b-instruct-2512 es el modelo base más grande de la familia Ministral 3 de Mistral AI. El modelo ofrece prestaciones de vanguardia y un rendimiento comparable al de su homólogo de mayor tamaño, el modelo « mistral-small-3-2-24b-instruct-2506 ». ibmwxMinistral14BInstruct2512
mistral-medium-2505

Estado: Disponible

Mistral Medium 3 ofrece capacidades multimodales y una longitud de contexto ampliada de hasta 128k. El modelo es capaz de procesar y comprender información visual y documentos extensos, y es compatible con numerosos idiomas. ibmwxMistralMedium2505
mistral-small-3-1-24b-instruct-2503

Estado: Disponible

Basándose en Mistral Small 3 (2501), Mistral Small 3.1 (2503) incorpora capacidades de comprensión visual de última generación y mejora las capacidades de contexto prolongado, por lo que resulta adecuado para la invocación de funciones y los agentes. ibmwxMistralSmall3124BInstruct2503
mistral-small-3-2-24b-instruct-2506

Estado: Disponible

El modelo base « mistral-small-3-2-24b-instruct-2506 » es una mejora del modelo « mistral-small-3-1-24b-instruct-2503 », que ofrece un mejor seguimiento de las instrucciones y un mayor rendimiento en la ejecución de herramientas. ibmwxMistralSmall3224BInstruct2506
mistral-small-24b-instruct-2501

Estado: Retirado

Mistral Small 3 (2501) establece un nuevo referente en la categoría de modelos de lenguaje a gran escala de tamaño reducido, con menos de 70 000 millones de parámetros. Con 24 000 millones de parámetros, el modelo alcanza un nivel de rendimiento de vanguardia comparable al de modelos de mayor tamaño. ibmwxMistralSmall24BInstruct2501
mistral-small-instruct

Estado: Retirado

Ideal para tareas complejas que requieren una gran capacidad de razonamiento o que son muy especializadas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxMistralSmallInstruct
mistral-large-instruct-2411

Estado: Disponible

El modelo de lenguaje a gran escala (LLM) más avanzado desarrollado por Mistral Al, con capacidades de razonamiento de vanguardia que pueden aplicarse a cualquier tarea basada en el lenguaje, incluidas las más sofisticadas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxMistralLargeInstruct2411
mistral-large-2512

Estado: Disponible

5.3.1 y más tarde

El modelo base « mistral-large-2512 », también conocido como Mistral Large 3, es un modelo multimodal de última generación, de uso general y basado en una mezcla granular de expertos, con 41 000 millones de parámetros activos y un total de 675 000 millones de parámetros. El modelo se entrena desde cero con 3000 GPU NVIDIA H200. ibmwxMistralLarge2512
mistral-large

Estado: Retirado

Un modelo de lenguaje de gran tamaño desarrollado por Mistral Al con capacidades de razonamiento de vanguardia que pueden aplicarse a cualquier tarea basada en el lenguaje, incluidas las más sofisticadas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxMistralLarge
mistral-medium-2505

Estado: Disponible

Mistral Medium 3 ofrece capacidades multimodales y una longitud de contexto ampliada de hasta 128k. El modelo es capaz de procesar y comprender información visual y documentos extensos, y es compatible con numerosos idiomas.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxMistralMedium2505
mixtral-8x7b-instruct-v01

Estado: Retirado

El modelo de idioma de gran tamaño (LLM) Mixtral-8x7B es una mezcla dispersa generativa preentrenada de expertos. ibmwxMistralaiMixtral8x7bInstructv01
pixtral-large-instruct-2411

Estado: Disponible

Un modelo multimodal de 124 000 millones de parámetros basado en Mistral Large 2, que demuestra una capacidad de comprensión de imágenes de vanguardia.
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxPixtralLargeInstruct
pixtral-12b

Estado: Obsoleto

Un modelo de 12 000 millones de parámetros, preentrenado y ajustado para tareas generativas en los ámbitos del texto y la imagen. El modelo está optimizado para casos de uso multilingües y ofrece un rendimiento sólido en la generación de contenido creativo. ibmwxPixtral12b
voxtral-small-24b-2507

Estado: Disponible

Voxtral Small es una versión mejorada de Mistral Small 3.1, que incorpora funciones de audio y lectura de texto de última generación, y es capaz de procesar hasta 30 minutos de audio. ibmwxVoxtralSmall24B2507
Modelos de incrustación
Modelo Descripción Grupo de imágenes
all-minilm-l6-v2

Estado: Disponible

Utiliza all-minilm-l6-v2 como generador de frases y párrafos cortos. A partir de un texto de entrada, el modelo genera un vector que recoge la información semántica del texto. ibmwxAllMinilmL6V2
all-minilm-l12-v2

Estado: Disponible

Utiliza all-minilm-l12-v2 como generador de frases y párrafos cortos. A partir de un texto de entrada, el modelo genera un vector que recoge la información semántica del texto. ibmwxAllMinilmL12V2
granite-embedding-107m-multilingual

Estado: Disponible

Un modelo de 107 millones de parámetros de la suite « Granite Embeddings», proporcionado por IBM. El modelo se puede utilizar para generar representaciones de texto de alta calidad a partir de una entrada determinada, como una consulta, un fragmento o un documento. ibmwxGranite107MMultilingualRtrvr
granite-embedding-278m-multilingual

Estado: Disponible

Un modelo de 278 millones de parámetros de la suite « Granite Embeddings», proporcionado por IBM. El modelo se puede utilizar para generar representaciones de texto de alta calidad a partir de una entrada determinada, como una consulta, un fragmento o un documento. ibmwxGranite278MMultilingualRtrvr
granite-embedding-english-reranker-r2

Estado: Disponible

Un modelo de 149 millones de parámetros de la suite « Granite Embeddings», proporcionado por IBM. El modelo se ha entrenado para la reordenación de fragmentos, siguiendo el método « granite-embedding-english-r2 » para su uso en flujos de trabajo RAG. ibmwxGraniteEmbeddingEnglishRerankerR2
multilingual-e5-large

Estado: Disponible

Un modelo integrado creado por Microsoft y facilitado por Hugging Face. El modelo « multilingual-e5-large » resulta útil para tareas como la recuperación de pasajes o de información, la similitud semántica, la minería de textos paralelos y la recuperación de paráfrasis. ibmwxMultilingualE5Large
slate-30m-english-rtrvr

Estado: Disponible

Los modelos de incrustación de slate proporcionados por IBM están diseñados para generar incrustaciones a partir de diversas entradas, como consultas, fragmentos o documentos. ibmwxSlate30mEnglishRtrvr
slate-125m-english-rtrvr

Estado: Disponible

Los modelos de incrustación de slate proporcionados por IBM están diseñados para generar incrustaciones a partir de diversas entradas, como consultas, fragmentos o documentos. ibmwxSlate125mEnglishRtrvr
Modelos de reordenación
Modelo Descripción Grupo de imágenes
ms-marco-MiniLM-L-12-v2

Estado: Disponible

Un modelo de reordenación creado por Microsoft y facilitado por Hugging Face. A partir de un texto de consulta y un conjunto de fragmentos de documentos, el modelo clasifica la lista de fragmentos de mayor a menor relevancia con respecto a la consulta. ibmwxMsMarcoMinilmL12V2
Modelos de extracción de texto
Modelo Descripción Grupo de imágenes
wdu

Estado: Disponible

Un conjunto de modelos de procesamiento de texto en lenguaje natural representados por el identificador «wdu». Las plantillas siempre se incluyen al duplicar las imágenes para watsonx.ai.
modelos de serie temporal
Modelo Descripción Grupo de imágenes
granite-ttm-512-96-r2

Estado: Disponible

Los modelos de series temporales « Granite » son modelos compactos preentrenados para la predicción de series temporales multivariantes desarrollados por IBM Research, también conocidos como «Tiny Time Mixers» (TTM). Los modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y, de forma predeterminada, generan un conjunto de datos de previsión con 96 puntos de datos por canal. ibmwxGraniteTimeseriesTtmV1
granite-ttm-1024-96-r2

Estado: Disponible

Los modelos de series temporales « Granite » son modelos compactos preentrenados para la predicción de series temporales multivariantes desarrollados por IBM Research, también conocidos como «Tiny Time Mixers» (TTM). Los modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y, de forma predeterminada, generan un conjunto de datos de previsión con 96 puntos de datos por canal. ibmwxGraniteTimeseriesTtmV1
granite-ttm-1536-96-r2

Estado: Disponible

Los modelos de series temporales « Granite » son modelos compactos preentrenados para la predicción de series temporales multivariantes desarrollados por IBM Research, también conocidos como «Tiny Time Mixers» (TTM). Los modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y, de forma predeterminada, generan un conjunto de datos de previsión con 96 puntos de datos por canal. ibmwxGraniteTimeseriesTtmV1
Modelos base disponibles para ajustar
Modelo Descripción Grupo de imágenes
granite-3-1-8b-base

Estado: Disponible

Granite 3.1 8b base es un modelo autorregresivo básico preentrenado con una longitud de contexto de 128k, destinado a ser ajustado.

Método de afinación: Afinación completa, afinación « LoRA »

ibmwxGranite318BBase
llama-3-1-8b-instruct

Estado: Disponible

Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada.

Método de afinación: Afinación completa, afinación « LoRA »

ibmwxLlama318bInstruct
llama-3-1-70b-instruct

Estado: Disponible

Un modelo de lenguaje autorregresivo que utiliza una arquitectura Transformer optimizada.

Método de afinación: Afinación completa, afinación « LoRA »

ibmwxLlama3170bInstruct
llama-3-1-70b-gptq

Estado: Disponible

Llama 3.1 70b es un modelo generativo de texto preentrenado con 70 000 millones de parámetros, optimizado para casos de uso de diálogo multilingüe y generación de código.

Método de ajuste: ajuste fino « QLoRA »

ibmwxLlama3170BGptq

Modelos base para watsonx Assistant

Puedes elegir qué modelos de base quieres duplicar en función de las funciones que desees utilizar:

Modelo Características que ofrece el modelo Grupo de imágenes
ibm-granite-8b-unified-api-model-v2
  • Reescribir las preguntas de los usuarios en un formato comprensible para la búsqueda conversacional
  • Recopilar información para completar las variables en las acciones personalizadas

No aplicable.

Este modelo se duplica automáticamente al duplicar las imágenes de watsonx Assistant.

granite-3-8b-instruct
  • Responder a preguntas de búsqueda coloquial
ibmwxGranite38BInstruct
llama-3-1-70b-instruct
  • Reescribir las preguntas de los usuarios en un formato comprensible para la búsqueda conversacional
  • Responder a preguntas de búsqueda coloquial
  • Recopilar información para completar las variables en las acciones personalizadas
ibmwxLlama3170bInstruct
llama-3-3-70b-instruct

5.3.1 y, a partir de entonces, este modelo solo se puede utilizar con IBM Software Hub la versión 5.3.1 o posterior.

  • Reescribir las preguntas de los usuarios en un formato comprensible para la búsqueda conversacional
  • Responder a preguntas de búsqueda coloquial
  • Recopilar información para completar las variables en las acciones personalizadas
ibmwxLlama3370BInstruct

Modelos base para watsonx BI

Debes replicar los modelos de base necesarios.

Modelo Características que ofrece el modelo Grupo de imágenes
granite-3-8b-instruct Ofrece recomendaciones, análisis y resúmenes sobre tus datos empresariales regulados. granite-3-8b-instruct
slate-30m-english-rtrvr Busca elementos, métricas, columnas, preguntas y valores de filtro semánticamente similares para responder a preguntas de negocio. ibmwxSlate30mEnglishRtrvr

Modelos base para watsonx Code Assistant

Debes replicar los modelos de base necesarios.

Modelo Características que ofrece el modelo Grupo de imágenes
granite-3-3-8b-instruct Asistencia en programación en otros lenguajes distintos de Java. ibmwxGranite338BInstruct
ibm-granite-20b-code-javaenterprise-v2 Ayuda con la programación en Java. No aplicable.

Este modelo se duplica automáticamente al duplicar las imágenes de watsonx Code Assistant.

ms-marco-MiniLM-L-12-v2 Un modelo de reordenación creado por Microsoft y facilitado por Hugging Face. A partir de un texto de consulta y un conjunto de fragmentos de documentos, el modelo clasifica la lista de fragmentos de mayor a menor relevancia con respecto a la consulta. ibmwxMsMarcoMinilmL12V2

Modelos base para watsonx Code Assistant for Z Understand

5.3.0 En IBM Software Hub la versión 5.3.0, el modelo requerido se replica automáticamente.

5.3.1 y, a partir de IBM Software Hub la versión 5.3.1, es necesario duplicar los modelos necesarios.

Modelo Características que ofrece el modelo Grupo de imágenes
mistral-medium-2508
  • Responder a las consultas por chat sobre la aplicación
  • Identificar las reglas de negocio
  • Generar descripciones en lenguaje natural para el diccionario de datos
Atención: Para descargar y utilizar este modelo, debes adquirir por separado el Mistral AI junto con una licenci IBM.
ibmwxMistralMedium2508
ms-marco-MiniLM-L-12-v2
  • Asegúrate de proporcionar el contexto pertinente al modelo base
ibmwxMsMarcoMinilmL12V2
slate-125m-english-rtrvr
  • Crear incrustaciones
  • Habilitar la búsqueda semántica
ibmwxSlate125mEnglishRtrvr

Modelos base para watsonx.data Premium

Debes duplicar todos los modelos necesarios.

Modelo Características que ofrece el modelo Grupo de imágenes
granite-3-2b-instruct
  • Ingesta
  • Texto a SQL
  • Búsqueda de recuperación
ibmwxGranite32BInstruct
llama-3-3-70b-instruct
  • Ingesta
  • Texto a SQL
  • Búsqueda de recuperación
ibmwxLlama3370BInstruct
mistral-small-3-1-24b-instruct-2503
  • Ingesta
  • Texto a SQL
ibmwxMistralSmall3124BInstruct2503

Modelos base para watsonx.data intelligence

Si tienes pensado habilitar funciones basadas en IA generativa en la CPU o la GPU, debes replicar el modelo especificado. (No es necesario duplicar el modelo especificado si tiene previsto conectarse a una instancia remota en watsonx.ai la que se esté ejecutando dicho modelo.)

Modelo Características que ofrece el modelo Grupo de imágenes
granite-3-8b-instruct Ampliación de metadatos de la IA general ibmwxGranite38BInstruct

Modelos base para watsonx Orchestrate

Puedes elegir qué modelos de base quieres duplicar en función de las funciones que desees utilizar:

Modelo Características que ofrece el modelo Grupo de imágenes
ibm-granite-8b-unified-api-model-v2
  • Reescribir las preguntas de los usuarios en un formato comprensible para la búsqueda conversacional
  • Recopilar información para completar las variables en las acciones personalizadas
No aplicable.

Este modelo se duplica automáticamente al duplicar las imágenes de watsonx Orchestrate.

granite-3-8b-instruct
  • Responder a preguntas de búsqueda coloquial
ibmwxGranite38BInstruct
llama-3-1-70b-instruct
  • Reescribir las preguntas de los usuarios en un formato comprensible para la búsqueda conversacional
  • Responder a preguntas de búsqueda coloquial
  • Recopilar información para completar las variables en las acciones personalizadas
  • Selecciona, conecta y coordina múltiples herramientas o API mediante el uso de la IA agentiva
    Importante: Si tiene previsto instalar este modelo, también debe duplicar el slate-30m-english-rtrvr modelo.
ibmwxLlama3170bInstruct
llama-3-2-90b-vision-instruct
  • Reescribir las preguntas de los usuarios en un formato comprensible para la búsqueda conversacional
  • Responder a preguntas de búsqueda coloquial
  • Recopilar información para completar las variables en las acciones personalizadas
  • Selecciona, conecta y coordina múltiples herramientas o API mediante el uso de la IA agentiva
    Importante: Si tiene previsto instalar este modelo, también debe duplicar el slate-30m-english-rtrvr modelo.
ibmwxLlama3290bVisionInstruct
slate-30m-english-rtrvr Búsqueda semántica en el watsonx Orchestrate catálogo.
Recuerda: este modelo es necesario si tienes pensado instalar cualquiera de los siguientes modelos:
  • llama-3-1-70b-instruct
  • llama-3-2-90b-vision-instruct
ibmwxSlate30mEnglishRtrvr

Qué hacer a continuación

Ahora que ya has identificado qué modelos e imágenes opcionales debes replicar, estás listo para completar el script de actualización de las variables de entorno (actualización de la versión 5.3.x a una versión posterior 5.3 refresh).