Definindo um modelo de incorporação padrão para armazenamentos vetoriais

Você pode definir o modelo de incorporação que diferentes tipos de armazenamentos vetoriais usam para vetorizar dados em matrizes de valores numéricos representados em um espaço multidimensional.

Antes de iniciar

Você deve ser um administrador de cluster.

Procedimento

Defina o modelo de incorporação padrão para vários tipos de armazenamentos vetoriais, como na memória, Elasticsearch e watsonx.data™ Milvus executando o seguinte comando:
oc patch watsonxaiifm watsonxaiifm-cr \
--namespace=${PROJECT_CPD_INST_OPERANDS} \
--type=merge \
--patch='{"spec":{"default_models": {"embedding_model_memory": <model_id>, "embedding_model_elasticsearch": <model_id>, "embedding_model_watsonx_data": <model_id>}}}'
Use a tabela a seguir para determinar quais modelos de incorporação podem ser configurados para cada tipo de armazenamento de dados vetoriais.
  • - O modelo de incorporação pode ser usado como modelo padrão pelo armazenamento de vetores.
ID do modelo de incorporação Armazenamento de vetores de memória Elasticsearch Armazenamento de vetor watsonx.data Milvus Armazenamento de vetor
sentence-transformers/all-minilm-l6-v2
sentence-transformers/all-minilm-l12-v2
.elser_model_1  
.elser_model_2  
.elser_model_2_linux-x86_64  
ibm/granite-embedding-107m-multilingual
ibm/granite-embedding-278m-multilingual
intfloat/multilingual-e5-large
ibm/slate-30m-english-rtrvr
ibm/slate-125m-english-rtrvr

O quê fazer em seguida

Para começar a usar modelos de incorporação para melhorar a pesquisa semântica, a comparação de documentos e a reclassificação de conteúdo com base na relevância, consulte Modelos de codificador compatíveis.