Definindo um modelo de incorporação padrão para armazenamentos vetoriais

Você pode definir o modelo de incorporação que diferentes tipos de armazenamentos vetoriais usam para vetorizar dados em matrizes de valores numéricos representados em um espaço multidimensional.

Antes de iniciar

Você deve ser um administrador de cluster.

Procedimento

Defina o modelo de incorporação padrão para vários tipos de armazenamentos vetoriais, como na memória, Elasticsearch e watsonx.data™ Milvus executando o seguinte comando:

oc patch watsonxaiifm watsonxaiifm-cr \
--namespace=${PROJECT_CPD_INST_OPERANDS} \
--type=merge \
--patch='{"spec":{"default_models": {"embedding_model_memory": <model_id>, "embedding_model_elasticsearch": <model_id>, "embedding_model_watsonx_data": <model_id>}}}'

Use a tabela a seguir para determinar quais modelos de incorporação podem ser configurados para cada tipo de armazenamento de dados vetoriais.

✓ - O modelo de incorporação pode ser usado como modelo padrão pelo armazenamento de vetores.

ID do modelo de incorporação	Armazenamento de vetores de memória	Elasticsearch Armazenamento de vetor	watsonx.data Milvus Armazenamento de vetor
`sentence-transformers/all-minilm-l6-v2`	✓	✓	✓
`sentence-transformers/all-minilm-l12-v2`	✓	✓	✓
`.elser_model_1`	✓	✓
`.elser_model_2`	✓	✓
`.elser_model_2_linux-x86_64`	✓	✓
`ibm/granite-embedding-107m-multilingual`	✓	✓	✓
`ibm/granite-embedding-278m-multilingual`	✓	✓	✓
`intfloat/multilingual-e5-large`	✓	✓	✓
`ibm/slate-30m-english-rtrvr`	✓	✓	✓
`ibm/slate-125m-english-rtrvr`	✓	✓	✓

O quê fazer em seguida

Para começar a usar modelos de incorporação para melhorar a pesquisa semântica, a comparação de documentos e a reclassificação de conteúdo com base na relevância, consulte Modelos de codificador compatíveis.