Festlegen eines Standard-Einbettungsmodells für Vektorspeicher

Sie können das Einbettungsmodell festlegen, das verschiedene Arten von Vektorspeichern verwenden, um Daten in Arrays von numerischen Werten zu vektorisieren, die in einem mehrdimensionalen Raum dargestellt werden.

Vorbereitende Schritte

Sie müssen ein Clusteradministrator sein.

Vorgehensweise

Legen Sie das Standard-Einbettungsmodell für verschiedene Arten von Vektorspeichern wie In-Memory und fest Elasticsearch , watsonx.data™ Milvus indem Sie den folgenden Befehl ausführen:
oc patch watsonxaiifm watsonxaiifm-cr \
--namespace=${PROJECT_CPD_INST_OPERANDS} \
--type=merge \
--patch='{"spec":{"default_models": {"embedding_model_memory": <model_id>, "embedding_model_elasticsearch": <model_id>, "embedding_model_watsonx_data": <model_id>}}}'
Verwenden Sie die folgende Tabelle, um zu ermitteln, welche Einbettungsmodelle für jeden Typ von Vektordatenspeicher konfiguriert werden können.
  • - Das Einbettungsmodell kann vom Vektorspeicher als Standardmodell verwendet werden.
Einbettungsmodell-ID Im Speicher-Vektorspeicher Elasticsearch Vektorspeicher watsonx.data Milvus Vektorspeicher
sentence-transformers/all-minilm-l6-v2
sentence-transformers/all-minilm-l12-v2
.elser_model_1  
.elser_model_2  
.elser_model_2_linux-x86_64  
ibm/granite-embedding-107m-multilingual
ibm/granite-embedding-278m-multilingual
intfloat/multilingual-e5-large
ibm/slate-30m-english-rtrvr
ibm/slate-125m-english-rtrvr

Nächste Schritte

Um mit der Verwendung von Einbettungsmodellen zur Verbesserung der semantischen Suche, des Dokumentenvergleichs und der Neuanordnung von Inhalten nach Relevanz zu beginnen, siehe Unterstützte Encoder modelle.