Festlegen eines Standard-Einbettungsmodells für Vektorspeicher
Sie können das Einbettungsmodell festlegen, das verschiedene Arten von Vektorspeichern verwenden, um Daten in Arrays von numerischen Werten zu vektorisieren, die in einem mehrdimensionalen Raum dargestellt werden.
Vorbereitende Schritte
Sie müssen ein Clusteradministrator sein.
Vorgehensweise
Legen Sie das Standard-Einbettungsmodell für verschiedene Arten von Vektorspeichern wie In-Memory und fest Elasticsearch , watsonx.data™ Milvus indem Sie den folgenden Befehl ausführen:
oc patch watsonxaiifm watsonxaiifm-cr \
--namespace=${PROJECT_CPD_INST_OPERANDS} \
--type=merge \
--patch='{"spec":{"default_models": {"embedding_model_memory": <model_id>, "embedding_model_elasticsearch": <model_id>, "embedding_model_watsonx_data": <model_id>}}}'Verwenden Sie die folgende Tabelle, um zu ermitteln, welche Einbettungsmodelle für jeden Typ von Vektordatenspeicher konfiguriert werden können.- ✓ - Das Einbettungsmodell kann vom Vektorspeicher als Standardmodell verwendet werden.
| Einbettungsmodell-ID | Im Speicher-Vektorspeicher | Elasticsearch Vektorspeicher | watsonx.data Milvus Vektorspeicher |
|---|---|---|---|
sentence-transformers/all-minilm-l6-v2 |
✓ | ✓ | ✓ |
sentence-transformers/all-minilm-l12-v2 |
✓ | ✓ | ✓ |
.elser_model_1 |
✓ | ✓ | |
.elser_model_2 |
✓ | ✓ | |
.elser_model_2_linux-x86_64 |
✓ | ✓ | |
ibm/granite-embedding-107m-multilingual |
✓ | ✓ | ✓ |
ibm/granite-embedding-278m-multilingual |
✓ | ✓ | ✓ |
intfloat/multilingual-e5-large |
✓ | ✓ | ✓ |
ibm/slate-30m-english-rtrvr |
✓ | ✓ | ✓ |
ibm/slate-125m-english-rtrvr |
✓ | ✓ | ✓ |