Activation de la mise à l'échelle automatique basée sur les événements sur les GPU pour une instance de IBM Software Hub
Si vous avez installé le Red Hat® OpenShift® Custom Metrics Autoscaler, vous pouvez activer la mise à l'échelle automatique basée sur les événements en fonction des demandes d'inférence. Pour activer la mise à l'échelle en fonction des événements, vous devez configurer l'autoscaler de métriques personnalisées qui s'exécute dans le projet d'instance afin d'interroger OpenShift Container Platform les métriques.
- Phase d'installation
Configuration d'un poste de travail client
Configuration d'un cluster
Collecte des informations requises
Préparation à l'exécution d'installations dans un réseau restreint
Préparation à l'exécution d'installations à partir d'un registre de conteneurs privé
Préparation du cluster pour IBM Software Hub
Préparation à l'installation d'une instance de IBM Software Hub
Installation d'une instance de IBM Software Hub
Configuration du control plane
Installation de solutions et services
- Qui doit accomplir cette tâche?
Administrateur de cluster Un administrateur de cluster doit effectuer cette tâche.
- Quand devez-vous terminer cette tâche?
Cette tâche est facultative. Effectuez cette tâche si les affirmations suivantes sont vraies :
- Vous souhaitez activer la mise à l'échelle basée sur les événements sur le GPU pour cette instance de IBM Software Hub.
- Vous prévoyez d'installer un ou plusieurs des services suivants dans cette instance de IBM Software
Hub:
- IBM Knowledge Catalog Premium *
- IBM Knowledge Catalog Standard *
- Watson Speech services *
- watsonx.ai™
- watsonx Assistant *
- Watsonx BI
- watsonx Code Assistant™
- watsonx Code Assistant for Red Hat Ansible® Lightspeed
- watsonx Code Assistant for Z
- watsonx Code Assistant for Z Agentic
- watsonx Code Assistant for Z Code Explanation
- watsonx Code Assistant for Z Code Generation
- watsonx.data™ Premium
- watsonx.data intelligence
- watsonx™ Orchestrate *
Un astérisque (*) indique que le service utilise Inference foundation models dans certaines situations.
Répétez autant de fois que nécessaire Répétez cette tâche pour chaque instance où IBM Software Hub les conditions précédentes sont remplies.
Avant de commencer
Si vous souhaitez activer la mise à l'échelle basée sur les événements en fonction des demandes d'inférence, vous devez installer le Red Hat OpenShift Custom Metrics Autoscaler.
Assurez-vous de définir les variables d'environnement avant d'exécuter les commandes de cette tâche.
A propos de cette tâche
- Créer un compte de service
- Créer un rôle
- Lier le compte de service au rôle
- Créer une authentification de déclenchement pour le jeton du compte de service
Procédure
Pour configurer l'autoscaler de métriques personnalisées afin d'utiliser OpenShift Container Platform les métriques :