Lignes directrices sur l'utilisation des ressources pour les modèles de fondation personnalisés
En fonction de la version de votre modèle, il se peut que vous deviez attribuer des ressources spécifiques, telles que la mémoire ou le nombre de GPU, pour pouvoir le déployer avec succès.
Formules d'utilisation des ressources
Suivez ces formules lorsque vous affectez des ressources au déploiement de votre modèle de fondation personnalisé.
Important :
Le non-respect de ces formules peut entraîner un comportement inattendu du modèle.
Modèles non quantifiés :
| Ressource | Calcul |
|---|---|
| Mémoire GPU | (Nombre de paramètres Billion * 2) + 50 % de mémoire supplémentaire |
| Nombre de GPU | Le nombre de GPU dépend des besoins en mémoire des GPU : 1GPU = 80 Go |
| Nombre de CPU | Nombre de GPU + 1 |
| Mémoire de l'unité centrale | Egale à la mémoire du GPU |
Modèles quantifiés :
modèles quantifiés à 4 bits :
| Ressource | Calcul |
|---|---|
| Mémoire GPU | (Nombre de paramètres Billion * 0.5 ) + 50 % de mémoire supplémentaire |
| Nombre de GPU | Le nombre de GPU dépend des besoins en mémoire des GPU : 1GPU = 80 Go |
| Nombre de CPU | Nombre de GPU + 1 |
| Mémoire de l'unité centrale | Egale à la mémoire du GPU |
modèles quantifiés sur 8 bits :
| Ressource | Calcul |
|---|---|
| Mémoire GPU | Nombre de paramètres Billion + 50 % de mémoire supplémentaire |
| Nombre de GPU | Le nombre de GPU dépend des besoins en mémoire des GPU : 1GPU = 80 Go |
| Nombre de CPU | Nombre de GPU + 1 |
| Mémoire de l'unité centrale | Egale à la mémoire du GPU |