Environnements de bloc-notes

Lorsque vous exécutez un notebook dans l'éditeur de notebook d'un projet, vous choisissez un modèle d'environnement qui définit les ressources de calcul pour l'environnement d'exécution. Le modèle d'environnement spécifie le type, la taille et la puissance de la configuration matérielle, ainsi que la configuration logicielle. Pour les carnets, les définitions d'environnement incluent un langage pris en charge Python ou R.

Pour plus d'informations, voir :

Remarque :

Tous les modèles d'environnement basés sur l' 24.1 Runtime sont désormais obsolètes et seront supprimés dans une prochaine version.

Si vous disposez d'ordinateurs portables qui utilisent des environnements basés sur Runtime 24.1, mettez-les à jour afin qu'ils utilisent la dernière version de l'environnement d'exécution (Runtime 25.1 ou GenAI 25-A, selon le cas).

Pour plus de détails, consultez la section Modification des environnements de bloc-notes.

Si vous disposez de modèles d'environnement personnalisés basés sur Runtime 24.1 et que vous utilisez conda, vous devez les migrer avant que Runtime 24.1 ne soit supprimé. Pour plus d'informations, consultez la section Migration des modèles d'environnement personnalisés de Runtime 24.1 vers Runtime 25.1.

Modèles d'environnement inclus

Les environnements Python suivants sont inclus avec Watson Studio. Les environnements inclus sont répertoriés sous Modèles dans la page Environnements de l'onglet Gérer de votre projet.

Types de durées d'exécution

Deux types d'environnements d'exécution d' Python s sont disponibles :

  • Durée d'exécution : axée sur l'apprentissage automatique traditionnel, avec la stabilité comme priorité. Comprend un assortiment complet de frameworks ML ( TensorFlow,PyTorch, XGBoost) et de packages de visualisation ( Matplotlib, Seaborn, Bokeh).
  • GenAI Durée d'exécution : axée sur les charges de travail d'IA générative. Comprend les cadres et outils d' GenAI (par exemple, LangChain ). Ce type d'exécution est destiné au développement et au déploiement de services d'IA au sein de la plateforme.

Les deux types d'exécution incluent des paquets fondamentaux tels que Pandas, l' NumPy, e et scikit-learn, bien que les versions des paquets puissent différer entre les deux types. Les types d'exécution suivent des cycles de publication et d'obsolescence indépendants, ce qui se reflète dans leurs différents schémas de versionnement (par exemple, 25-A et 25.1 ).

Principales différences :

  • Watson NLP et Decision Optimization : Disponible uniquement dans les environnements Runtime, pas dans les environnements Runtime d' GenAI.
  • Prise en charge linguistique : GenAI Les environnements d'exécution sont uniquement ceux d' Python. Le langage de programmation R n'est disponible que dans les environnements Runtime.
  • Cas d'utilisation d' GenAI Runtime :
    • Développement de services d'IA où le code du notebook s'exécute dans le même environnement que le service déployé
    • Effectuer des appels d'inférence de modèle avec des modèles d'IA génératifs
    • Travailler avec LangChain et d'autres frameworks GenAI
Remarque :

L'exécution 24.1 sur Python3.11 est prise en charge sur la plateforme Z ( s390x )

Modèles d'environnement par défaut pour Python
Nom Configuration matérielle
Runtime 25.1 on Python 3.12 1 UC virtuelle et 2 Go RAM
GenAI 25-A on Python 3.12 1 UC virtuelle et 2 Go RAM
Runtime 24.1 on Python 3.11 1 UC virtuelle et 2 Go RAM

Si vous avez installé Runtime 24.1 with R4.3 ou Runtime 25.1 on R 4.4 service, les environnements R par défaut suivants sont répertoriés :

Remarque :

Les environnements d'exécution basés sur R pour l'éditeur de notebook ne fonctionnent pas sur les plateformes suivantes :

  • IBM Power® ( ppc64le ) (sauf si Analytics Engine est installé)
  • IBM Z (s390x)

Tableau 2. Modèles d'environnement par défaut pour R
Nom Configuration matérielle
Runtime 25.1 on R 4.4 1 UC virtuelle et 2 Go RAM
Runtime 24.1 on R 4.3 1 UC virtuelle et 2 Go RAM
Important :

Aucun des environnements de bloc-notes basés sur R n'est conforme à la norme FIPS.

Pour plus d'informations sur FIPS, consultez la section Services prenant en charge FIPS.

Blocs-notes et environnements CPU

Lorsque vous ouvrez un bloc-notes en mode édition dans un environnement d'exécution CPU, une session interactive se connecte à un noyau Jupyter pour le langage de bloc-notes et l'environnement d'exécution que vous sélectionnez. L'environnement d'exécution est démarré par utilisateur et non par bloc-notes. Cela signifie que si vous ouvrez un second bloc-notes avec le même modèle d'environnement dans le même projet, un second noyau est démarré dans le même environnement d'exécution. Les ressources des environnements d'exécution sont partagées. Pour plus d'informations, consultez la section Portée d'exécution.

Si nécessaire, vous pouvez redémarrer le noyau ou rétablir la connexion au noyau. Lorsque vous redémarrez un noyau, il s'arrête, puis redémarre dans la même session, mais tous les résultats d'exécution sont perdus. Lorsque vous rétablissez une connexion à un noyau, le bloc-notes est connecté à la même session de noyau et tous les résultats d'exécution précédents qui avaient été sauvegardés sont disponibles.

Autres options d'environnement pour les blocs-notes

Vous pouvez créer des modèles d'environnement de bloc-notes et personnaliser la configuration du logiciel. Voir Création de modèles d'environnement.

Si vous codez des scripts ou des blocs-notes Python dans l'interface IDE de JupyterLab, vous pouvez utiliser un environnement JupyterLab. Voir les modèles JupyterLab d'environnement.

Si vous avez installé Execution Engine for Apache Hadoop , vous pouvez créer des modèles Hadoop d'environnement pour exécuter des notebooks sur votre Hadoop cluster. Voir Environnements Hadoop.

Si vous avez installé le Jupyter Notebooks with Python with GPU service, vous pouvez créer un modèle d'environnement pour exécuter des notebooks sur des clusters GPU. Voir Environnements GPU.

Si vous avez installé le Analytics Engine powered by Apache Spark service, vous pouvez choisir parmi les modèles d'environnement Spark par défaut avec plusieurs configurations matérielles pour Python et R. Voir Environnements Spark.

Système de fichiers dans les environnements de bloc-notes Jupyter

Les environnements d'exécution sont lancés par utilisateur, mais le stockage de données standard qui y est monté est partagé avec les autres membres du projet. Cela signifie que les autres membres du projet peuvent accéder aux fichiers que vous téléchargez dans votre environnement de bloc-notes. Si votre équipe travaille sur un ensemble de données volumineux, cela pourrait vous aider à éviter de dupliquer les efforts et d'utiliser des ressources supplémentaires.

Vous devez tenir compte de la taille des fichiers de données que vous téléchargez vers votre environnement de bloc-notes. Les fichiers très volumineux peuvent nécessiter plus d'espace de stockage (espace disque) que celui disponible sur le nœud sur lequel le runtime est démarré.

Ne confondez pas l'espace de stockage et la taille de la mémoire de votre environnement. En choisissant un environnement plus grand, vous bénéficiez de plus de mémoire et de puissance CPU, mais pas de plus d'espace de stockage.

Si vos fichiers de données sont volumineux, envisagez de passer à Spark ou Hadoop pour traiter ces fichiers. Avec Spark ou Hadoop, la charge de travail de traitement est répartie sur plusieurs nœuds.

La limite de stockage de fichiers par défaut est 100Gi par Cloud Pak for Data instance. Selon la classe de stockage utilisée par votre cluster, il peut être possible d'augmenter cette limite. Si vous avez besoin de plus d'espace pour vos données, contactez l'administrateur de votre cluster.

Le système de fichiers de chaque environnement d'exécution est non persistant. Si vous arrêtez un runtime, les fichiers que vous avez téléchargés sont supprimés. Pour vous assurer que vos données ne soient pas supprimées, utilisez un support de stockage externe et persistant. Les systèmes de fichiers persistants auxquels vous faites référence dans votre bloc-notes ne sont pas détruits lorsque l'environnement est arrêté.

Portée d'environnement d'exécution

Les durées d'exécution de l'environnement sont toujours limitées à un modèle d'environnement et à un utilisateur au sein d'un projet.

Par exemple, si vous associez chaque bloc-notes à son propre environnement, chaque bloc-notes obtient son propre environnement d'exécution. Cependant, si vous ouvrez un notebook dans un environnement que vous avez également sélectionné pour un autre notebook et que ce notebook dispose d'un runtime actif, les deux noyaux du notebook seront actifs dans le même runtime. Dans ce cas, les deux blocs-notes utiliseront les ressources de traitement et de données disponibles dans l'environnement d'exécution qu'ils partagent.

Si vous souhaitez éviter de partager les environnements d'exécution, mais que vous souhaitez utiliser la même configuration d'environnement d'exécution pour plusieurs notebooks dans un projet, vous pouvez créer des modèles d'environnement personnalisés avec les mêmes spécifications. Voir Création de modèles d'environnement.

Etapes suivantes