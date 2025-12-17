Intelligence artificielle Automatisation informatique

Créez des pipelines de données sous forme de code : présentation du SDK Python IBM watsonx.data integration

La disponibilité générale du SDK Python watsonx.data integration représente une étape clé dans la vision d’IBM d’un socle de données prêtes pour l’IA, puisqu’elle permet aux équipes en charge des données de dimensionner le développement de pipelines et de fournir des données de qualité aux agents. 

Publié le 17 décembre 2025
Deux collègues discutent devant un ordinateur de bureau avec des données à l’écran

Le SDK Python watsonx.data integration introduit un modèle code-first qui s’appuie sur les compétences existantes en Python et offre aux agents une interface cohérente pour la génération et la validation de code. À l’heure où les équipes chargées des données se préparent à l’IA agentique, le développement de pipelines doit proposer une autre option adaptée à la génération de LLM.

Le SDK Python favorise ce changement en permettant aux équipes de construire, de versionner, d’automatiser et de gouverner des pipelines groupés et de flux en temps réel en tant que code, ce qui réduit les efforts manuels et permet une intégration évolutive des données. En plus de notre investissement continu dans la création de pipelines agentiques (en aperçu), cette sortie renforce l’engagement d’IBM, qui est d’accompagner les clients où qu’ils en soient dans l’établissement de leur socle de données prêtes pour l’IA.

Pour répondre aux exigences de l’IA agentique, il faut développer des pipelines flexibles

Toutes les entreprises subissent les pressions liées à l’environnement de données actuel : les équipes métier ont besoin d’informations plus rapides, les équipes en charge des données sont mises à rude épreuve par des systèmes fragiles et fragmentés, et les responsables de la conformité craignent que des données sensibles ne passent entre les mailles du filet. Ces pressions s’intensifient avec l’essor de l’IA agentique, dont le succès dépend non seulement de modèles performants, mais aussi de la solidité du socle de données sur lequel ils reposent.

Au cœur de cette base se trouve l’intégration de données : les pipelines qui connectent, transforment et fournissent les données afin qu’elles puissent être utilisées en toute confiance. Lorsque l’intégration est défaillante, il en va de même pour l’IA. Selon le rapport The GenAI Divide du MIT, 95 % des projets pilotes d’IA générative échouent non pas parce que les modèles sont déficients, mais parce que le socle de données n’est pas prêt. Parallèlement, les équipes en charge des données doivent construire et gérer toujours plus de pipelines, avec des types et des environnements de données toujours plus variés, alors même que 77 % des entreprises déclarent manquer des compétences requises.

Cet écart croissant entre la demande et les capacités montre clairement que le développement de pipelines doit être flexible pour répondre aux besoins des utilisateurs. La création traditionnelle ne suffit plus. Les utilisateurs professionnels veulent exprimer leur intention en langage naturel, les techniciens veulent du code et de nombreuses équipes s’appuient sur un canevas visuel pour accélérer la conception.

IBM investit massivement dans cette approche multimodale afin que watsonx.data integration puisse soutenir chaque utilisateur dans son workflow préféré.

Une approche code-first pour la création de pipelines de données

Le nouveau SDK Python IBM watsonx.data integration constitue une avancée majeure vers cette vision, car il offre aux développeurs et aux ingénieurs de données une excellente solution code-first pour construire, automatiser et maintenir les pipelines de manière programmatique, ce qui réduit les efforts manuels et accélère la création de valeur.

Les ingénieurs de données et les développeurs ETL apprécient depuis longtemps de pouvoir choisir comment construire des pipelines de données, notamment en utilisant des interfaces visuelles no-code/low code ou en codant directement. Quel que soit le type de création, les pipelines peuvent être définis une seule fois, versionnés dans Git et déployés de manière cohérente via des workflows CI/CD. Chaque approche répond aux différents besoins et compétences des équipes de données.

Avec le SDK Python, les équipes peuvent désormais créer et gérer des pipelines d’intégration de données à l’aide de l’un des langages les plus largement adoptés dans le domaine de l’ingénierie de données. Dans la mesure où les ingénieurs de données sont à l’aise pour lire, écrire et examiner du code Python, ils appliquent ces mêmes compétences à IBM watsonx.data integration. Les pipelines sous forme de code ouvriront de nouvelles voies pour la réutilisation du code. En rendant ce SDK Python disponible, les équipes de données peuvent choisir parmi plusieurs options de création correspondant à leurs compétences et préférences.

Grâce à ce SDK, les équipes peuvent :

1. Les pipelines sous forme de code :

  • définir et réutiliser la logique de pipeline en Python dans différents environnements ;
  • versionner, examiner et vérifier les changements via Git et des pull requests ;
  • créer des connexions ainsi que concevoir, gérer et exécuter des pipelines entièrement en code ;
  • automatiser les tests, les promotions et les déploiements avec CI/CD ;
  • appliquer une gouvernance cohérente et des contrôles d’accès de manière programmatique.

2. Accédez à une expérience d’intégration de données unifiée grâce à un SDK unique

  • Utilisez un seul SDK pour les pipelines groupés (ETL/ELT/TETL) et de flux en temps réel
  • Éliminez les scripts personnalisés et les packages spécifiques aux outils grâce à un modèle de programmation cohérent
  • Conçu pour s’étendre à d’autres types d’intégration, dont les données non structurées, la réplication, etc.
  • Rationalisez l’administration de plateforme grâce à un contrôle programmatique des utilisateurs, des projets et des paramètres de sécurité.

3. Un pont bidirectionnel entre conception visuelle et code :

  • Prototypez les pipelines dans le canevas visuel ou créez-les directement en Python
  • Naviguez facilement entre l’interface utilisateur et le code grâce à l’exportation et l’importation instantanées via notre générateur de code SDK Python
  • Accélérez l’onboarding tout en permettant l’automatisation et le CI/CD à l’échelle.
  • Maintenez une connexion étroite entre les workflows visuels et programmatiques.

Ensemble, ces capacités posent les bases de la prochaine ère d’intégration de données, où les pipelines se comportent comme un logiciel, l’automatisation devient la norme et les futurs agents IA peuvent réfléchir aux flux de données, les optimiser et même les maintenir à l’échelle.

Modèles concrets : comment les équipes utilisent le SDK Python pour dimensionner le travail d’intégration

Si le SDK introduit une approche programmatique du développement de pipelines, son impact est surtout visible dans la manière dont les équipes l’appliquent au quotidien. Les premiers adoptants convergent vers un ensemble de modèles communs qui les aident à évoluer plus rapidement, à réduire les doublons et à fonctionner avec plus de cohérence.

Cas d’utilisation 1 : transformer un pipeline unique en un modèle réutilisable

Le point de départ est souvent un simple pipeline créé avec une interface utilisateur. Par exemple, ingérer un fichier CSV, appliquer une transformation et écrire les résultats dans un espace de stockage cloud. Au fur et à mesure que la demande augmente, d’autres équipes veulent la même logique avec des entrées différentes.

Avec le SDK Python, ce pipeline d’origine peut être exporté dans Python à l’aide de notre nouvelle fonctionnalité de génération de code Python et transformé en un modèle réutilisable et paramétré. Les nouveaux ensembles de paramètres et de valeurs du SDK vous permettent d’exporter ces configurations de l’interface utilisateur vers le contrôle de versions. Au lieu de saisir manuellement des valeurs dans des formulaires, vous pouvez définir et injecter programmatiquement des configurations pour les environnements Dev, Test et Prod en une seule fois. Les variantes sont créées en ajustant quelques lignes de code plutôt qu’en recréant le pipeline de zéro, ce qui accélère la livraison, réduit les erreurs et offre un modèle évolutif que les équipes peuvent standardiser.

Cas d’utilisation 2 : modifier des pipelines à l’échelle pour la migration d’infrastructures

Un autre défi courant se pose lorsque les pipelines doivent être mis à jour avec de nombreuses sources de données ou environnements impactés, par exemple lors de la migration d’une base de données ou d’un magasin de données. Au lieu de mettre à jour les pipelines dans l’interface utilisateur, les équipes peuvent utiliser le SDK pour dupliquer les flux de façon programmatique, mettre à jour les connecteurs et les configurations de connexion, ajuster les paramètres et publier les mises à jour en quelques secondes. Cela est particulièrement utile dans les environnements où les pipelines doivent évoluer rapidement en fonction de la modification des sources de données.

Le SDK peut se connecter en toute sécurité à votre environnement hybride, que ce soit sur le cloud public/SaaS ou dans des environnements logiciels autogérés. Plutôt que des dizaines de modifications manuelles, un seul changement de code peut être appliqué de manière cohérente partout.

Ces modèles pointent vers un changement plus large : le passage de la configuration manuelle au développement reproductible piloté par logiciels. En traitant les pipelines comme du code, les entreprises peuvent dimensionner l’intégration des données de manière plus fiable et construire le socle de données robuste nécessaire pour l’IA agentique.

Centraliser

Le SDK Python watsonx.data integration est une étape clé dans la vision d’IBM d’un socle de données prêtes pour l’IA. En intégrant l’automatisation programmatique à watsonx.data integration, les équipes peuvent construire et maintenir des pipelines avec la même rigueur et évolutivité que le développement logiciel, tout en respectant la modalité préférée des utilisateurs pour aider à combler le déficit de compétences en ingénierie de données.

Dans le cadre du portefeuille watsonx.data plus large, watsonx.data integration fonctionne de façon fluide avec watsonx.data intelligence pour fournir un socle de données fiable de bout en bout. Ensemble, ces offres permettent aux entreprises de déplacer, comprendre, gouverner et activer les données dans des environnements hybrides, alimentant ainsi l’IA et les workflows agentiques à l’échelle.

Créer des pipelines plus rapidement avec IBM watsonx.data integration

Commencer avec ces exemples de scripts

Explorer la documentation

Caroline Garay

Product Marketing Manager

IBM Data Integration

John Wen

Product Manager

IBM Data Integration

Jason Britto

Senior Software Engineer

IBM Data Integration

Mitch Barnett

Software Development Manager

IBM Data Integration