Développeurs

IBM annonce Data Asset Exchange (DAX) pour aider les développeurs avec des jeux de données libres et open source pour l’IA

Share this post:

Comme de plus en plus d’entreprises adoptent l’intelligence artificielle (IA), il est impératif de mettre des modèles de machine learning (ML) entre les mains des développeurs. À cette fin, le Center for Open-Source Data & AI Technologies (CODAIT) a lancé IBM Model Asset eXchange (MAX) en 2018 pour aider les data scientists et les développeurs à découvrir facilement des modèles prêts à l’emploi et open source de machine learning et de deep learning.

À l’OSCON 2019 cet été, nous avons annoncé le lancement d’IBM Data Asset eXchange (DAX), une plate-forme en ligne permettant aux développeurs et aux data scientists de trouver des jeux de données libres et ouverts soigneusement conservés sous licences open sources. Les développeurs qui adoptent des modèles de ML ont besoin de données ouvertes qu’ils peuvent utiliser en toute confiance sous des licences clairement définies.

Dans la mesure du possible, les jeux de données disponibles sur DAX utiliseront le cadre de licences de données open source de la Community Data License Agreement (CDLA) de la Linux Foundation afin de permettre le partage des données et la collaboration. De plus, DAX fournit un accès unique à divers jeux de données d’IBM et IBM Research et IBM prévoit de les enrichir régulièrement. Les données sur DAX s’intégreront de manière appropriée aux services IBM Cloud et d’IA.

 

Une source fiable de jeux de données libres

Pour les développeurs, DAX fournit une source fiable pour des jeux de données ouvertes soigneusement conservés pour l’IA. Ces jeux sont prêts à être utilisés dans les applications d’IA d’entreprise, avec du contenu connexe tel que des tutoriels pour faciliter le démarrage.

Pour le personnel responsable de l’utilisation et de la vérification des jeux de données, DAX fournit la conservation ainsi que des formats de jeux de données et des métadonnées normalisés, contrairement à la plupart des autres ressources de données ouvertes qui ont tendance à intégrer moins de vérifications de la qualité et des conditions de licence. Ainsi, les ensembles de données DAX sont globalement plus faciles à adopter au sein des entreprises.

Exemple d’utilisation des jeux de données

Un exemple des types d’ensembles de données que nous publions est celui de la Finance Proposition Bank et de la Contracts Proposition Bank. Ces jeux de données font partie d’un programme de recherche actif d’IBM Research. Ce projet de recherche vise à améliorer les technologies de compréhension du langage naturel que sous-tendent les multiples offres de produits IBM, notamment Watson Natural Language Understanding et Watson Compare & Comply.

Nos chercheurs ont créé ces fichiers de données avec l’aide des développeurs de Watson, en faisant correspondre les caractéristiques du texte cible à celles des documents du monde réel que le système analyse en production. Les chercheurs ont utilisé ces jeux de données pour former des versions spécifiques à un domaine des analyseurs qui extraient la signification sémantique des documents commerciaux régissant l’entreprise tels que les accords juridiques et les rapports financiers.

IBM Research détient une expérience importante dans ce type de travail, et l’équipe CODAIT est fière de contribuer à la mission d’ouverture d’IBM Research en publiant ces données de recherche de pointe sur le Data Asset eXchange.

 

Pourquoi le DAX ?

Bien qu’il y ait beaucoup de ressources en ligne pour trouver des jeux de données open source – des collections de liens sur GitHub aux sites tels que Kaggle Datasets – DAX est unique dans par son haut niveau de qualité et de conservation. DAX aide à créer des workflows de deep learning de bout en bout (de l’utilisation des données pour former des modèles au déploiement de modèles de manière standard), ce qui permet aux développeurs de consommer des données ouvertes en toute confiance sous des licences de données ouvertes clairement définies.

 

Les données dont vous avez besoin pour développer des solutions d’IA

IBM a conçu le référentiel Data Asset eXchange pour compléter le Model Asset eXchange. L’interface utilisateur pour organiser les ressources est cohérente sur les deux plates-formes et les utilisateurs peuvent facilement former les modèles sur MAX en utilisant les données de Data Asset eXchange.

L’objectif de l’équipe CODAIT est de simplifier l’utilisation des ressources DAX et MAX en conjonction avec les produits IBM IA ainsi qu’avec d’autres outils d’IA hybrides et multicloud, propriétaires et open source. Nous voulons donner aux datascientists et aux développeurs une point de départ bien cadré, afin qu’il leur soit plus facile de commencer à développer leurs solutions d’IA.

En savoir plus du DAX

 

Écrit par Vijay Bommireddipalli, Frederick Reiss, Gabriela de Queiroz, Nick Pentreath, le 16 juillet 2019

Traduit par Isabelle Ulrich

Version originale : https://developer.ibm.com/blogs/ibm-data-asset-exchange-dax-free-open-data-ai/

 

 

Developer Relations Marketing Leader IBM France

More Développeurs stories
21 juillet 2022

Quels critères pour une intelligence artificielle de confiance ?

L’intelligence artificielle est capable d’effectuer des traitements à large échelle, tout en s’affranchissant des biais cognitifs propres aux opérateurs humains. À condition toutefois qu’elle respecte certains principes de base qui vont en garantir l’éthique…  La Commission européenne travaille sur un cadre juridique autour de l’intelligence artificielle (IA). Un texte très attendu par les entreprises, qui […]

Continue reading

12 juillet 2022

Le spécialiste des logiciels libres STARTX adopte l’IBM Cloud Pak for Multi Cloud Management pour ses projets CloudForms

C’est tout naturellement que STARTX s’est rapproché d’IBM et a choisi IBM Cloud Pak for Multi Cloud Management, pour ses projets CloudForms. Une solution cohérente, solide et pérenne, qui permet d’accélérer et de sécuriser les projets de ses clients. Une adoption accompagnée par le distributeur Arrow ECS. Membre de La Home Sweet Company, STARTX est […]

Continue reading

12 juillet 2022

IENA accompagne un groupe immobilier d’envergure avec IBM Planning Analytics

Expert en pilotage de la performance et en solutions IBM, IENA a déployé son savoir-faire métier et technique afin d’implémenter une solution de simulation de la masse salariale au sein d’un grand groupe immobilier français présent sur tous les secteurs : particuliers, entreprises, institutionnels et collectivités. Un projet d’envergure, couronné de succès. IENA est un cabinet […]

Continue reading