Développeurs

IBM annonce Data Asset Exchange (DAX) pour aider les développeurs avec des jeux de données libres et open source pour l’IA

Share this post:

Comme de plus en plus d’entreprises adoptent l’intelligence artificielle (IA), il est impératif de mettre des modèles de machine learning (ML) entre les mains des développeurs. À cette fin, le Center for Open-Source Data & AI Technologies (CODAIT) a lancé IBM Model Asset eXchange (MAX) en 2018 pour aider les data scientists et les développeurs à découvrir facilement des modèles prêts à l’emploi et open source de machine learning et de deep learning.

À l’OSCON 2019 cet été, nous avons annoncé le lancement d’IBM Data Asset eXchange (DAX), une plate-forme en ligne permettant aux développeurs et aux data scientists de trouver des jeux de données libres et ouverts soigneusement conservés sous licences open sources. Les développeurs qui adoptent des modèles de ML ont besoin de données ouvertes qu’ils peuvent utiliser en toute confiance sous des licences clairement définies.

Dans la mesure du possible, les jeux de données disponibles sur DAX utiliseront le cadre de licences de données open source de la Community Data License Agreement (CDLA) de la Linux Foundation afin de permettre le partage des données et la collaboration. De plus, DAX fournit un accès unique à divers jeux de données d’IBM et IBM Research et IBM prévoit de les enrichir régulièrement. Les données sur DAX s’intégreront de manière appropriée aux services IBM Cloud et d’IA.

 

Une source fiable de jeux de données libres

Pour les développeurs, DAX fournit une source fiable pour des jeux de données ouvertes soigneusement conservés pour l’IA. Ces jeux sont prêts à être utilisés dans les applications d’IA d’entreprise, avec du contenu connexe tel que des tutoriels pour faciliter le démarrage.

Pour le personnel responsable de l’utilisation et de la vérification des jeux de données, DAX fournit la conservation ainsi que des formats de jeux de données et des métadonnées normalisés, contrairement à la plupart des autres ressources de données ouvertes qui ont tendance à intégrer moins de vérifications de la qualité et des conditions de licence. Ainsi, les ensembles de données DAX sont globalement plus faciles à adopter au sein des entreprises.

Exemple d’utilisation des jeux de données

Un exemple des types d’ensembles de données que nous publions est celui de la Finance Proposition Bank et de la Contracts Proposition Bank. Ces jeux de données font partie d’un programme de recherche actif d’IBM Research. Ce projet de recherche vise à améliorer les technologies de compréhension du langage naturel que sous-tendent les multiples offres de produits IBM, notamment Watson Natural Language Understanding et Watson Compare & Comply.

Nos chercheurs ont créé ces fichiers de données avec l’aide des développeurs de Watson, en faisant correspondre les caractéristiques du texte cible à celles des documents du monde réel que le système analyse en production. Les chercheurs ont utilisé ces jeux de données pour former des versions spécifiques à un domaine des analyseurs qui extraient la signification sémantique des documents commerciaux régissant l’entreprise tels que les accords juridiques et les rapports financiers.

IBM Research détient une expérience importante dans ce type de travail, et l’équipe CODAIT est fière de contribuer à la mission d’ouverture d’IBM Research en publiant ces données de recherche de pointe sur le Data Asset eXchange.

 

Pourquoi le DAX ?

Bien qu’il y ait beaucoup de ressources en ligne pour trouver des jeux de données open source – des collections de liens sur GitHub aux sites tels que Kaggle Datasets – DAX est unique dans par son haut niveau de qualité et de conservation. DAX aide à créer des workflows de deep learning de bout en bout (de l’utilisation des données pour former des modèles au déploiement de modèles de manière standard), ce qui permet aux développeurs de consommer des données ouvertes en toute confiance sous des licences de données ouvertes clairement définies.

 

Les données dont vous avez besoin pour développer des solutions d’IA

IBM a conçu le référentiel Data Asset eXchange pour compléter le Model Asset eXchange. L’interface utilisateur pour organiser les ressources est cohérente sur les deux plates-formes et les utilisateurs peuvent facilement former les modèles sur MAX en utilisant les données de Data Asset eXchange.

L’objectif de l’équipe CODAIT est de simplifier l’utilisation des ressources DAX et MAX en conjonction avec les produits IBM IA ainsi qu’avec d’autres outils d’IA hybrides et multicloud, propriétaires et open source. Nous voulons donner aux datascientists et aux développeurs une point de départ bien cadré, afin qu’il leur soit plus facile de commencer à développer leurs solutions d’IA.

En savoir plus du DAX

 

Écrit par Vijay Bommireddipalli, Frederick Reiss, Gabriela de Queiroz, Nick Pentreath, le 16 juillet 2019

Traduit par Isabelle Ulrich

Version originale : https://developer.ibm.com/blogs/ibm-data-asset-exchange-dax-free-open-data-ai/

 

 

Developer Relations Marketing Leader IBM France

More Développeurs stories
23 juillet 2020

Christophe Colomb, le réchauffement climatique et l’optimisation mathématique

Organisation, processus, delivery… Pour l’entreprise, la quête de l’optimal a parfois des allures de quête du Graal. Comment optimiser en évitant les conséquences négatives ? La data et les algorithmes offrent une solution intéressante. 1492, Christophe Colomb cherche un chemin plus court entre l’Espagne et l’Asie afin d’optimiser l’accès à une ressource chère, les épices. […]

Continue reading

22 juillet 2020

IBM peut-il être un acteur de la souveraineté numérique française ?

  La crise du Covid a démontré la fragilité de nos économies modernes, dépossédée au fil des années du contrôle de leurs moyens de productions critiques et le retour à une économie souveraine, solidaire et écologique est nécessaire. Souveraine signifie indépendante et maitresse de ses moyens, notamment de ses données, véritable « carburant » de l’économie. Comment […]

Continue reading

21 juillet 2020

Comment l’IA améliore et rend plus « intelligente » la relation client ?

La crise du Covid-19 a eu un impact sanitaire et économique sans précédent. Face à une activité encore très volatile et à une reprise économique qui se fait attendre, les nouvelles technologies et en particulier l’IA offrent des solutions et des leviers d’accélération. Dans ce contexte, comment utiliser au mieux les capacités de l’IA pour […]

Continue reading