Développeurs

IBM annonce Data Asset Exchange (DAX) pour aider les développeurs avec des jeux de données libres et open source pour l’IA

Share this post:

Comme de plus en plus d’entreprises adoptent l’intelligence artificielle (IA), il est impératif de mettre des modèles de machine learning (ML) entre les mains des développeurs. À cette fin, le Center for Open-Source Data & AI Technologies (CODAIT) a lancé IBM Model Asset eXchange (MAX) en 2018 pour aider les data scientists et les développeurs à découvrir facilement des modèles prêts à l’emploi et open source de machine learning et de deep learning.

À l’OSCON 2019 cet été, nous avons annoncé le lancement d’IBM Data Asset eXchange (DAX), une plate-forme en ligne permettant aux développeurs et aux data scientists de trouver des jeux de données libres et ouverts soigneusement conservés sous licences open sources. Les développeurs qui adoptent des modèles de ML ont besoin de données ouvertes qu’ils peuvent utiliser en toute confiance sous des licences clairement définies.

Dans la mesure du possible, les jeux de données disponibles sur DAX utiliseront le cadre de licences de données open source de la Community Data License Agreement (CDLA) de la Linux Foundation afin de permettre le partage des données et la collaboration. De plus, DAX fournit un accès unique à divers jeux de données d’IBM et IBM Research et IBM prévoit de les enrichir régulièrement. Les données sur DAX s’intégreront de manière appropriée aux services IBM Cloud et d’IA.

 

Une source fiable de jeux de données libres

Pour les développeurs, DAX fournit une source fiable pour des jeux de données ouvertes soigneusement conservés pour l’IA. Ces jeux sont prêts à être utilisés dans les applications d’IA d’entreprise, avec du contenu connexe tel que des tutoriels pour faciliter le démarrage.

Pour le personnel responsable de l’utilisation et de la vérification des jeux de données, DAX fournit la conservation ainsi que des formats de jeux de données et des métadonnées normalisés, contrairement à la plupart des autres ressources de données ouvertes qui ont tendance à intégrer moins de vérifications de la qualité et des conditions de licence. Ainsi, les ensembles de données DAX sont globalement plus faciles à adopter au sein des entreprises.

Exemple d’utilisation des jeux de données

Un exemple des types d’ensembles de données que nous publions est celui de la Finance Proposition Bank et de la Contracts Proposition Bank. Ces jeux de données font partie d’un programme de recherche actif d’IBM Research. Ce projet de recherche vise à améliorer les technologies de compréhension du langage naturel que sous-tendent les multiples offres de produits IBM, notamment Watson Natural Language Understanding et Watson Compare & Comply.

Nos chercheurs ont créé ces fichiers de données avec l’aide des développeurs de Watson, en faisant correspondre les caractéristiques du texte cible à celles des documents du monde réel que le système analyse en production. Les chercheurs ont utilisé ces jeux de données pour former des versions spécifiques à un domaine des analyseurs qui extraient la signification sémantique des documents commerciaux régissant l’entreprise tels que les accords juridiques et les rapports financiers.

IBM Research détient une expérience importante dans ce type de travail, et l’équipe CODAIT est fière de contribuer à la mission d’ouverture d’IBM Research en publiant ces données de recherche de pointe sur le Data Asset eXchange.

 

Pourquoi le DAX ?

Bien qu’il y ait beaucoup de ressources en ligne pour trouver des jeux de données open source – des collections de liens sur GitHub aux sites tels que Kaggle Datasets – DAX est unique dans par son haut niveau de qualité et de conservation. DAX aide à créer des workflows de deep learning de bout en bout (de l’utilisation des données pour former des modèles au déploiement de modèles de manière standard), ce qui permet aux développeurs de consommer des données ouvertes en toute confiance sous des licences de données ouvertes clairement définies.

 

Les données dont vous avez besoin pour développer des solutions d’IA

IBM a conçu le référentiel Data Asset eXchange pour compléter le Model Asset eXchange. L’interface utilisateur pour organiser les ressources est cohérente sur les deux plates-formes et les utilisateurs peuvent facilement former les modèles sur MAX en utilisant les données de Data Asset eXchange.

L’objectif de l’équipe CODAIT est de simplifier l’utilisation des ressources DAX et MAX en conjonction avec les produits IBM IA ainsi qu’avec d’autres outils d’IA hybrides et multicloud, propriétaires et open source. Nous voulons donner aux datascientists et aux développeurs une point de départ bien cadré, afin qu’il leur soit plus facile de commencer à développer leurs solutions d’IA.

En savoir plus du DAX

 

Écrit par Vijay Bommireddipalli, Frederick Reiss, Gabriela de Queiroz, Nick Pentreath, le 16 juillet 2019

Traduit par Isabelle Ulrich

Version originale : https://developer.ibm.com/blogs/ibm-data-asset-exchange-dax-free-open-data-ai/

 

 

Developer Relations Marketing Leader IBM France

More Développeurs stories
8 octobre 2021

DecisionBrain optimise le taux de remplissage des crèches

Grâce à l’expertise de DecisionBrain, il a été possible de créer une solution simplifiant l’attribution de places de crèches en fonction des demandes des familles et des disponibilités de chaque site. Cette solution facilite le remplissage d’un réseau comprenant plus de 2 100 crèches et accueillant plus de 50 000 familles. Expert reconnu dans son […]

Continue reading

1 octobre 2021

La (r)évolution des actifs numériques : des « chemins de fer » aux « voitures volantes »

Marchés financiers et transport ferroviaire : comprendre l’analogie Les marchés financiers facilitent l’échange de valeurs entre différentes contreparties, c’est-à-dire des acheteurs et des vendeurs. La valeur peut être transmise par de nombreux instruments et peut prendre différentes formes, comme des espèces ou des titres financiers. En regardant de plus près, toutes les opérations reposent sur […]

Continue reading

27 septembre 2021

Banques : comment les DSI aident l’innovation business à aller plus vite ?

Une conjonction de méthodes, technologies et modes de travail nouveaux crée un véritable élan pour l’innovation bancaire. Vincent Daerden, responsable des activités de conseil et de services pour le secteur banque et finance pour IBM France, analyse le contexte actuel qui préside à la transformation des banques françaises. Il estime que nous ne sommes qu’au […]

Continue reading