Développeurs

IBM annonce Data Asset Exchange (DAX) pour aider les développeurs avec des jeux de données libres et open source pour l’IA

Share this post:

Comme de plus en plus d’entreprises adoptent l’intelligence artificielle (IA), il est impératif de mettre des modèles de machine learning (ML) entre les mains des développeurs. À cette fin, le Center for Open-Source Data & AI Technologies (CODAIT) a lancé IBM Model Asset eXchange (MAX) en 2018 pour aider les data scientists et les développeurs à découvrir facilement des modèles prêts à l’emploi et open source de machine learning et de deep learning.

À l’OSCON 2019 cet été, nous avons annoncé le lancement d’IBM Data Asset eXchange (DAX), une plate-forme en ligne permettant aux développeurs et aux data scientists de trouver des jeux de données libres et ouverts soigneusement conservés sous licences open sources. Les développeurs qui adoptent des modèles de ML ont besoin de données ouvertes qu’ils peuvent utiliser en toute confiance sous des licences clairement définies.

Dans la mesure du possible, les jeux de données disponibles sur DAX utiliseront le cadre de licences de données open source de la Community Data License Agreement (CDLA) de la Linux Foundation afin de permettre le partage des données et la collaboration. De plus, DAX fournit un accès unique à divers jeux de données d’IBM et IBM Research et IBM prévoit de les enrichir régulièrement. Les données sur DAX s’intégreront de manière appropriée aux services IBM Cloud et d’IA.

 

Une source fiable de jeux de données libres

Pour les développeurs, DAX fournit une source fiable pour des jeux de données ouvertes soigneusement conservés pour l’IA. Ces jeux sont prêts à être utilisés dans les applications d’IA d’entreprise, avec du contenu connexe tel que des tutoriels pour faciliter le démarrage.

Pour le personnel responsable de l’utilisation et de la vérification des jeux de données, DAX fournit la conservation ainsi que des formats de jeux de données et des métadonnées normalisés, contrairement à la plupart des autres ressources de données ouvertes qui ont tendance à intégrer moins de vérifications de la qualité et des conditions de licence. Ainsi, les ensembles de données DAX sont globalement plus faciles à adopter au sein des entreprises.

Exemple d’utilisation des jeux de données

Un exemple des types d’ensembles de données que nous publions est celui de la Finance Proposition Bank et de la Contracts Proposition Bank. Ces jeux de données font partie d’un programme de recherche actif d’IBM Research. Ce projet de recherche vise à améliorer les technologies de compréhension du langage naturel que sous-tendent les multiples offres de produits IBM, notamment Watson Natural Language Understanding et Watson Compare & Comply.

Nos chercheurs ont créé ces fichiers de données avec l’aide des développeurs de Watson, en faisant correspondre les caractéristiques du texte cible à celles des documents du monde réel que le système analyse en production. Les chercheurs ont utilisé ces jeux de données pour former des versions spécifiques à un domaine des analyseurs qui extraient la signification sémantique des documents commerciaux régissant l’entreprise tels que les accords juridiques et les rapports financiers.

IBM Research détient une expérience importante dans ce type de travail, et l’équipe CODAIT est fière de contribuer à la mission d’ouverture d’IBM Research en publiant ces données de recherche de pointe sur le Data Asset eXchange.

 

Pourquoi le DAX ?

Bien qu’il y ait beaucoup de ressources en ligne pour trouver des jeux de données open source – des collections de liens sur GitHub aux sites tels que Kaggle Datasets – DAX est unique dans par son haut niveau de qualité et de conservation. DAX aide à créer des workflows de deep learning de bout en bout (de l’utilisation des données pour former des modèles au déploiement de modèles de manière standard), ce qui permet aux développeurs de consommer des données ouvertes en toute confiance sous des licences de données ouvertes clairement définies.

 

Les données dont vous avez besoin pour développer des solutions d’IA

IBM a conçu le référentiel Data Asset eXchange pour compléter le Model Asset eXchange. L’interface utilisateur pour organiser les ressources est cohérente sur les deux plates-formes et les utilisateurs peuvent facilement former les modèles sur MAX en utilisant les données de Data Asset eXchange.

L’objectif de l’équipe CODAIT est de simplifier l’utilisation des ressources DAX et MAX en conjonction avec les produits IBM IA ainsi qu’avec d’autres outils d’IA hybrides et multicloud, propriétaires et open source. Nous voulons donner aux datascientists et aux développeurs une point de départ bien cadré, afin qu’il leur soit plus facile de commencer à développer leurs solutions d’IA.

En savoir plus du DAX

 

Écrit par Vijay Bommireddipalli, Frederick Reiss, Gabriela de Queiroz, Nick Pentreath, le 16 juillet 2019

Traduit par Isabelle Ulrich

Version originale : https://developer.ibm.com/blogs/ibm-data-asset-exchange-dax-free-open-data-ai/

 

 

Developer Relations Marketing Leader IBM France

More Développeurs stories
10 septembre 2019

Inauguration du nouveau site IBM et du Lab à Sophia-Antipolis

Inauguration IBM France a inauguré le nouveau site de son Lab à Sophia-Antipolis lundi 9 septembre . Une centaine d’invités ont participé à l’événement. Nicolas Sekkaki, président d’IBM France, aux côtés de Renaud Muselier, Président du Conseil régional de Provence-Alpes-Côte d’Azur, Charles-Ange Ginesy, Président du Conseil départemental des Alpes-Maritimes, Jean Leonetti, Président de la CASA […]

Continue reading

9 septembre 2019

Modernisez et conteneurisez vos applications avec IBM Cloud Pak for Applications

En tant que développeur, votre objectif est l’excellence de votre code et la résolution de problèmes métier. L’efficacité est un élément clé pour le développeur, mais être efficace au sein d’une équipe ne dépend pas seulement de ce que vous avez en tête. Vous avez également besoin d’outils et de technologies appropriés pour travailler rapidement et créer […]

Continue reading

9 septembre 2019

Utiliser les API Watson sur OpenShift

Avant de parler de l’utilisation des API Watson sur OpenShift, définissons rapidement ce qu’elles sont. Les API Watson sont un ensemble de services d’intelligence artificielle (IA) disponibles sur IBM Cloud dotés d’une API REST et de SDK (Software Develpment Kit) pour de nombreux langages actuels de programmation. Watson Assistant (development de chatbots) et Watson Discovery (utilisation intelligente de corpus de textes) font partie […]

Continue reading