Hugging Face est une entreprise qui gère une vaste communauté open source du même nom qui crée des outils, des modèles de machine learning et des plateformes pour travailler avec l’intelligence artificielle, en mettant l’accent sur la science des données, le machine learning et le traitement automatique du langage naturel (NLP). Hugging Face se distingue par sa bibliothèque de transformateurs NLP et sa plateforme qui permet aux utilisateurs de partager des modèles et des jeux de données.
Hugging Face a développé l'une des communautés d'IA les plus dynamiques au monde, les utilisateurs contribuant chaque jour à l'élaboration de nouveaux modèles IA, de jeu de données, de tutoriels et de recherche. Ils offrent une API riche qui permet aux développeurs d'intégrer directement des modèles dans des applications, et leur plateforme prend en charge un large éventail de tâches dans de nombreux cas d'utilisation et secteurs d'activité. Voici quelques-uns des principaux avantages de la plateforme :
Accès aux derniers modèles
Workflows simplifiés
Déploiement et mise à l’échelle simples
Communauté florissante
Focus sur l’IA responsable
Hugging Face offre, via son Model Hub, l'accès à des milliers de modèles pré-entraînés pour des tâches telles que la reconnaissance vocale, la classification de texte, la génération de texte, le résumé de texte, la réponse à des questions, la génération d'images, et bien d'autres encore. Le Model Hub fonctionne comme une place de marché où les utilisateurs peuvent facilement trouver des modèles, les télécharger et les ajuster en quelques lignes de code seulement, ce qui permet aux développeurs et aux chercheurs de gagner du temps et d'économiser des ressources par rapport à un entraînement à partir de zéro.
Les bibliothèques Hugging Face sont réputées pour être conviviales et bien documentées. Les débutants peuvent rapidement affiner des modèles puissants et effectuer des tâches complexes telles que la formation distribuée, la tokenisation, l'évaluation et le déploiement à l'aide des outils Hugging Face. L'accès à des outils fondamentaux et avancés a ouvert le développement de l'IA à une communauté beaucoup plus large de praticiens.
Au-delà de l'entraînement, Hugging Face facilite le déploiement des modèles en production. Les outils Hugging Face permettent aux utilisateurs de mettre des modèles à disposition sur le Web, dans des applications mobiles ou dans des systèmes internes sans avoir besoin de connaissances approfondies en matière d'infrastructure. Cette prise en charge de la pile complète rend la plateforme particulièrement attrayante pour les start-ups et les entreprises.
En plus de toutes les technologies facilement accessibles, la communauté dynamique de Hugging Face en a fait une destination phare pour les développeurs, les data scientists et les chercheurs. C’est un endroit pour les développeurs inexpérimentés pour apprendre auprès de praticiens chevronnés et poser des questions à des personnes qui ont peut-être déjà rencontré des difficultés similaires.
De nombreux modèles Hugging Face sont accompagnés de documentation sur leurs limites, leurs biais et leurs cas d’utilisation prévus. L’entreprise investit massivement dans une gouvernance ouverte et des discussions communautaires sur l’éthique de l’IA.
Avant Hugging Face, les modèles les plus puissants étaient souvent difficiles à utiliser car ils nécessitaient une expertise spécialisée et d’énormes ressources informatiques. L’open source a permis de rendre ces modèles plus faciles à utiliser, avec tout le code et la documentation nécessaires. Cela a permis aux chercheurs, aux étudiants et aux startups d'expérimenter et de créer, ce qui a considérablement accéléré l'innovation au niveau mondial. Après Hugging Face, les développeurs ont pu partager facilement leurs connaissances et tirer avantage des efforts de chacun, ce qui leur a permis de créer ensemble de meilleurs modèles.
Cette importance accordée à l'open source a également encouragé les grandes entreprises à partager leur travail, ce qui a profité à l'ensemble de l'écosystème. Microsoft a intégré les modèles Hugging Face dans ses services Azure, offrant ainsi aux entreprises un accès direct aux outils d'IA de pointe. De même, NVIDIA a collaboré avec Hugging Face afin d'optimiser l'entraînement et l'inférence des modèles pour les GPUs, afin de permettre d'adapter les workflows d'apprentissage profond à de grands ensembles de données.
Hugging Face a été fondé par les entrepreneurs français Clément Delangue, Julien Chaumond, et Thomas Wolf à New York en 2016.1 Les entrepreneurs étaient initialement intéressés par la création de chatbots pour les adolescents, mais reconnaissant le pouvoir des modèles qui sous-tendent la technologie des chatbots, ils se sont tournés vers les modèles eux-mêmes.
Ils ont mis leurs outils internes en open source et ont lancé la première version de la bibliothèque Hugging Face Transformers, qui a rapidement rencontré un grand succès auprès des chercheurs et des ingénieurs. Hugging Face est devenu la source incontournable de modèles de transformateurs pré-entraînés et, en 2020, l'entreprise a lancé le Hugging Face Hub, son référentiel de modèles, qui permettait aux utilisateurs de charger, de télécharger et de partager facilement des modèles. L'année suivante, ils ont lancé leur bibliothèque de jeux de données, qui a facilité le partage des jeux de données, et Hugging Face Spaces pour déployer des démos interactives de l'IA. En 2022, la société a acquis Gradio, une bibliothèque d’IA open source permettant de développer des applications de machine learning dans Python.2
Hugging Face a publié des outils pour les modèles multimodaux, les grands modèles de langage (LLM), les modèles de diffusion et l’apprentissage par renforcement. En 2023, Hugging Face a commencé à collaborer avec IBM sur watsonx.ai, le studio d’IA d’IBM qui permet aux utilisateurs d’entraîner, de valider, de régler et de déployer à la fois les capacités traditionnelles de ML et les nouvelles capacités d’IA générative. Plus tard dans l’année, IBM a participé à un cycle de financement de série D pour Hugging Face.
Voici les principaux services de Hugging Face :
Hugging Face Hub est une plateforme Web centrale où les utilisateurs peuvent partager, découvrir et collaborer sur des modèles, des jeux de données et des applications. Il fonctionne comme un « GitHub pour l'IA », hébergeant des milliers de ressources accessibles au public. Les pages consacrées aux modèles et aux jeux de données comprennent souvent de la documentation, des exemples, le suivi des versions et des démonstrations en direct. Le hub prend également en charge les référentiels privés des équipes et des entreprises pour une collaboration sécurisée.
La bibliothèque Transformers est l’un des outils les plus utilisés pour le NLP, la vision par ordinateur et les modèles d’apprentissage profond. Il s'agit d'une bibliothèque Python que les utilisateurs installent sur leurs ordinateurs ou leurs serveurs et qui fournit du code leur permettant d'utiliser les modèles qu'ils trouvent sur le Hub. Elle comprend des architectures de modèles, des outils de prétraitement, des fonctionnalités d'entraînement et plus encore. Construite sur des cadres des exigences populaires comme PyTorch et TensorFlow, la bibliothèque Transformers permet aux utilisateurs de charger de puissants modèles ML comme BERT, GPT et d’autres avec seulement quelques lignes de code. Elle offre également des outils complets pour affiner les modèles open source sur des jeux de données personnalisés, ce qui les rend plus utiles pour la recherche et la production.
Outre Transformers et The Hub, l'écosystème Hugging Face comprend des bibliothèques pour d'autres tâches, telles que le traitement des jeux de données (« Datasets »), l'évaluation des modèles (« Evaluate ») et les démonstrations de machine learning (« Gradio »).
Hugging Face wants to become your artificial BFF, TechCrunch, mars 2017
Gradio is joining Hugging Face!, Hugging Face, décembre 2021