Hugging Face è un'azienda che mantiene un'enorme comunità open source omonima che crea strumenti, modelli di machine learning e piattaforme per lavorare con l'intelligenza artificiale, con particolare attenzione alla data science, al machine learning e all'elaborazione del linguaggio naturale (NLP). Hugging Face è nota per la sua libreria di trasformatori NLP e per una piattaforma che consente agli utenti di condividere modelli e set di dati.
Hugging Face ha creato una delle comunità di AI più vivaci al mondo, con utenti che contribuiscono ogni giorno con nuovi modelli AI, set di dati, tutorial e ricerche. Offrono un'API ricca che consente agli sviluppatori di integrare i modelli direttamente nelle applicazioni, e la loro piattaforma supporta un'ampia gamma di attività in molti casi d'uso e settori. Ecco alcuni dei principali vantaggi della piattaforma:
Accesso agli ultimi modelli
Workflow semplificati
Implementazione e scalabilità semplici
Una comunità fiorente
Concentrati su un'AI responsabile
Hugging Face fornisce l'accesso tramite il suo Model Hub a migliaia di modelli preformati per attività come riconoscimento vocale, classificazione e generazione di testo, riepilogo del testo, risposta alle domande, generazione di immagini e altro ancora. Il Model Hub funge da marketplace in cui gli utenti possono trovare facilmente i modelli e scaricarli e mettere a punto in poche righe di codice, facendo risparmiare tempo e risorse a sviluppatori e ricercatori rispetto all'addestramento da zero.
Le librerie Hugging Face sono note per essere facili da usare e ben documentate. I principianti possono mettere a punto rapidamente modelli potenti ed eseguire attività complesse come formazione distribuita, tokenizzazione, valutazione e implementazione utilizzando gli strumenti Hugging Face. L'accesso ai fondamenti e agli strumenti avanzati ha aperto lo sviluppo dell'AI a una comunità di professionisti molto più ampia.
Oltre alla formazione, Hugging Face semplifica l'implementazione dei modelli in produzione. Gli strumenti Hugging Face consentono agli utenti di fornire modelli sul web, sulle app mobili o sui sistemi interni senza bisogno di un background infrastrutturale approfondito. Questo supporto full-stack rende la piattaforma particolarmente attraente per le startup e le imprese.
Oltre a tutta la tecnologia facilmente accessibile, la vivace community di Hugging Face l'ha resa una destinazione per sviluppatori, data scientist e ricercatori. È un luogo in cui gli sviluppatori meno esperti possono imparare da professionisti e porre domande a persone che potrebbero aver già affrontato sfide simili.
Molti modelli Hugging Face sono dotati di documentazione sui loro limiti, pregiudizi e casi d'uso previsti. L'azienda investe molto nell'open governance e nelle discussioni guidate dalla comunità sull'etica dell'AI.
Prima di Hugging Face, i modelli più potenti erano spesso difficili da utilizzare perché richiedevano competenze specialistiche e ingenti risorse di elaborazione. L'open source degli strumenti ha contribuito a rendere questi modelli più facili da usare, con tutto il codice e la documentazione richiesti. Ciò ha permesso a ricercatori, studenti e startup di sperimentare e costruire, accelerando enormemente l'innovazione a livello globale. Dopo Hugging Face, gli sviluppatori hanno potuto condividere facilmente le conoscenze e beneficio dagli sforzi reciproci, consentendo loro di creare insieme modelli migliori.
Questa enfasi sull'open source ha anche incoraggiato le aziende più grandi a condividere il proprio lavoro, consentendo all'intero ecosistema a trarre beneficio. Microsoft ha integrato i modelli Hugging Face nei propri servizi Azure, fornendo ai clienti aziendali l'accesso diretto a strumenti di intelligenza artificiale all'avanguardia. Allo stesso modo, NVIDIA ha collaborato con Hugging Face per ottimizzare l'addestramento e l'inferenza dei modelli per le GPU, aiutando a scalare i workflow di deep learning su enormi set di dati.
Hugging Face è stata fondata dagli imprenditori francesi Clément Delangue, Julien Chaumond e Thomas Wolf a New York City nel 2016.1 Gli imprenditori erano inizialmente interessati a creare chatbot per adolescenti, ma riconoscendo la potenza dei modelli alla base della tecnologia dei chatbot, si sono orientati verso di essi.
Insieme, hanno reso open source i loro strumenti interni e hanno lanciato la prima versione della Hugging Face Transformers Library, che è diventata rapidamente popolare tra ricercatori e ingegneri. Hugging Face è diventata una fonte definitiva di modelli di trasformatori preaddestrati e nel 2020 l'azienda ha introdotto Hugging Face Hub, il suo archivio di modelli, che ha consentito agli utenti di caricare, scaricare e condividere facilmente i modelli. L'anno successivo, hanno lanciato la loro libreria Datasets, che ha semplificato la condivisione dei set di dati, e Hugging Face Spaces per l'implementazione di demo di AI interattive. Nel 2022, la società ha acquisito Gradio, una libreria open source di AI per lo sviluppo di applicazioni di machine learning in Python.2
Hugging Face ha rilasciato strumenti per modelli multimodali, modelli linguistici di grandi dimensioni (LLM), modelli di diffusione e apprendimento per rinforzo. Nel 2023, Hugging Face ha iniziato a collaborare con IBM su watsonx.ai, lo studio di AI di IBM che consente agli utenti di addestrare, convalidare, adattare e distribuire sia il machine learning tradizionale che le nuove funzionalità di AI generativa. Nello stesso anno, IBM ha partecipato a un round di finanziamento di Series D per Hugging Face.
Ecco i principali servizi di Hugging Face:
Hugging Face Hub è una piattaforma centrale basata sul web in cui gli utenti possono condividere, scoprire e collaborare su modelli, set di dati e applicazioni. Funziona come un "GitHub per l'AI", ospitando migliaia di risorse disponibili al pubblico. Le pagine dei modelli e dei set di dati includono documentazione, esempi, monitoraggio delle versioni e demo live in molti casi. L'hub supporta anche repository privati per team e aziende per una collaborazione sicura.
La libreria di trasformatori è uno degli strumenti più utilizzati per i modelli di NLP, computer vision e deep learning . È una libreria Python che gli utenti installano sui propri computer o server che fornisce codice per utilizzare i modelli che trovano sull'Hub. Include architetture di modelli, strumenti di pre-elaborazione, utilità di formazione e altro ancora. Basata su framework popolari come PyTorch e TensorFlow, la libreria di trasformatori consente agli utenti di caricare potenti modelli di ML come BERT, GPT e altri con poche righe di codice. Offre anche strumenti completi per la messa a punto di modelli open source su set di dati personalizzati, rendendoli più utili per la ricerca e la produzione.
Oltre ai trasformatori e all'Hub, l'ecosistema Hugging Face contiene librerie per altre attività, come l'elaborazione dei set di dati ("Datasets"), la valutazione dei modelli ("Evaluate") e le demo di machine learning ("Gradio").
Hugging Face wants to become your artificial BFF, TechCrunch, marzo 2017
Gradio is joining Hugging Face!, Hugging Face, dicembre 2021