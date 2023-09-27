I modelli linguistici di grandi dimensioni (LLM) sono foundation model che utilizzano AI, deep learning ed enormi set di dati, tra cui siti web, articoli e libri, per generare testo, tradurre tra lingue e scrivere molti tipi di contenuti. Esistono due tipi di questi modelli di AI generativa: i modelli proprietari per grandi linguaggi e quelli open source per linguaggi di grandi dimensioni.
In questo video, Martin Keen spiega brevemente i modelli linguistici di grandi dimensioni, come si relazionano ai foundation model, come funzionano e come possono essere utilizzati per risolvere vari problemi aziendali.
Gli LLM proprietari sono di proprietà di un'azienda e possono essere utilizzati solo dai clienti che acquistano una licenza. La licenza può limitare il modo in cui l'LLM può essere utilizzato. Gli LLM open source, invece, sono gratuiti e disponibili per chiunque possa accedervi, utilizzarli per qualsiasi scopo, modificarli e distribuirli.
Il termine "open source" si riferisce al codice LLM e all'architettura sottostante accessibili al pubblico, il che significa che sviluppatori e ricercatori sono liberi di usare, migliorare o modificare in altro modo il modello.
Un tempo sembrava che l'ideale fosse avere un LLM il più grande possibile, ma ora le aziende si stanno rendendo conto che possono essere esageratamente costosi in termini di ricerca e innovazione. In risposta, un ecosistema di modello open source ha iniziato a mostrarsi promettente e a mettere in discussione il modello di business LLM.
Le aziende che non dispongono di talenti interni per il machine learning possono utilizzare LLM open source che offrono trasparenza e flessibilità, all'interno della propria infrastruttura, sia nel cloud che on-premise. Ciò dà loro il pieno controllo dei propri dati e significa che le informazioni sensibili rimangono all'interno della loro rete. Tutto ciò riduce il rischio di fuga di dati o di accesso non autorizzati.
Un LLM open source offre trasparenza su come funziona, sulla sua architettura, sui dati e le metodologie di formazione e su come si usa. Essere in grado di ispezionare il codice e avere visibilità sugli algoritmi consente di aumentare la fiducia di un'azienda, agevola gli audit e aiuta a garantire la conformità etica e legale. Inoltre, l'ottimizzazione efficiente di un LLM open source può ridurre la latenza e aumentare le prestazioni.
In genere sono molto meno costosi nel lungo termine rispetto agli LLM proprietari perché non prevedono costi di licenza. Tuttavia, il costo di gestione di un LLM include i costi dell'infrastruttura on-premise o cloud e in genere comportano un costo iniziale di implementazione significativo.
Gli LLM pre-addestrati e open source consentono una messa a punto precisa. Le aziende possono aggiungere all'LLM caratteristiche utili per il loro uso specifico, e gli LLM possono anche essere addestrati su set di dati specifici. Apportare queste modifiche o specifiche su un LLM proprietario comporta la collaborazione con un fornitore e costa tempo e denaro.
Mentre gli LLM proprietari implicano che un'azienda deve fare affidamento su un unico fornitore, uno open source consente all'azienda di utilizzare al meglio i contributi della comunità, diversi fornitori di servizi e possibilmente team interni per gestire aggiornamenti, sviluppo, manutenzione e supporto. L'open source consente alle aziende di sperimentare e utilizzare i contributi di persone con prospettive diverse, portando a soluzioni che consentano alle aziende di rimanere all'avanguardia della tecnologia. Inoltre, offre alle aziende che utilizzano LLM open source un maggiore controllo sulla propria tecnologia e sulle decisioni relative al modo in cui la utilizzano.
Le organizzazioni possono utilizzare modelli LLM open source per creare praticamente qualsiasi progetto utile ai propri dipendenti o (quando la licenza open source lo consente) che può essere offerto come prodotto commerciale, tra cui:
I modelli LLM open source consentono di creare un'app con capacità di generazione linguistica, come scrivere e-mail, post sul blog o storie creative. Un LLM come Falcon-40B, offerto con una licenza Apache 2.0, può rispondere a un prompt con suggerimenti di testo di alta qualità che può poi perfezionare e perfezionare.
Gli LLM open source formati sul codice e sui linguaggi di programmazione esistenti possono aiutare gli sviluppatori a creare applicazioni e trovare errori e guasti legati alla sicurezza.
Gli LLM open source ti consentono di creare applicazioni che offrono esperienze di apprendimento personalizzate, che possono essere personalizzate e adattate a particolari stili di apprendimento.
Uno strumento LLM open source che riassume articoli lunghi, notizie, report di ricerca e altro può facilitare l'estrazione dei dati chiave.
Sono in grado di comprendere e rispondere alle domande, offrire suggerimenti e avviare conversazioni in linguaggio naturale.
Gli LLM open source che si addestrano su set di dati multilingue possono fornire traduzioni accurate e fluenti in molte lingue.
Gli LLM possono analizzare il testo per determinare il tono emotivo o sentimentale, utile nella gestione della reputazione del marchio e nell'analisi del feedback dei clienti.
Gli LLM possono essere utili per identificare e filtrare contenuti online inappropriati o dannosi, il che è di grande aiuto per mantenere un ambiente online più sicuro.
Un'ampia gamma di tipi di organizzazione utilizza LLM open source. Ad esempio, IBM e NASA hanno sviluppato un LLM open source formato sui dati geospaziali per aiutare gli scienziati e le loro organizzazioni a combattere il cambiamento climatico.
Editori e giornalisti utilizzano internamente gli LLM open source per analizzare, identificare e riassumere le informazioni senza condividere dati proprietari al di fuori della redazione.
Alcune organizzazioni di sanitarie utilizzano gli LLM open source per i software sanitari, inclusi strumenti di diagnosi, ottimizzazioni del trattamento e strumenti per la gestione delle informazioni sui pazienti, la salute pubblica e altro ancora.
L'LLM open source FinGPT è stato sviluppato appositamente per il settore finanziario.
L'Open LLM Leaderboard mira a tracciare, classificare e valutare LLM e chatbot open source su diversi benchmark.
Sebbene gli output del LLM sembrino fluenti e autorevoli, ci possono essere dei rischi che includono l'offerta di informazioni basate su "allucinazioni" e problemi di bias, consenso o sicurezza. La formazione su questi rischi è una risposta a questi problemi di dati e AI.
I modelli di AI, e in particolare gli LLM, saranno una delle tecnologie più trasformative del prossimo decennio. Poiché le nuove normative impongono linee guida sull'uso dell'AI, è fondamentale non solo gestire e governare i modelli AI ma anche governare i dati inseriti nell'AI.
