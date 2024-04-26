Le imprese che operano in ambiti specializzati, come le telecomunicazioni, la sanità o le compagnie petrolifere e del gas, hanno un focus laser. Sebbene possano trarre beneficio dagli scenari di gen AI e dai casi d'uso, sarebbero meglio serviti da modelli più piccoli.

Nel caso delle telecomunicazioni, ad esempio, alcuni dei casi d'uso comuni sono assistenti AI nei contact center, offerte personalizzate nell'erogazione dei servizi e chatbot basati su AI per migliorare l'esperienza del cliente. I casi d'uso che aiutano le aziende di telecomunicazioni a migliorare le prestazioni della loro rete, aumentare l'efficienza spettrale nelle reti 5G o determinare specifici colli di bottiglia nella rete sono meglio serviti dai dati aziendali stessi (a differenza di un LLM pubblico).

Questo ci porta all'idea che più piccolo è meglio. Esistono ora i modelli linguistici di piccole dimensioni (SLM), più piccoli rispetto agli LLM. Gli SLM vengono addestrati su decine di miliardi di parametri, mentre gli LLM sono addestrati su centinaia di miliardi di parametri. Ancora più importante, gli SLM vengono addestrati su dati relativi a un dominio specifico. Potrebbero non avere informazioni contestuali generali, ma funzionano molto bene nel dominio scelto.

Grazie alle loro dimensioni più ridotte, questi modelli possono essere ospitati nel data center di un'azienda invece che nel cloud. Gli SLM potrebbero persino funzionare su un singolo chip GPU su larga scala, risparmiando migliaia di dollari in costi di elaborazione annuali. Tuttavia, la distinzione tra ciò che può essere eseguito solo in cloud o in un data center aziendale diventa meno chiara con i progressi nella progettazione dei chip.

Che sia per motivi di costo, privacy dei dati o sovranità dei dati, le aziende potrebbero voler installare questi SLM nei propri data center. La maggior parte delle aziende non ama inviare i propri dati al cloud. Un altro motivo fondamentale è la prestazione. La gen AI all'edge esegue il calcolo e l'inferenza il più vicino possibile ai dati, rendendoli più veloci e sicuri rispetto a un provider di cloud.

Vale la pena notare che gli SLM richiedono meno potenza e sono ideali per l'implementazione in ambienti a risorse limitate e persino su dispositivi mobile.

Un esempio on-premise potrebbe essere una location IBM® Cloud Satellite, che ha una connessione sicura ad alta velocità con IBM® Cloud che ospita gli LLM. Le compagnie di telecomunicazioni potrebbero ospitare questi SLM nelle loro stazioni base e offrire questa opzione anche ai loro clienti. Tutto si tratta di ottimizzare l'uso delle GPU, poiché la distanza che i dati devono percorrere si riduce, con conseguente aumento della larghezza di banda.