Implementazione dei servizi di intelligenza artificiale con codice
È possibile creare un servizio di IA personalizzato che sia adatto alla vostra applicazione di IA generativa fin dalle fondamenta. Ad esempio, se si sta distribuendo una risorsa che utilizza la retrieval augmented generation (RAG), è possibile catturare la logica per il recupero delle risposte dai documenti di base nel servizio AI.
Metodi per la distribuzione di servizi di IA con codice
Per codificare e distribuire i servizi di intelligenza artificiale è possibile utilizzare i seguenti metodi:
Codifica e distribuzione manuale dei servizi di IA
È possibile creare un blocco note che contiene il servizio AI e le connessioni all'interno del progetto. Il servizio AI acquisisce la logica dell'applicazione RAG e contiene la funzione di generazione, che è un'unità di codice distribuibile. La funzione di generazione viene promossa nello spazio di distribuzione, che viene utilizzato per creare una distribuzione. La distribuzione è esposta come endpoint API REST a cui possono accedere altre applicazioni. È possibile inviare una richiesta all'endpoint dell'API REST per utilizzare il servizio AI distribuito per l'inferenza. Il servizio AI distribuito elabora la richiesta e restituisce una risposta.
Per ulteriori informazioni, vedere Codifica e distribuzione manuale dei servizi di intelligenza artificiale.
Codifica e distribuzione di servizi di IA con modelli
Puoi utilizzare modelli predefiniti per distribuire i tuoi servizi di intelligenza artificiale in watsonx.ai. I modelli di servizio AI forniscono una base predefinita per le applicazioni AI, consentendo agli sviluppatori di concentrarsi sulla logica di base della loro applicazione, invece di partire da zero. Fornendo una struttura predefinita, una configurazione e una serie di strumenti, i modelli di servizi di IA semplificano il processo di implementazione dei servizi di IA, riducono il rischio di errori e migliorano l'efficienza complessiva e la coerenza dello sviluppo e dell'implementazione dell'IA.
Per ulteriori informazioni, vedere Codifica e distribuzione di servizi di IA con modelli.
Scegliere il metodo giusto per la distribuzione
Esistono due approcci per implementare i servizi di IA: la codifica manuale e i modelli di sviluppo. Ogni approccio ha i suoi vantaggi e svantaggi. La scelta dell'approccio di distribuzione dipende dalle esigenze e dai requisiti specifici del progetto. I modelli di sviluppo sono adatti per implementazioni semplici con esigenze di personalizzazione limitate, mentre la codifica manuale è adatta per implementazioni complesse con elevate esigenze di personalizzazione.
La tabella seguente fornisce un riepilogo comparativo dei tre approcci per la distribuzione di servizi di IA con codice:
| Approccio | Facilità d'uso | Personalizzazione | Scalabilità | Tempo di commercializzazione |
|---|---|---|---|---|
| Codifica manuale | Difficile | Pieno | Alto | Lento |
| Modelli di sviluppo | Facile | Limitato | Limitato | Rapido |