Rischio di contaminazione dei dati per l'IA

Allineamento Icona che rappresenta i rischi di allineamento.
Accuratezza
Rischi dei dati di formazione
Amplificato dall'intelligenza artificiale generativa

Descrizione

La contaminazione dei dati si verifica quando per l'addestramento vengono utilizzati dati non corretti. Ad esempio, i dati che non sono in linea con lo scopo del modello o quelli che sono già stati accantonati per altre attività di sviluppo, come i test e le valutazioni.

Perché la contaminazione dei dati è un problema per i modelli di fondazione?

I dati che differiscono dai dati di addestramento previsti potrebbero alterare l'accuratezza del modello e influenzarne i risultati.

Argomento principale: Atlante del rischio di IA

Facciamo degli esempi che sono stati trattati dalla stampa per aiutare a spiegare molti dei rischi dei modelli di fondazione. Molti di questi eventi trattati dalla stampa sono ancora in evoluzione o sono stati risolti, e fare riferimento ad essi può aiutare il lettore a comprendere i rischi potenziali e a lavorare per mitigarli. L'evidenziazione di questi esempi è solo a scopo illustrativo.