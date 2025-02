IBM si impegna a sviluppare e a implementare l'AI in modo responsabile. E questo impegno si estende ai dati che utilizziamo per costruire e addestrare i nostri sistemi di AI. In qualità di "Client Zero" volevamo valutare gli standard di provenienza dei dati in un ambiente rigoroso per comprenderne veramente l'impatto e metterli alla prova in modo significativo. Per questo motivo abbiamo implementato elementi chiave all'interno del nostro Integrated Governance Program (IGP) che governa i dati e i modelli sviluppati e utilizzati da IBM, a partire da una valutazione della completezza degli standard. A tal fine, abbiamo confrontato gli standard di provenienza dei dati con i nostri requisiti di assunzione dei dati per i set di dati utilizzati per sviluppare foundation model e abbiamo valutato il grado in cui la tassonomia dei metadati degli standard di provenienza dei dati ci ha consentito di convalidare l'idoneità dei dati per una varietà di casi d'uso.

Successivamente, abbiamo chiesto a data scientist e ricercatori IBM con vari livelli di esperienza di applicare gli standard di provenienza dei dati a diversi tipi comuni di dati, inclusi dati proprietari di IBM, dati di terze parti e dati che includono materiale HAP (incitamento all'odio, linguaggio offensivo e volgarità).

Infine, abbiamo chiesto agli esperti dell'IBM Office of Privacy and Responsible Technology di esaminare la completezza e l'accuratezza degli invii di metadati in conformità con gli standard di provenienza dei dati, esaminando gli invii con i data scientist e i ricercatori per comprendere meglio i loro punti deboli o la loro confusione. Questo feedback qualitativo ci ha consentito di individuare termini, definizioni e linee guida poco chiari o ambigui.