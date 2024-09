Il framework di servizi Data Quality for AI (o DQAI) offre tutti gli strumenti necessari agli sviluppatori di modelli e ai data scientist per implementare un programma di preparazione dei dati formalizzato e sistematico, ossia la fase preliminare e più dispendiosa in termini di tempo del processo di sviluppo di un modello. Questo framework è adatto alla preparazione dei dati per le attività di classificazione e regressione supervisionate. Include il software necessario per:



— effettuare controlli di qualità,

— eseguire la correzione,

— redigere relazioni di audit,

— automatizzare tutto quanto sopra.



Sebbene il pipelining delle attività sia essenziale per la scalabilità e la ripetibilità, le funzionalità incluse possono essere utilizzate anche per l'esplorazione personalizzata dei dati e il miglioramento dei modelli a opera di umani. I servizi inclusi possono aumentare la produttività in qualsiasi fase del processo di sviluppo di un modello, ma sono particolarmente utili per la fase di preparazione dei dati.



Oltre a tutto ciò che si può ottenere dalle sorgenti di dati originali, esistono metodi che, partendo da un dataset di input, possono aiutare a sintetizzare nuovi dati (sia per l'integrazione che per la sostituzione) apprendendo i vincoli dei dati originali o grazie alle indicazioni di uno sviluppatore. Ciò può essere utile quando problemi normativi o contrattuali vietano l'utilizzo diretto dei dati in un'attività di modellazione, quando è auspicabile esplorare dataset con vincoli diversi o quando sono necessari più dati per la formazione.



Questo framework è adatto all'uso sia su dati tabulari che su dati di serie temporali, nonché su nuove modalità supportate in fase di sviluppo.