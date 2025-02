L'ingegneria delle caratteristiche è il processo di trasformazione dei dati non elaborati in informazioni pertinenti per l'utilizzo da parte dei modelli di machine learning. In altre parole, l'ingegneria delle caratteristiche è il processo di creazione delle caratteristiche per modelli predittivi. Una caratteristica, detta anche dimensione, è una variabile di input utilizzata per generare previsioni del modello. Poiché le prestazioni del modello si basano in gran parte sulla qualità dei dati utilizzati durante l'addestramento, l'ingegneria delle caratteristiche è una tecnica di pre-elaborazione cruciale che richiede la selezione degli aspetti più rilevanti dei dati di addestramento non elaborati sia per l'attività predittiva che per il tipo di modello in esame.1

Prima di procedere, una breve nota sulla terminologia. Molte fonti utilizzano i termini ingegneria delle caratteristiche ed estrazione di caratteristiche in modo intercambiabile per indicare l'elaborazione della creazione delle variabili del modello.2 Talvolta, le fonti usano il termine estrazione di caratteristiche per riferirsi alla rimappatura di uno spazio delle caratteristiche originale su uno spazio delle caratteristiche di dimensione inferiore.3 La selezione delle caratteristiche, al contrario, è una forma di riduzione della dimensionalità. In particolare, è l'elaborazione della selezione di un sottoinsieme di variabili al fine di creare un nuovo modello con lo scopo di ridurre la multicollinearità e quindi massimizzare la generalizzabilità e l'ottimizzazione del modello.