Che cos'è l'estrazione delle caratteristiche?

Autori

Vanna Winland

AI Advocate & Technology Writer

Che cos'è l'estrazione delle caratteristiche?

L'estrazione delle caratteristiche è una tecnica che riduce la dimensionalità o la complessità dei dati per migliorare le prestazioni e l'efficienza degli algoritmi di machine learning (ML). Questo processo facilita le attività di apprendimento automatico e migliora l'analisi dei dati semplificando il dataset per includere solo le sue variabili o attributi significativi. 

Le prestazioni di un modello di intelligenza artificiale (AI) si basano sulla qualità dei suoi dati di allenamento. I modelli di machine learning vengono sottoposti a pre-elaborazione per garantire che i dati siano in un formato adatto per l'addestramento e le prestazioni efficienti dei modelli. L'estrazione delle caratteristiche è una parte cruciale del workflow di pre-elaborazione.

Durante il processo di estrazione, i dati non strutturati vengono convertiti in un formato più strutturato e utilizzabile per migliorare la qualità dei dati e l'interpretabilità del modello. L'estrazione delle caratteristiche è un sottoinsieme della feature engineering, il processo più ampio di creazione, modifica e selezione delle caratteristiche all'interno dei dati non elaborati per ottimizzare le prestazioni del modello.  

Dalle prime ricerche sul riconoscimento dei modelli, nuovi metodi e tecniche sono stati studiati per utilizzare un metodo euristico per estrarre le caratteristiche più rilevanti di un set di dati utilizzando l'AI.1 Con il progredire della ricerca, gli autoencoder venivano tradizionalmente utilizzati per la riduzione della dimensionalità nell'apprendimento delle caratteristiche.2

È difficile lavorare con i dati quando il numero di caratteristiche o covariate supera il numero di punti dati indipendenti. Questo tipo di dati è considerato ad alta dimensionalità.3 L'estrazione delle caratteristiche può essere considerata una tecnica di riduzione della dimensionalità.4

Si tratta di un passaggio fondamentale quando si lavora con set di dati di grandi dimensioni o set di dati provenienti da più modalità. Più sono le caratteristiche estratte che il modello deve gestire, meno sarà competente e performante.5 Le attività comuni che si basano su un'estrazione efficiente delle caratteristiche includono l'elaborazione delle immagini, l'elaborazione del linguaggio naturale (NLP) e l'elaborazione del segnale. 

Le ultime tendenze in materia di AI, proposte da esperti

Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Come funziona l'estrazione delle caratteristiche?

La riduzione della dimensionalità è una tecnica di data science utilizzata nella fase di pre-elaborazione dell'apprendimento automatico.6 Durante questo processo, i dati irrilevanti e ridondanti vengono rimossi, mantenendo le informazioni rilevanti del set di dati originale.

Le caratteristiche possono essere considerate come gli attributi di un oggetto dati. Ad esempio, in un set di dati di animali, si aspetterebbe alcune caratteristiche numeriche (età, altezza, peso) e caratteristiche di categoria (colore, specie, razza). L'estrazione delle caratteristiche fa parte dell'architettura della rete neurale del modello, come una rete neurale convoluzionale (CNN).

Innanzitutto, il modello acquisisce i dati di input, quindi l'estrattore di caratteristiche trasforma i dati in una rappresentazione numerica che può essere utilizzata per calcolare i metodi di riduzione della dimensionalità per l'estrazione delle caratteristiche. Queste rappresentazioni vengono memorizzate in vettori di caratteristiche affinché il modello esegua algoritmi per la riduzione dei dati. 

Dopo l'estrazione, a volte è necessario standardizzare i dati utilizzando la normalizzazione delle caratteristiche, soprattutto quando si utilizzano determinati algoritmi sensibili all'entità e alla scala delle variabili (algoritmi di discesa basati sul gradiente, cluster k-means).

È possibile seguire diversi metodi per ottenere determinati risultati a seconda delle attività. Tutti i metodi cercano di semplificare i dati preservando le informazioni più preziose.

La maggior parte dei modelli AI esegue l'estrazione automatica delle caratteristiche, ma è comunque utile comprendere i diversi modi di gestirle. Di seguito sono riportati alcuni metodi comuni di estrazione delle caratteristiche utilizzati per la dimensione:

Analisi dei componenti principali (PCA): questa tecnica riduce il numero di caratteristiche in set di dati di grandi dimensioni a componenti principali o nuove caratteristiche che devono essere utilizzate dal classificatore del modello per le sue attività specifiche.

La PCA è popolare per la sua capacità di creare dati originali non correlati, il che significa che le nuove dimensioni create dalla PCA sono indipendenti l'una dall'altra.7 Questo rende la PCA una soluzione efficiente per l'overfitting dovuto alla mancanza di ridondanza dei dati perché ogni caratteristica è unica.   

Analisi discriminante lineare (LDA): questa tecnica è comunemente usata nel machine learning supervisionato per separare più classi e caratteristiche per risolvere problemi di classificazione.

È una tecnica comunemente usata per ottimizzare i modelli di apprendimento automatico. I nuovi punti dati vengono classificati utilizzando la statistica bayesiana per modellare la distribuzione dei dati per ogni classe. 

Incorporamento del vicino stocastico distribuito a T (t-SNE): questa tecnica di machine learning viene comunemente applicata ad attività come la visualizzazione delle caratteristiche nel deep learning.8 È particolarmente utile quando l'attività consiste nel renderizzare visualizzazioni di dati ad alta dimensione in 2D o 3D.

Viene comunemente utilizzato per analizzare modelli e relazioni nella data science. A causa della sua natura non lineare, il t-SNE è costoso dal punto di vista computazionale ed è comunemente utilizzato solo per le attività di visualizzazione.

Term Frequency-inverse document frequency (TF-IDF): Questo metodo statistico valuta l'importanza delle parole in base alla frequenza con cui appaiono. La frequenza del termine in un documento specifico viene ponderata rispetto alla frequenza con cui appare in tutti i documenti di una raccolta o di un corpus.9 

Questa tecnica è comunemente usata nella PNL per la classificazione, il cluster e il recupero delle informazioni. La Bag of words (BoW) è una tecnica simile ma invece di considerare la rilevanza del termine, tratta effettivamente tutte le parole allo stesso modo. 

Mixture of Experts | 12 dicembre, episodio 85

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Casi d’uso

Elaborazione delle immagini e computer vision: il processo di estrazione delle caratteristiche identifica ed estrae le caratteristiche chiave da immagini e video. I dati grezzi delle immagini (pixel) vengono trasformati in caratteristiche che la macchina può applicare algoritmi per estrarre e classificare un nuovo set di caratteristiche. Ad esempio, l'istogramma dei gradienti orientati (HOG) è un algoritmo di estrazione delle caratteristiche utilizzato per il rilevamento di oggetti.

Elaborazione del linguaggio naturale: l'estrazione delle caratteristiche converte i dati di testo non elaborati in una struttura di formato che il modello di machine learning può elaborare. Ciò è utile per attività come la classificazione, l'analisi del sentiment o la named entity recognition (NER). Questa tecnica può essere applicata in tutti i settori, utilizzata nelle interfacce di chat e persino nella salute. Questa ricerca suggerisce che l'estrazione delle caratteristiche aiuta nel riconoscimento multimodale delle emozioni per monitorare lo stato di salute comportamentale del paziente.10

Elaborazione del segnale: questa tecnica viene utilizzata per analizzare ed estrarre informazioni significative dai dati grezzi del segnale (audio, immagini o anche dati di serie temporali) per facilitare attività come la classificazione, il rilevamento o la previsione. Sebbene l'elaborazione del segnale sia tradizionalmente associata ad aree come il riconoscimento vocale, l'elaborazione audio e l'analisi delle immagini, può essere applicata anche in molti altri settori. Ad esempio, nel contesto medico, i segnali psicologici, come le letture ECG, vengono utilizzati per rilevare le tendenze.11

Soluzioni correlate
IBM watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e con una minima quantità di dati.

Scopri watsonx.ai
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI
Consulenza e servizi sull'AI

Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.

Esplora i servizi AI
Fai il passo successivo

Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.

Esplora watsonx.ai Prenota una demo live
Note a piè di pagina

1 Minsky, Marvin. "Steps toward artificial intelligence." Proceedings of the IRE 49, n. 1 (1961): 8-30. https://rodsmith.nz/wp-content/uploads/Minsky-steps-towards-artificial-intelligence-1.pdf.

2 Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning (Cambridge, MA: MIT Press, 2016).  https://www.deeplearningbook.org/contents/autoencoders.html.

3 Narisetty, Naveen Naidu. "Bayesian model selection for high-dimensional data." In Handbook of statistics, vol. 43, pagg. 207-248. Elsevier, 2020. https://www.sciencedirect.com/science/article/abs/pii/S0169716119300380.  

4 de-la-Bandera, Isabel, David Palacios, Jessica Mendoza, Raquel Barco. "Feature extraction for dimensionality reduction in cellular networks performance analysis." Sensors 20, n. 23 (2020): 6944. https://pmc.ncbi.nlm.nih.gov/articles/PMC7730729.

5 https://www.sciencedirect.com/topics/computer-science/feature-extraction.

6 Khalid, Samina, Tehmina Khalil, and Shamila Nasreen. "A survey of feature selection and feature extraction techniques in machine learning." In 2014 science and information conference, pagg. 372-378. IEEE, 2014. https://ieeexplore.ieee.org/abstract/document/6918213.  

7 Kuhn, Max, and Kjell Johnson. Applied predictive modeling. Vol. 26. New York: Springer, 2013.  

8 Zhou, Yuansheng, and Tatyana O. Sharpee. "Using global t-SNE to preserve intercluster data structure." Neural computation 34, n. 8 (2022): 1637-1651. https://pmc.ncbi.nlm.nih.gov/articles/PMC10010455/.  

9 Sammut, Claude, and Geoffrey I. Webb, eds. Encyclopedia of machine learning. Springer Science & Business Media, 2011.  

10 Minsky, Marvin. "Steps toward artificial intelligence." Estratti di IRE 49, n. 1 (1961): 8 30. https://www.sciencedirect.com/science/article/abs/pii/S1566253523005341.  

11 Geetha, A. V., T. Mala, D. Priyanka, E. Uma. "Multimodal emotion recognition with deep learning: advancements, challenges, and future directions." Information Fusion 105 (2024): 102218. https://www.sciencedirect.com/science/article/abs/pii/S1566253523005341.