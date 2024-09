L'upsampling, altrimenti noto come oversampling, è una tecnica di ottimizzazione e trattamento dei dati che affronta gli squilibri di classe in un set di dati aggiungendo dati. L'upsampling aggiunge dati utilizzando campioni originali provenienti da classi minoritarie fino a quando tutte le classi sono di dimensioni uguali. Sia Python Scikit-learn sia Matlab contengono funzioni integrate per l'implementazione di tecniche di upsampling.

L'upsampling per la data science spesso viene scambiato per upsampling nell'elaborazione digitale dei segnali (DSP). I due sono simili nello spirito ma distinti. Analogamente all'upsampling nella data science, l'upsampling per DSP crea artificialmente più campioni in un dominio di frequenza da un segnale di input (in particolare un segnale a tempo discreto) interpolando frequenze di campionamento più elevate. Questi nuovi campioni vengono generati inserendo zero nel segnale originale e utilizzando un filtro a basso passaggio per l'interpolazione. Questo è diverso dal modo in cui i dati vengono sovracampionati nel bilanciamento dei dati.

Anche l'upsampling per il bilanciamento dei dati è distinto dall'upsampling nell'elaborazione delle immagini. In quest'ultimo caso, le immagini ad alta risoluzione vengono prima ridotte nella risoluzione (rimuovendo i pixel) per calcoli più veloci, dopodiché la convoluzione riporta l'immagine alle dimensioni originali (aggiungendo pixel posteriori).