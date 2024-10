A extração de funcionalidades é uma técnica para criar um novo espaço dimensional para um modelo, combinando variáveis em novas variáveis substitutas ou para reduzir as dimensões do espaço de funcionalidades do modelo.9 Em comparação, a seleção de funcionalidades denota técnicas para selecionar um subconjunto das funcionalidades mais relevantes para representar um modelo. Tanto a extração quanto a seleção de funcionalidades são formas de redução da dimensionalidade e, portanto, adequadas para problemas de regressão com um grande número de funcionalidades e amostras de dados disponíveis limitadas.

Análise de componentes principais. A análise de componentes principais (PCA) é um método comum de extração de funcionalidades que combina e transforma as funcionalidades originais de um conjunto de dados para produzir novas funcionalidades, chamadas de componentes principais. A PCA seleciona um subconjunto de variáveis de um modelo que, juntas, abrangem a maioria ou toda a variância presente no conjunto original de variáveis do modelo. Então, a PCA projeta dados em um novo espaço definido por esse subconjunto de variáveis.10

Análise discriminante linear. A análise discriminante linear (LDA) é ostensivamente semelhante à PCA, pois projeta dados do modelo em um novo espaço de menor dimensão. Como no PCA, as dimensões (ou funcionalidades) desse espaço do modelo são derivadas das funcionalidades do modelo inicial. No entanto, a LDA difere da PCA em sua preocupação em manter os rótulos de classificação no conjunto de dados original. Enquanto a PCA produz novas variáveis de componentes destinadas a maximizar a variação dos dados, a LDA produz variáveis de componentes destinadas principalmente a maximizar a diferença de classe nos dados.11