O aprendizado de máquina funciona por meio da lógica matemática. As funcionalidades relevantes (ou "recursos") de cada ponto de dados devem, portanto, ser expressas numericamente , de modo que os próprios dados possam ser alimentados em um algoritmo matemático que "aprenderá" a mapear uma determinada entrada para a saída desejada.
Os pontos de dados no aprendizado de máquina geralmente são representados em forma vetorial, na qual cada elemento (ou dimensão) da embedding de vetores de um ponto de dados corresponde ao seu valor numérico para uma funcionalidade específica. Para modalidades de dados que são inerentemente numéricas, como dados financeiros ou coordenadas geoespaciais, isso é relativamente simples. Mas muitas modalidades de dados, como texto, imagens, dados de gráficos de redes sociais ou comportamentos de usuários de aplicativos, não são inerentemente numéricas e, portanto, exigem uma engenharia de funcionalidades menos imediatamente intuitiva a ser expressa de uma maneira pronta para ML.
O processo (muitas vezes manual) de escolher quais aspectos dos dados usar em algoritmos de aprendizado de máquina é chamado de seleção de funcionalidades. As técnicas de extração de funcionalidades refinam os dados até suas dimensões mais relevantes e significativas. Ambos são subconjuntos da engenharia de funcionalidades, a disciplina mais ampla de pré-processamento de dados brutos para uso no aprendizado de máquina. Uma distinção notável do deep learning é que ele normalmente opera com dados brutos e automatiza grande parte do processo de engenharia de funcionalidades (ou pelo menos o processo de extração de funcionalidades). Isso torna o deep learning mais escalável, embora menos interpretável, do que o aprendizado de máquina tradicional.
Otimização e parâmetros do modelo de aprendizado de máquina
Para um exemplo prático, considere um algoritmo de regressão linear simples para prever os preços de venda de casas com base em uma combinação ponderada de três variáveis: metragem quadrada, idade da casa e número de quartos. Cada casa é representada como um embedding de vetores com três dimensões: [square footage, bedrooms, age]
. Uma casa de 30 anos com 4 quartos e 177 metros quadrados poderia ser representada como [1900, 4, 30]
(embora, para fins matemáticos, esses números possam primeiro ser dimensionados, ou normalizados, para uma faixa mais uniforme).
O algoritmo é uma função matemática direta:
Preço = (A * metragem quadrada) + (B * número de quartos) – (C *Idade) + Preço base
Aqui, , and são os parâmetros do modelo: ajustá-los ajustará o quanto o modelo pondera cada variável. O objetivo do aprendizado de máquina é encontrar os valores ideais para esses parâmetros do modelo: em outras palavras, os valores dos parâmetros que resultam na função geral produzindo os resultados mais precisos. Embora a maioria das instâncias do mundo real de aprendizado de máquina envolva algoritmos mais complexos, com um número maior de variáveis de entrada, o princípio permanece o mesmo: otimizar os parâmetros ajustáveis do algoritmo para produzir maior precisão.