Embora todos os modelos de ML sejam de IA, nem toda IA envolve ML. Os modelos de IA mais básicos são uma série de declarações "se-então-senão", com regras programadas explicitamente por um cientista de dados. Esses modelos são alternativamente chamados de mecanismos de regras, sistemas especializados, gráficos de conhecimento ou IA simbólica.

Os modelos de aprendizado de máquina usam IA estatística em vez de IA simbólica. Enquanto os modelos de IA baseados em regras devem ser explicitamente programados, os modelos de ML são “treinados” aplicando as suas frameworks matemáticas a um conjunto de dados de amostra cujos pontos de dados servem de base para as futuras previsões do modelo no mundo real.

As técnicas de modelo de ML geralmente podem ser separadas em três grandes categorias: aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por reforço.

Aprendizado supervisionado : também conhecido como aprendizado de máquina "clássico", o aprendizado supervisionado requer um especialista humano para rotular os dados de treinamento. Um cientista de dados que treina um modelo de reconhecimento de imagens para reconhecer cão e gato deve rotular imagens de amostra como “cão” ou “gato”, bem como características principais, como tamanho, forma ou pelo, que informam esses rótulos primários. O modelo pode então, durante o treinamento, usar esses rótulos para inferir as características visuais típicas de "cão" e "gato".



Aprendizado não supervisionado : ao contrário das técnicas de aprendizado supervisionado, o aprendizado não supervisionado não pressupõe a existência externa de respostas "certas" ou "erradas" e, portanto, não requer rotulagem. Esses algoritmos detectam padrões inerentes aos conjuntos de dados para agrupar pontos de dados em grupos e informar as previsões. Por exemplo, empresas de comércio eletrônico como a Amazon usam modelos de associação não supervisionados para impulsionar os mecanismos de recomendação.

Aprendizado por reforço: no aprendizado por reforço, um modelo aprende holisticamente por tentativa e erro por meio da recompensa sistemática da saída correta (ou penalização da saída incorreta). Os modelos de reforço são usados para informar sugestões de mídias sociais, comércio algorítmico de ações e até carros autônomos.

O deep learning é um subconjunto mais evoluído do aprendizado não supervisionado cuja estrutura de neural networks tenta imitar a do cérebro humano. Várias camadas de nós interconectados ingerem dados progressivamente, extraem características importantes, identificam relacionamentos e refinam decisões em um processo chamado propagação direta. Outro processo chamado de retropropagação aplica modelos que calculam erros e ajustam os pesos e vieses do sistema de acordo. As aplicações de IA mais avançadas, como os grandes modelos de linguagem (LLMs) que alimentam os chatbots modernos, utilizam deep learning. Exige recursos computacionais enormes.