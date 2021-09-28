Boosting é um método de aprendizado de conjuntos que combina um conjunto de aprendizes fracos em um aprendiz forte para minimizar erros de treinamento. O reforço de algoritmos pode melhorar o poder preditivo de suas iniciativas de mineração de dados.
No boosting, uma amostra aleatória de dados é selecionada, ajustada a um modelo e, em seguida, treinada sequencialmente, ou seja, cada modelo tenta compensar os pontos fracos de seu antecessor. A cada iteração, as regras fracas de cada classificador individual são combinadas para formar uma regra de previsão forte.
O aprendizado coletivo fundamenta a ideia da "sabedoria das multidões", o que sugere que a tomada de decisão de um grupo maior de pessoas normalmente é melhor do que a de um especialista individual Da mesma forma, o aprendizado de conjuntos refere-se a um grupo (ou conjunto) de aprendizes básicos, ou modelos, que trabalham coletivamente para alcançar uma melhor previsão final. Um único modelo, também conhecido como aluno de base ou fraco, pode não ter um bom desempenho individualmente devido à alta variância ou ao alto viés. No entanto, quando os aprendizes fracos são agregados, podem formar um aprendiz forte, pois sua combinação reduz o viés ou a variância, produzindo um melhor desempenho do modelo.
Os métodos de conjunto são frequentemente ilustrados utilizando decision trees, pois esse algoritmo pode ser propenso ao overfitting (alta variância e baixo viés) quando não foi podado e também pode se prestar ao underfitting (baixa variância e alto viés) quando é muito pequeno, como um toco de decisão, que é uma decision tree com um nível. Lembre-se, quando um algoritmo se adapta ou não ao seu conjunto de dados de treinamento, ele não pode generalizar bem para novos conjuntos de dados, portanto métodos de conjunto são usados para contornar esse comportamento e permitir a generalização do modelo para novos conjuntos de dados. Embora as decision trees possam exibir alta variância ou alto viés, vale a pena notar que essa não é a única técnica de modelagem que aproveita o aprendizado em conjunto para encontrar o "ponto ideal" na troca viés-variância.
Bagging e boosting são dois tipos principais de métodos de aprendizado em conjunto. Conforme destacado neste estudo (link fora do ibm.com), a principal diferença entre esses métodos de aprendizado é a maneira como eles são treinados. No bagging, os aprendizes fracos são treinados em paralelo, mas no boosting eles aprendem em sequência. Isso significa que uma série de modelos é construída e, a cada nova iteração do modelo, os pesos dos dados mal classificados no modelo anterior são aumentados. Essa redistribuição de pesos ajuda o algoritmo a identificar os parâmetros nos quais ele precisa se concentrar para melhorar seu desempenho. AdaBoost, que significa "algoritmo de boosting adaptativo", é um dos algoritmos de boosting mais populares, pois foi um dos primeiros de seu tipo. Outros tipos de algoritmos de boosting são XGBoost, GradientBoost e BrownBoost.
Outra diferença entre bagging e boosting está na forma como são usados. Por exemplo, os métodos bagging são normalmente usados em aprendizes fracos que apresentam alta variação e baixa polarização, enquanto os métodos de boosting são aproveitados quando se observa baixa variação e alta polarização. Embora o bagging possa ser utilizado para evitar o overfitting, os métodos de boosting podem ser mais propensos a isso (link fora do site ibm.com), embora isso realmente dependa do conjunto de dados. No entanto, o ajuste de parâmetros pode ajudar a evitar o problema.
Consequentemente, o bagging e o boosting também têm diferentes aplicações no mundo real. O bagging foi aproveitado para processos de aprovação de empréstimos e genômica estatística, enquanto o boosting foi mais utilizado em aplicativos de reconhecimento de imagens e mecanismos de pesquisa.
Os métodos de boosting se concentram na combinação iterativa de aprendizes fracos para construir um aluno forte que possa prever resultados mais precisos. Como lembrete, um aprendiz fraco classifica os dados um pouco melhor do que a adivinhação aleatória. Essa abordagem pode oferecer resultados robustos para problemas de previsão e pode até superar neural networks e oferecer suporte a máquinas vetoriais em tarefas como recuperação de imagens (link fora do site ibm.com).
Os algoritmos de boosting podem diferir na forma como criam e agregam aprendizes fracos durante o processo sequencial. Três tipos populares de métodos de boosting são:
Benefícios e desafios do boosting
Há uma série de vantagens e desafios importantes que o método de boosting apresenta quando usado para problemas de classificação ou regression.
Os principais benefícios do boosting incluem:
Os principais desafios do boosting são:
Os algoritmos de boosting são adequados para projetos de inteligência artificial em uma ampla gama de setores, incluindo:
Saúde: o boosting é utilizado para reduzir erros em previsões de dados médicos, como previsão de fatores de risco cardiovasculares e taxas de sobrevida de pacientes com câncer. Por exemplo, pesquisas (link fora do ibm.com) mostram que os métodos em conjunto melhoram consideravelmente a precisão na identificação de pacientes que poderiam se beneficiar do tratamento preventivo de doenças cardiovasculares, evitando o tratamento desnecessário de outras pessoas. Da mesma forma, outro estudo (link fora do site ibm.com) descobriu que a aplicação de boosting a várias plataformas genômicas pode melhorar a previsão do tempo de sobrevivência ao câncer.
TI: as árvores de regression impulsionadas por gradiente são usadas em mecanismos de pesquisa para classificação de páginas, enquanto o algoritmo de boosting Viola-Jones é utilizado para recuperação de imagens. Como observado por Cornell (link fora do site ibm.com), os classificadores impulsionados possibilitam que os cálculos sejam interrompidos mais cedo, quando está claro para o qual uma previsão está indo. Isso significa que um mecanismo de pesquisa pode interromper a avaliação de páginas com classificação inferior, enquanto os scanners de imagens só consideram as imagens que realmente contêm o objeto desejado.
Finanças: o boosting é utilizado com modelos de deep learning para automatizar tarefas críticas, incluindo detecção de fraudes, análise de preços e muito mais. Por exemplo, os métodos de boosting na detecção de fraudes de cartão de crédito e na análise de preços de produtos financeiros (link fora do site ibm.com) melhora a precisão da análise de conjuntos de dados massivos para minimizar as perdas financeiras.
