集成学习为“群体智慧”的观点提供了依据，这表明一个更大群体的决策通常要优于专家个人的决策。与此类似，集成学习指的是一组（集成的）基础学习器或模型，它们共同协作以获得更准确的最终预测。单个模型，又称基础或弱学习器，由于高方差或高偏差可能个体性能不佳。然而，当弱学习器聚集后，可以形成一个强学习器，它们的结合可以减少偏差或降低方差，产生更好的模型性能。

集成方法通常使用决策树来说明，因为这种算法在没有修剪的情况下容易出现过拟合（高方差和低偏差），而当它变得非常小时，比如只有一层的决策树桩，则容易出现欠拟合（低方差和高偏差）。请记住，当一个算法在训练数据集中出现过拟合或欠拟合现象时，它不能很好地泛化到新的数据集，所以集成方法用于抵消这种行为，以便将模型泛化到新的数据集。虽然决策树会表现出高方差或高偏差，但值得注意的是，它并不是唯一一种利用集成学习在偏差-方差权衡中找到“最佳位置”的建模技术。