机器学习－－偏差和方差

日期：2022-05-19 栏目：程序人生浏览：次

这篇博文主要是解释偏差和方差，以及如何利用偏差和方差理解机器学习算法的泛化性能

综述

在有监督学习中，对于任何学习算法而言，他们的预测误差可分解为三部分

偏差

方差

噪声

噪声属于不可约减误差，无论使用哪种算法，都无法减少噪声。通常噪声是从问题的选定框架中引入的错误，也可能是由诸如未知变量之类的因素引起的，这些因素会影响输入变量到输出变量的映射。噪声表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界，即刻画了学习问题本身的难度。而剩下两种误差则与我们选择的学习算法相关，并且可以通过一些方法减小

数学推导

对于测试样本 x, 令

上面的期望预测是针对不同数据集 $D, f 对 x 的预测值取其期望, 也被叫做 average predicted.$ 使用样本数目相同的不同训练集产生的方差为

机器学习－－偏差和方差