机器学习中,往往需要大量处理不确定量,或者是随机量,这与我们传统所需要解决掉问题是大不一样的,因此我们在机器学习中往往很难给出一个百分百的预测或者判断,基于此种原因,较大的可能性往往就是所要达到的目标,概率论有用武之地了。
概念 离散型概率质量函数:是一个数值,概率,\(0\leq P(x)\leq 1\);
边缘概率分布:\(P(X=x)=\sum_{y} P(X=x, Y=y)\)
期望:\(EX=\sum_xP(x)f(x)\)
连续型概率密度函数:是一个积分,\(F_X(x)=\int_{-\infty}^xf_X(t)dt\);
边缘概率分布:\(p(x)=\int p(x,y)dy\)
期望:\(EX=\int P(x)f(x)dx\)
条件概率\[P(Y=y|X=x)=\frac{P(Y=y,X=x)}{P(X=x)} \]