强化学习入门基础-马尔可夫决策过程（MDP）

日期：2022-03-19 栏目：程序人生浏览：次

作者：YJLAugus 博客： https://www.cnblogs.com/yjlaugus 项目地址：https://github.com/YJLAugus/Reinforcement-Learning-Notes，如果感觉对您有所帮助，烦请点个⭐Star。

MDP背景介绍 Random Variable

随机变量（Random Variable），通常用大写字母来表示一个随机事件。比如看下面的例子：

\(X\): 河水是咸的

\(Y\): 井水是甜的

很显然，\(X\), \(Y\)两个随机事件是没有关系的。也就是说\(X\)和\(Y\)之间是相互独立的。记作：

\[\large X \bot Y \]