强化学习入门基础-马尔可夫决策过程(MDP)

作者:YJLAugus 博客: https://www.cnblogs.com/yjlaugus 项目地址:https://github.com/YJLAugus/Reinforcement-Learning-Notes,如果感觉对您有所帮助,烦请点个⭐Star。

MDP背景介绍 Random Variable

随机变量(Random Variable),通常用大写字母来表示一个随机事件。比如看下面的例子:

\(X\): 河水是咸的

\(Y\): 井水是甜的

很显然,\(X\), \(Y\)两个随机事件是没有关系的。也就是说\(X\)\(Y\)之间是相互独立的。记作:

\[\large X \bot Y \]

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzwpxy.html