文章
3
标签
4
分类
12
首页
关于本站
Cm's Blog
首页
关于本站
机器学习-强化学习
发表于 2026-05-20
更新于
2026-05-22
|
分类:
默认分类
|
作者:
Cmmmmmm
|
0条评论
常见概念 马尔科夫决策过程(Markov DecisionProcess, MDP). 强化学习的数学基础和建模工具, 通常由状态空间, 动作空间, 奖励函数, 状态转移函数, 折扣率等组合. 马尔科夫性质(Markov Property). 马尔科夫性...
阅读全文...
机器学习-数学基础
发表于 2026-05-19
更新于
2026-05-22
|
分类:
默认分类
|
作者:
Cmmmmmm
|
0条评论
概率论基础 生活中充满了随机性。概率论是一门用数学语言来刻画这些随机事件的学科。一个随机事件的概率是一个介于0与1之间的实数,这个实数的大小反映了这个事件发生的可能性。因此,概率为0意味着这个事件不可能发生(不可能事件),概率为1意味着这个事件必然发生(...
阅读全文...
Cmmmmmm
文章
3
标签
4
分类
12
个人网站
分类
默认分类
2
本站相关
1
编程
0
Minecraft Forge
0
LeetCode
0
学习
0
日常
0
奇怪的技巧
0
游戏
0
英国
0
评测
0
硬件
0
网站资讯
文章数目 :
3
已运行时间 :
1877 天
本站总字数 :
5.96 K
本站总访问量 :
106
最后更新时间 :
3 天前
本地搜索
搜索关键字
繁