Open Menu
home
about
全ての投稿
ソフトウェア・ハードウェアの設定のまとめ
分析関連のまとめ
ヘルスケア関連のまとめ
生涯学習関連のまとめ
ベルマン方程式
date: 2021-02-20 excerpt: ベルマン方程式について
tag:
bellman quation
ベルマン方程式
アルゴリズム
ベルマン方程式について
概要
複雑な時系列の相互作用を持つ価値の最大化
一般的に動的計画法で解決される
価値
V
の定式化
\[V = \max \sum_{t} \beta^t F(x_t, a_t)\]
a
: 戦略
x
: 状態
β
: 割引率
再起を定義する
\[V(x_0) = \max_{a} \{ F(x_0, a_0) + \beta V(x_1) \}\]
参考
ベルマン方程式
bellman quation
ベルマン方程式
アルゴリズム
Share
Tweet