• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

ベルマン方程式

date: 2021-02-20 excerpt: ベルマン方程式について

tag: bellman quationベルマン方程式アルゴリズム


ベルマン方程式について

概要

  • 複雑な時系列の相互作用を持つ価値の最大化
  • 一般的に動的計画法で解決される

価値Vの定式化

\[V = \max \sum_{t} \beta^t F(x_t, a_t)\]
  • a: 戦略
  • x: 状態
  • β: 割引率

再起を定義する

\[V(x_0) = \max_{a} \{ F(x_0, a_0) + \beta V(x_1) \}\]

参考

  • ベルマン方程式


bellman quationベルマン方程式アルゴリズム Share Tweet