Efficient Task-independent Reinforcement Learning based on  Policy Gradient

Efficient Task-independent Reinforcement Learning based on Policy Gradient

森村哲郎

生駒 : 奈良先端科学技術大学院大学, 2008.3

学位論文

この資料には他にも巻号があります。

他の巻号を見る

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R006153

2

  • [IS]2008

禁帯出

詳細情報

刊年

2008

別書名

方策勾配に基づく効率の良い課題非依存な強化学習法

シリーズ名

奈良先端科学技術大学院大学情報科学研究科博士論文 ; 2008年3月

注記

学位記番号: 博第742号

報告番号: 甲第742号

学位授与年月日: 2008/03/24

学位の種類: 博士(工学)

学生番号: 0561034

標題言語

英語 (eng)

本文言語

英語 (eng)

著者情報

森村, 哲郎 (モリムラ, テツロウ)

件名

Reinforcement learning

Markov decision process

Policy gradient method

Natural gradient method

derivative of state-stationary distribution