Efficient Task-independent Reinforcement Learning based on  Policy Gradient

Efficient Task-independent Reinforcement Learning based on Policy Gradient

森村哲郎

生駒 : 奈良先端科学技術大学院大学, 2008.3

Thesis / Diss.

There are further volumes for this material.

Show other volumes

Volume No.

No. Printing year Location Call Number Material ID Circulation class Status Waiting

1

R006153

2

  • [IS]2008

Restricted

Details

Publication year

2008

Alternative title

方策勾配に基づく効率の良い課題非依存な強化学習法

Series title

奈良先端科学技術大学院大学情報科学研究科博士論文 ; 2008年3月

Note

学位記番号: 博第742号

報告番号: 甲第742号

学位授与年月日: 2008/03/24

学位の種類: 博士(工学)

学生番号: 0561034

Country of publication

Japan

Title language

English (eng)

Language of texts

English (eng)

Author information

森村, 哲郎 (モリムラ, テツロウ)

Subject

Reinforcement learning

Markov decision process

Policy gradient method

Natural gradient method

derivative of state-stationary distribution