• Top
  • Details (Local collection)
自然TD学習 : 割引報酬におけるTD誤差を利用した自然方策勾配に基づいた強化学習法

自然TD学習 : 割引報酬におけるTD誤差を利用した自然方策勾配に基づいた強化学習法

シゼン TD ガクシュウ : ワリビキ ホウシュウ ニ オケル TD ゴサ オ リヨウシタ シゼン ホウサク コウバイ ニ モトズイタ キョウカ ガクシュウホウ

森村哲郎

生駒 : 奈良先端科学技術大学院大学, 2005.3

Thesis / Diss.

Volume No.

Total: 1
No. Printing year Location Call Number Material ID Circulation class Status Waiting

1

R003337

2

  • [IS]2005(15)

Restricted

Details

Publication year

2005

Alternative title

Natural TD Learning : Efficient Use of TD-error for Natural Policy Gradient Reinforcement Learning with Discounted Rewards

Series title

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2005年3月

Note

学位記番号: 修第2950号

授与年月日:

学位の種類: 修士(工学)

学生番号: 0351202

Country of publication

Japan

Title language

Japanese (jpn)

Language of texts

Japanese (jpn)

Author information

森村, 哲郎 (モリムラ, テツロウ)

Subject

強化学習

方策勾配

自然勾配