シゼン TD ガクシュウ : ワリビキ ホウシュウ ニ オケル TD ゴサ オ リヨウシタ シゼン ホウサク コウバイ ニ モトズイタ キョウカ ガクシュウホウ
森村哲郎
生駒 : 奈良先端科学技術大学院大学, 2005.3
Thesis / Diss.No. | Printing year | Location | Call Number | Material ID | Circulation class | Status | Waiting |
---|---|---|---|---|---|---|---|
1 |
|
|
R003337 |
|
|
|
|
2 |
|
|
|
Restricted |
|
2005
Natural TD Learning : Efficient Use of TD-error for Natural Policy Gradient Reinforcement Learning with Discounted Rewards
奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2005年3月
学位記番号: 修第2950号
授与年月日:
学位の種類: 修士(工学)
学生番号: 0351202
Japan
Japanese (jpn)
Japanese (jpn)
森村, 哲郎 (モリムラ, テツロウ)