シゼン TD ガクシュウ : ワリビキ ホウシュウ ニ オケル TD ゴサ オ リヨウシタ シゼン ホウサク コウバイ ニ モトズイタ キョウカ ガクシュウホウ
森村哲郎
生駒 : 奈良先端科学技術大学院大学, 2005.3
学位論文2005
Natural TD Learning : Efficient Use of TD-error for Natural Policy Gradient Reinforcement Learning with Discounted Rewards
奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2005年3月
学位記番号: 修第2950号
授与年月日:
学位の種類: 修士(工学)
学生番号: 0351202
日本語 (jpn)
日本語 (jpn)
森村, 哲郎 (モリムラ, テツロウ)