自然TD学習 : 割引報酬におけるTD誤差を利用した自然方策勾配に基づいた強化学習法

自然TD学習 : 割引報酬におけるTD誤差を利用した自然方策勾配に基づいた強化学習法

シゼン TD ガクシュウ : ワリビキ ホウシュウ ニ オケル TD ゴサ オ リヨウシタ シゼン ホウサク コウバイ ニ モトズイタ キョウカ ガクシュウホウ

森村哲郎

生駒 : 奈良先端科学技術大学院大学, 2005.3

学位論文

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R003337

2

  • [IS]2005(15)

禁帯出

詳細情報

刊年

2005

別書名

Natural TD Learning : Efficient Use of TD-error for Natural Policy Gradient Reinforcement Learning with Discounted Rewards

シリーズ名

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2005年3月

注記

学位記番号: 修第2950号

授与年月日:

学位の種類: 修士(工学)

学生番号: 0351202

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

森村, 哲郎 (モリムラ, テツロウ)

件名

強化学習

方策勾配

自然勾配