フクスウ ノ ジョウタイ ヨソク ト ホウシュウ ヨソク モデル ニヨル キョウカ ガクシュウ ト コウドウ モクヒョウ ノ スイテイ
杉本徳和
生駒 : 奈良先端科学技術大学院大学, 2003.3
1
R002579
2
禁帯出
2003
Reinforcement learning and goal estimation by multiple forward and reward models
奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2003年3月
学位記番号: 修第2198号
授与年月日: 2003/03/24
学位の種類: 修士(工学)
学生番号: 0151054
日本語 (jpn)
杉本, 徳和 (スギモト, ノリカズ)
モジュール分割
強化学習
非線形制御
見まね学習
モジュール分割強化学習非線形制御見まね学習