複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定

複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定

フクスウ ノ ジョウタイ ヨソク ト ホウシュウ ヨソク モデル ニヨル キョウカ ガクシュウ ト コウドウ モクヒョウ ノ スイテイ

杉本徳和

生駒 : 奈良先端科学技術大学院大学, 2003.3

Thesis / Diss.

Volume No.

No. Printing year Location Call Number Material ID Circulation class Status Waiting

1

R002579

2

  • [IS]2003(6)

Restricted

Details

Publication year

2003

Alternative title

Reinforcement learning and goal estimation by multiple forward and reward models

Series title

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2003年3月

Note

学位記番号: 修第2198号

授与年月日: 2003/03/24

学位の種類: 修士(工学)

学生番号: 0151054

Country of publication

Japan

Title language

Japanese (jpn)

Language of texts

Japanese (jpn)

Author information

杉本, 徳和 (スギモト, ノリカズ)

Subject

モジュール分割

強化学習

非線形制御

見まね学習