複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定

複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定

フクスウ ノ ジョウタイ ヨソク ト ホウシュウ ヨソク モデル ニヨル キョウカ ガクシュウ ト コウドウ モクヒョウ ノ スイテイ

杉本徳和

生駒 : 奈良先端科学技術大学院大学, 2003.3

学位論文

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R002579

2

  • [IS]2003(6)

禁帯出

詳細情報

刊年

2003

別書名

Reinforcement learning and goal estimation by multiple forward and reward models

シリーズ名

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2003年3月

注記

学位記番号: 修第2198号

授与年月日: 2003/03/24

学位の種類: 修士(工学)

学生番号: 0151054

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

杉本, 徳和 (スギモト, ノリカズ)

件名

モジュール分割

強化学習

非線形制御

見まね学習