動的な部分空間生成による価値の逐次推定を行う強化学習法

動的な部分空間生成による価値の逐次推定を行う強化学習法

ドウテキナ ブブン クウカン セイセイ ニヨル カチ ノ チクジ スイテイ オ オコナウ キョウカ ガクシュウホウ

南條信人

生駒 : 奈良先端科学技術大学院大学, 2008.3

学位論文

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R006110

2

  • [IS]2008(8)

禁帯出

詳細情報

刊年

2008

別書名

An effective reinforcement learning with automatic construction of basis functions and sequential approximation

シリーズ名

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2008年3月

注記

学位記番号: 修第3964号

学位授与年月日: 2008/03/24

学位の種類: 修士(工学)

学生番号: 0651082

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

南條, 信人 (ナンジョウ, ノブヒト)

件名

Reinforcement learning

Function approximation

Least-squares optimization

Basis functions construction