部分観測環境における内部状態遷移モデルを用いた教科学習法

部分観測環境における内部状態遷移モデルを用いた教科学習法

ブブン カンソク カンキョウ ニ オケル ナイブ ジョウタイ センイ モデル オ モチイタ キョウカ ガクシュウホウ

谷口雄基

生駒 : 奈良先端科学技術大学院大学, 2008.3

学位論文

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R006132

2

  • [IS]2008(16)

禁帯出

詳細情報

刊年

2008

別書名

Reinfrocement Learning with Internal State Transition Models in a Partially Observable Environment

シリーズ名

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2008年3月

注記

学位記番号: 修第3987号

学位授与年月日: 2008/03/24

学位の種類: 修士(工学)

学生番号: 0651202

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

谷口, 雄基 (タニグチ, ユウキ)

件名

強化学習

POMDP

内部状態

マルチエージェント

方策勾配法

線形力学システム