統計的学習法に基づく連続力学システムの強化学習

統計的学習法に基づく連続力学システムの強化学習

トウケイテキ ガクシュウホウ ニ モトヅク レンゾク リキガク システム ノ キョウカ ガクシュウ

吉本潤一郎

生駒 : 奈良先端科学技術大学院大学, 2000.3

学位論文

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R001334

2

  • [IS]2000(12)

禁帯出

詳細情報

刊年

2000

シリーズ名

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2000年3月

注記

学位記番号: 修第1347号

授与年月日: 2000/03/24

学位の種類: 修士(工学)

学生番号: 9851131

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

吉本, 潤一郎 (ヨシモト, ジュンイチロウ)

件名

強化学習

actor-criticモデル

正規化ガウス関数ネットワーク

確率モデル

EMアルゴリズム