トウケイテキ ガクシュウホウ ニ モトヅク レンゾク リキガク システム ノ キョウカ ガクシュウ
吉本潤一郎
生駒 : 奈良先端科学技術大学院大学, 2000.3
1
R001334
2
禁帯出
2000
奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2000年3月
学位記番号: 修第1347号
授与年月日: 2000/03/24
学位の種類: 修士(工学)
学生番号: 9851131
日本語 (jpn)
吉本, 潤一郎 (ヨシモト, ジュンイチロウ)
強化学習
actor-criticモデル
正規化ガウス関数ネットワーク
確率モデル
EMアルゴリズム
強化学習actor-criticモデル正規化ガウス関数ネットワーク確率モデルEMアルゴリズム