Actor-critic法における共分散を考慮した多次元正規分布による政策表現

Actor-critic法における共分散を考慮した多次元正規分布による政策表現

Actor-criticホウ ニ オケル キョウブンサン オ コウリョ シタ タジゲン セイキ ブンプ ニ ヨル セイサク ヒョウゲン

阿部哲

生駒 : 奈良先端科学技術大学院大学, 2005.3

学位論文

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R003343

2

  • [IS]2005(1)

禁帯出

詳細情報

刊年

2005

別書名

Stochastic Policy Representation Using a Multidimensional Normal Distribution for Actor-critic Methods

シリーズ名

奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2005年3月

注記

学位記番号: 修第2797号

授与年月日: 2005/03/24

学位の種類: 修士(工学)

学生番号: 0351005

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

阿部, 哲 (アベ, サトシ)

件名

強化学習

Actor-critic法

多次元正規分布

マニュピュレータ