Policy gradient reinforcement learning with log stationary distribution gradients

Policy gradient reinforcement learning with log stationary distribution gradients

Tetsuro Morimura, Eiji Uchibe, Junichiro Yoshimoto, and Kenji Doya

生駒 : 奈良先端科学技術大学院大学, 2007.9

学内論文

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

  • TR

R005787

詳細情報

刊年

2007

形態

15 p.

シリーズ名

Information Science Technical Report ; TR2007013

標題言語

英語 (eng)

本文言語

英語 (eng)

著者情報

森村, 哲郎 (モリムラ, テツロウ)

内部, 英治 (ウチベ, エイジ)

吉本, 潤一郎 (ヨシモト, ジュンイチロウ)

銅谷, 賢治 (ドウヤ, ケンジ) [ 銅谷, 賢治 (ドーヤ, ケンジ) ] [ *Doya, Kenji ]

ISSN

09199527