Dynamic KL Regularization in Reinforcement Learning: Theoretical Error Propagation Analysis and an Algorithm

Dynamic KL Regularization in Reinforcement Learning: Theoretical Error Propagation Analysis and an Algorithm

Toshinori Kitamura

生駒 : 奈良先端科学技術大学院大学, 2022.3

学位論文

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R017821

詳細情報

刊年

2022

別書名

強化学習における動的なKL正則化の誤差伝搬解析とアルゴリズムへの応用

シリーズ名

奈良先端科学技術大学院大学先端科学技術研究科修士論文 ; 2022年3月

注記

学位記番号: 修第8724号

学位授与年月日: 2022/03/31

学位の種類: 修士(工学)

標題言語

英語 (eng)

本文言語

英語 (eng)

著者情報

北村, 俊徳 (キタムラ, トシノリ) [ Kitamura, Toshinori ]

件名

Value Iteration

Error-Awareness

KL Regularization

Reinforcement Learning