推論問題としての強化学習における非線形なTD誤差がもたらす挙動の解析

推論問題としての強化学習における非線形なTD誤差がもたらす挙動の解析

スイロン モンダイ トシテ ノ キョウカ ガクシュウ ニオケル ヒセンケイ ナ TD ゴサ ガ モタラス キョドウ ノ カイセキ

高橋慶一郎

生駒 : 奈良先端科学技術大学院大学, 2023.3

Thesis / Diss.

Volume No.

No. Printing year Location Call Number Material ID Circulation class Status Waiting

1

R018227

Details

Publication year

2023

Alternative title

Analyzing behavior due to nonlinear Temporal Difference error in Reinforcement Learning as a probabilistic inference problem

Series title

奈良先端科学技術大学院大学先端科学技術研究科修士論文 ; 2023年3月

Note

学位記番号: 修第9076号

学位授与年月日: 2023/03/31

学位の種類: 修士(工学)

Country of publication

Japan

Title language

Japanese (jpn)

Language of texts

Japanese (jpn)

Author information

高橋, 慶一郎 (タカハシ, ケイイチロウ)

Subject

強化学習

確率的推論としての制御

TD誤差