推論問題としての強化学習における非線形なTD誤差がもたらす挙動の解析

推論問題としての強化学習における非線形なTD誤差がもたらす挙動の解析

スイロン モンダイ トシテ ノ キョウカ ガクシュウ ニオケル ヒセンケイ ナ TD ゴサ ガ モタラス キョドウ ノ カイセキ

高橋慶一郎

生駒 : 奈良先端科学技術大学院大学, 2023.3

学位論文

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R018227

詳細情報

刊年

2023

別書名

Analyzing behavior due to nonlinear Temporal Difference error in Reinforcement Learning as a probabilistic inference problem

シリーズ名

奈良先端科学技術大学院大学先端科学技術研究科修士論文 ; 2023年3月

注記

学位記番号: 修第9076号

学位授与年月日: 2023/03/31

学位の種類: 修士(工学)

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

高橋, 慶一郎 (タカハシ, ケイイチロウ)

件名

強化学習

確率的推論としての制御

TD誤差