スイロン モンダイ トシテ ノ キョウカ ガクシュウ ニオケル ヒセンケイ ナ TD ゴサ ガ モタラス キョドウ ノ カイセキ
高橋慶一郎
生駒 : 奈良先端科学技術大学院大学, 2023.3
学位論文No. | 刷年 | 所在 | 請求記号 | 資料ID | 貸出区分 | 状況 | 予約人数 |
---|---|---|---|---|---|---|---|
1 |
|
|
R018227 |
|
|
|
2023
Analyzing behavior due to nonlinear Temporal Difference error in Reinforcement Learning as a probabilistic inference problem
奈良先端科学技術大学院大学先端科学技術研究科修士論文 ; 2023年3月
学位記番号: 修第9076号
学位授与年月日: 2023/03/31
学位の種類: 修士(工学)
日本語 (jpn)
日本語 (jpn)
高橋, 慶一郎 (タカハシ, ケイイチロウ)