Temporal Difference Approach in Linearly Solvable Markov Decision Processes

Temporal Difference Approach in Linearly Solvable Markov Decision Processes

Mauricio Alexandre Parente Burdelis

生駒 : 奈良先端科学技術大学院大学, 2013.9

学位論文

この資料には他にも巻号があります。

他の巻号を見る

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

R010534

詳細情報

刊年

2013

別書名

線形可解マルコフ決定過程における受動的ダイナミクスのモデリングと推定

シリーズ名

奈良先端科学技術大学院大学情報科学研究科博士論文 ; 2013年9月

注記

学位記番号: 博第1160号

学位授与年月日: 2013/09/25

学位の種類: 博士(工学)

学生番号: 0961211

標題言語

英語 (eng)

本文言語

英語 (eng)

著者情報

Burdelis, Mauricio Alexandre Parente

件名

Reinforcement learning

Markov decision processes

Linearly solvable Markov decision processes