Mauricio Alexandre Parente Burdelis
生駒 : 奈良先端科学技術大学院大学, 2013.9
1
R010534
R010549
2013
線形可解マルコフ決定過程における受動的ダイナミクスのモデリングと推定
奈良先端科学技術大学院大学情報科学研究科博士論文 ; 2013年9月
学位記番号: 博第1160号
学位授与年月日: 2013/09/25
学位の種類: 博士(工学)
学生番号: 0961211
英語 (eng)
Burdelis, Mauricio Alexandre Parente
Reinforcement learning
Markov decision processes
Linearly solvable Markov decision processes
Reinforcement learningMarkov decision processesLinearly solvable Markov decision processes