Hajime Fujita
生駒 : 奈良先端科学技術大学院大学, 2007.3
1
R005318
2
禁帯出
R005491
2007
部分観測環境における学習と意思決定に関する研究
奈良先端科学技術大学院大学情報科学研究科博士論文 ; 2007年3月
学位記番号: 博第652号
報告番号: 甲第652号
授与年月日: 2007/03/23
学位の種類: 博士(工学)
学生番号: 0461034
英語 (eng)
藤田, 肇 (フジタ, ハジメ)
Partially observable Markov decision process(POMDP)
Reinforcement learning(RL)
Card game Hearts
Behavior model
Partially observable Markov decision process(POMDP)Reinforcement learning(RL)Card game HeartsBehavior model