Alan de Souza Rodrigues
生駒 : 奈良先端科学技術大学院大学, 2008.9
1
R006565
2
禁帯出
2008
系列運動の獲得におけるモデルフリーとモデルベース強化学習戦略
奈良先端科学技術大学院大学情報科学研究科修士論文 ; 2008年9月
学位記番号: 修第4191号
学位授与年月日: 2008/09/30
学位の種類: 修士(理学)
学生番号: 0651204
英語 (eng)
Rodrigues, Alan de Souza
Reinforcement Learning
Model-Based method
Model-Free method
Internal Models
Sequential Behavior
Prediction Models
Reinforcement LearningModel-Based methodModel-Free methodInternal ModelsSequential BehaviorPrediction Models