DSpace Repository


Show simple item record

dc.contributor.author 長行, 康男 ja
dc.contributor.author 伊藤, 実 ja
dc.date.accessioned 2016-11-24T06:00:07Z en
dc.date.available 2016-11-24T06:00:07Z en
dc.date.issued 2003-11-01 en
dc.identifier.issn 0915-1915 en
dc.identifier.uri http://hdl.handle.net/10061/11167 en
dc.description.abstract 本論文では,2体エージェント確率ゲームにおける新たな強化学習法を提案する.提案する手法では,他エージェントが実際に実行した行動の観測情報をもとに他エージェントの政策(行動決定関数)を推定し,その推定した政策を利用して他エージェントが未来に実行する行動を予測する.そして,その予測行動を利用しながら強化学習を進行する.提案した手法を2体エージェント確率ゲームの枠組みでモデル化した追跡問題に適用し,実験を行い,提案手法の有効性を示す. ja
dc.language.iso ja en
dc.publisher 一般社団法人電子情報通信学会 ja
dc.rights Copyright c 2003 IEICE en
dc.subject マルチエージェント強化学習 ja
dc.subject Q学習 ja
dc.subject 2体エージェント確率ゲーム ja
dc.subject 政策推定 ja
dc.subject 行動予測 ja
dc.title 2体エージェント確率ゲームにおける他エージェントの政策推定を利用した強化学習法 ja
dc.title.alternative A Reinforcement Learning Method with the Inference of the Other Agent's Policy for 2-Player Stochastic Games en
dc.type.nii Journal Article en
dc.contributor.alternative Nagayuki, Yasuo en
dc.contributor.alternative Ito, Minoru en
dc.textversion Publisher en
dc.identifier.ncid AA11341020 en
dc.identifier.jtitle 電子情報通信学会論文誌 D ja
dc.identifier.volume Vol.J86-D1 en
dc.identifier.issue 11 en
dc.identifier.spage 821 en
dc.identifier.epage 829 en
dc.identifier.NAIST-ID 73292302 en
dc.relation.isIdenticalTo http://search.ieice.org/bin/summary.php?id=j86-d1_11_821 en

Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace

Advanced Search


My Account