DSpace/Manakin Repository

著者 "Nagayuki, Yasuo" のブラウズ:

著者 "Nagayuki, Yasuo" のブラウズ:

ソート項目: ソート順: 表示件数:

  • 長行, 康男; 伊藤, 実 (一般社団法人電子情報通信学会, 2003-11-01)
    本論文では,2体エージェント確率ゲームにおける新たな強化学習法を提案する.提案する手法では,他エージェントが実際に実行した行動の観測情報をもとに他エージェントの政策(行動決定関数)を推定し,その推定した政策を利用して他エージェントが未来に実行する行動を予測する.そして,その予測行動を利用しながら強化学習を進行する.提案した手法を2体エージェント確率ゲームの枠組みでモデル化した追跡問題に適用し,実験を行い,提案手法の有効性を示す.

サイト検索

ブラウズ

登録利用者