DSpace Repository

適応型アレーを用いた3次元ビタビ探索に基づくハンズフリー音声認識

Show simple item record

dc.contributor.author 山田 武志 ja
dc.contributor.author 中村 哲 ja
dc.contributor.author 鹿野 清宏 ja
dc.date.accessioned 2012-07-05T07:00:30Z en
dc.date.available 2012-07-05T07:00:30Z en
dc.date.issued 1999-02 en
dc.identifier.issn 1882-7837 en
dc.identifier.uri http://hdl.handle.net/10061/7742 en
dc.description.abstract 実環境下でハンズフリーな音声認識を実現するために3次元ビタビ探索法を提案している. 3次元ビタビ探索法では, マイクロホンアレーの指向性ビームをフレームごとに対象とするすべての方向に順次向け, 特徴ベクトルの方向・フレーム系列を計算する. そして, 方向とフレームとHMMの状態からなる3次元トレリス上で最も尤度の高いパスを探索することにより, 発話者の移動軌跡と音素系列を同時に推定する. これまでにマイクロホンアレー信号処理として遅延和アレーを適用し, 実環境で収録したデータを用いて3次元ビタビ探索法の有効性を確認している. 本論文では,3次元ビタビ探索法の性能をさらに改善するために適応型アレーに基づく方法を提案する. 発話者移動と発話者位置固定という2通りの条件で収録した実環境データを用いて認識実験を行った. その結果, 発話者移動時の提案法の単語認識率は, シングルマイクと比べてSNR 18dBのとき11.1%, SNR 10dBのとき42.6%, また遅延和アレーを適用する場合と比べてSNR 18dBのとき6.9%,SNR 10dBのとき28.7%改善され, 適応型アレーの効果が示された. ja
dc.description.abstract We are investigating a speech recognition algorithm based on 3-D Viterbi search using a microphone array to realize hands-free speech recognition in real environments. The 3-D Viterbi search method extracts a direction-frame sequence of parameter vectors by steering a beamform to each direction every frame. Then Viterbi search is performed in 3-dimensional trellis space composed of talker directions, input frames, and HMM states. A locus of the talker and a phoneme sequence of the speech are obtained by finding an optimal path with the highest likelihood. To improve the performance of the 3-D Viterbi search method in real environments, this paper proposes a novel method based on an adaptive beamforming technique instead of the delay-and-sum beamformer used in our previous study. Speake-dependent isolated-word recognition experiments were carried out on real environment data to evaluate the effect of the adaptive beamformer. For a moving talker, the word recognition accuracy of the 3-D Viterbi search method with the adaptive beamformer in SNR 10 dB was 42.6% higher than that of the single microphone, and 28.7% higher than that of the 3-D Viterbi search method with the delay-and-sum beamformer. These results show that the use of the adaptive beamformer is very effective. en
dc.language.iso ja en
dc.publisher 情報処理学会 ja
dc.rights Copyright (C) 1999 情報処理学会. ja
dc.rights ここに掲載した著作物の利用に関する注意: 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 ja
dc.rights Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author(s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. en
dc.title 適応型アレーを用いた3次元ビタビ探索に基づくハンズフリー音声認識 ja
dc.title.alternative Hands-free Speech Recognition Based on 3-D Viterbi Search Using Adaptive Beamforming en
dc.type.nii Journal Article en
dc.textversion publisher en
dc.identifier.ncid AA12317677 en
dc.identifier.jtitle 情報処理学会論文誌 ja
dc.identifier.volume 40 en
dc.identifier.issue 2 en
dc.identifier.spage 460 en
dc.identifier.epage 468 en
dc.identifier.NAIST-ID 73296626 en
dc.relation.isIdenticalTo http://ci.nii.ac.jp/naid/110002764799 en


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account