DSpace Repository

実環境における頑健な音声認識のための音韻モデルの教師なし話者適応

Show simple item record

dc.contributor.author 山出 慎吾 ja
dc.contributor.author 馬場 朗 ja
dc.contributor.author 芳澤 伸一 ja
dc.contributor.author 李 晃伸 ja
dc.contributor.author 猿渡 洋 ja
dc.contributor.author 鹿野 清宏 ja
dc.date.accessioned 2012-07-05T07:00:42Z en
dc.date.available 2012-07-05T07:00:42Z en
dc.date.issued 2004-04 en
dc.identifier.issn 0915-1923 en
dc.identifier.uri http://hdl.handle.net/10061/7796 en
dc.description.abstract 実環境のための高精度な音声認識システムを実現するためには,様々な話者や雑音環境に応じて,高精度にかつ素早く音韻モデルを適応できることが要求される.本研究ではHMM十分統計量を用いた教師なし環境・話者適応法を拡張した,Spectral Subtractionと既知雑音の付加に基づく教師なし話者適応法を提案する.従来手法は対象とする背景雑音の種別ごとにマッチドモデルを学習することを前提としており,入力ごとのSNRの変動や背景雑音の変化を考慮していなかった.これに対して本手法では,推定された雑音スペクトルを用いて入力の雑音を抑制し,更に消し残った雑音に対して既知の定常雑音を加えることで,背景雑音ごとの差異を平たん化し,単一の音韻モデルで認識を行う.また話者性については,任意の一発声文からデータベースの特徴の近い話者を選択し,その十分統計量からモデルの再学習を行う.これらを統合することにより,教師なしで高速かつ高精度に話者に適応する.認識実験の結果,提案手法は20dB SNRの様々な雑音環境下において,各環境の不特定話者環境Matchedモデルに比べて2%高い,平均85.1%の認識性能を達成した.また,代表的な教師あり適応法であるMLLRとの比較も行った. ja
dc.language.iso ja en
dc.publisher 電子情報通信学会 ja
dc.rights Copyright (C) 2004 電子情報通信学会. ja
dc.subject 耐雑音音声認識 ja
dc.subject 話者適応 ja
dc.subject Spectral Subtraction en
dc.subject 十分統計量 ja
dc.subject 教師なし適応 ja
dc.title 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応 ja
dc.title.alternative Unsupervised Speaker Adaptation for Robust Speech Recognition in Real Environments en
dc.type.nii Journal Article en
dc.textversion publisher en
dc.identifier.ncid AN1007132X en
dc.identifier.jtitle 電子情報通信学会論文誌D-II ja
dc.identifier.volume J87-D-II en
dc.identifier.issue 4 en
dc.identifier.spage 933 en
dc.identifier.epage 941 en
dc.identifier.url https://search.ieice.org/ en
dc.relation.isIdenticalTo http://ci.nii.ac.jp/naid/110003171082 en


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account