DSpace Repository

Phonetic Tied-Mixtureモデルを用いた大語彙連続音声認識

Show simple item record

dc.contributor.author 李 晃伸 ja
dc.contributor.author 河原 達也 ja
dc.contributor.author 武田 一哉 ja
dc.contributor.author 鹿野 清宏 ja
dc.date.accessioned 2012-07-05T07:00:35Z en
dc.date.available 2012-07-05T07:00:35Z en
dc.date.issued 2000-12 en
dc.identifier.issn 0915-1923 en
dc.identifier.uri http://hdl.handle.net/10061/7763 en
dc.description.abstract 大語彙(い)連続音声認識のための新たなphonetic tied-mixture(PTM)モデルを提案する.このモデルは各音素モデル(monophone)の各状態がもつ64個のガウス分布集合をtriphoneの対応する状態に割り当て, 重みのみを変えて共有することで合成する.通常の状態共有triphoneに比べて音響空間を効率良く表現でき, また巨大なコードブックを要する従来のtied-mixtureモデルよりも学習が容易である.2万語の新聞記事読み上げタスクにおいて評価した結果, triphoneでの最大性能に近い7.0%の単語誤り率をより少ないパラメータ数で達成した.処理効率の点においては, 音響スコア計算に用いるガウス分布を上位3%にまで削減しても精度がほとんど低下しなかった.いくつかのガウス分布の足切り計算(Gaussian pruning)手法を提案及び比較した結果, 最終的に音響ゆう度計算を約5分の1にまで削減できた. ja
dc.language.iso ja en
dc.publisher 電子情報通信学会 ja
dc.rights Copyright (C) 2000 電子情報通信学会. ja
dc.subject 大語彙連続音声認識 ja
dc.subject PTM en
dc.subject tied-mixture en
dc.subject tied-state triphone en
dc.subject Gaussian pruning en
dc.title Phonetic Tied-Mixtureモデルを用いた大語彙連続音声認識 ja
dc.title.alternative Large Vocabulary Continuous Speech Recognition Based Phonetic Tied-Mixture Model en
dc.type.nii Journal Article en
dc.textversion publisher en
dc.identifier.ncid AN1007132X en
dc.identifier.jtitle 電子情報通信学会論文誌D-II ja
dc.identifier.volume J83-D-II en
dc.identifier.issue 12 en
dc.identifier.spage 2517 en
dc.identifier.epage 2525 en
dc.identifier.url https://search.ieice.org/ en
dc.relation.isIdenticalTo http://ci.nii.ac.jp/naid/110003183864 en


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account