図書館

オンセイニンシキニオケルダイナミクスノモデルカ

南泰浩

生駒 : 奈良先端科学技術大学院大学, 2005.1

授業アーカイブ

全1件

No.	刷年	所在	請求記号	資料ID	貸出区分	状況	予約人数
1		電子化資料	[MPDASH]	V002002

内容紹介: 音声認識は、音声を時系列のパターンに変換し、識別する手法である。音声のような時系列パターンを扱うときに問題となるのは、同じ人の発声であっても１回１回の発声で音の長さが微妙に長くなったり短くなったりすることである。このような時間的な長さの伸び縮みをうまくモデル化する手法としてHMM (Hidden MarkovModel) が提案され、音声認識の標準的な手法となっている。また、音声認識では、性能を向上するために時間的な変化などをうまくモデル化することも重要である。このような手法として、音声の時間的な変化の度合いを表す特徴量の微分係数を利用する動的特徴量が提案され、これも音声認識の標準的な手法となっている。以上のような音声の時間的な動きをモデル化する手法のことを音声のダイナミクスのモデル化と呼ぶ。本ゼミナールでは、現在音声認識で標準的に用いられるHMMや動的特徴量などのダイナミクスのモデル化についての概説を行う。さらに、より高度な音声のダイナミクスをモデル化することが出来得ると最近期待されているDBN (Dynamic BayesianNetwork)による音声認識についても概説する。

注記

講演者所属: NTTコミュニケーション科学基礎研究所

講演日: 平成17年1月24日

講演場所: 情報科学研究科大講義室