音声認識におけるダイナミクスのモデル化

音声認識におけるダイナミクスのモデル化

オンセイ ニンシキ ニオケル ダイナミクス ノ モデルカ

南泰浩

生駒 : 奈良先端科学技術大学院大学, 2005.1

授業アーカイブ

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

  • [MPDASH]

V002002

内容紹介

音声認識は、音声を時系列のパターンに変換し、識別する手法である。音声のような時系列パターンを扱うときに問題となるのは、同じ人の発声であっても1回1回の発声で音の長さが微妙に長くなったり短くなったりすることである。このような時間的な長さの伸び縮みをうまくモデル化する手法としてHMM (Hidden MarkovModel) が提案され、音声認識の標準的な手法となっている。また、音声認識では、性能を向上するために時間的な変化などをうまくモデル化することも重要である。このような手法として、音声の時間的な変化の度合いを表す特徴量の微分係数を利用する動的特徴量が提案され、これも音声認識の標準的な手法となっている。以上のような音声の時間的な動きをモデル化する手法のことを音声のダイナミクスのモデル化と呼ぶ。本ゼミナールでは、現在音声認識で標準的に用いられるHMMや動的特徴量などのダイナミクスのモデル化についての概説を行う。さらに、より高度な音声のダイナミクスをモデル化することが出来得ると最近期待されているDBN (Dynamic BayesianNetwork)による音声認識についても概説する。

詳細情報

刊年

2005

形態

電子化映像資料(1時間26分32秒)

シリーズ名

情報科学研究科・ゼミナール講演 ; 平成16年度

注記

講演者所属: NTTコミュニケーション科学基礎研究所

講演日: 平成17年1月24日

講演場所: 情報科学研究科大講義室

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

南, 泰浩 (ミナミ, ヤスヒロ)