グラフ理論的観点からの自然言語処理における弱教師あり学習

グラフ理論的観点からの自然言語処理における弱教師あり学習

TOC

グラフ リロンテキ カンテン カラノ シゼン ゲンゴ ショリ ニオケル ジャクキョウシアリ ガクシュウ

小町守

生駒 : 奈良先端科学技術大学院大学, 2010.4

Lecture Archive
Contents Intro.

近年機械学習的手法の発達により自然言語処理は大きく発展してきた。人手によって作成されたテキストデータ(コーパス)や辞書などのリソースを用いることによって、高精度の解析が可能になっている。しかしながら、こうしたリソースの作成には高いコストがかかり、マイナーな言語ではリソースが存在しないこともある。また、大規模ウェブデータが利用できるようになり、情報の抽出源としても、解析対象としても重要になっている。人手によるリソース作成コストの削減を目的として、従来自然言語処理ではシードとして与える少数の事例を反復的に増やすことで大規模なリソースを作成できる弱教師あり学習(プートストラッピング手法)が用いられてきたが、ブートストラッピング手法には反復を繰り返すにつれてシードと無関係な事例まで獲得してしまう意味ドリフトという問題があった。そこで、本講演ではブートストラッピングにおける意味ドリフトがグラフ理論的に不可避であることを明らかにし、グラフ理論に基づく2つのアルゴリズムが意味ドリフトの影響を軽減することを示す。また、さまざまなウェブデータに対して弱教師あり学習を適用した結果について述べ、弱教師あり学習の有効性を示す。

Volume No.

No. Printing year Location Call Number Material ID Circulation class Status Waiting

1

  • LA-I-R

M007282

Details

Publication year

2010

Form

電子化映像資料(1時間28分32秒)

Series title

情報科学研究科・ゼミナール講演 ; 平成22年度

Note

講演者所属:本学自然言語処理学講座助教

講演日: 平成22年4月12日

講演場所: 情報科学研究科大講義室

Country of publication

Japan

Title language

Japanese (jpn)

Language of texts

Japanese (jpn)

Author information

小町, 守 (コマチ,マモル)