グラフ理論的観点からの自然言語処理における弱教師あり学習

グラフ理論的観点からの自然言語処理における弱教師あり学習

目次あり

グラフ リロンテキ カンテン カラノ シゼン ゲンゴ ショリ ニオケル ジャクキョウシアリ ガクシュウ

小町守

生駒 : 奈良先端科学技術大学院大学, 2010.4

授業アーカイブ
内容紹介

近年機械学習的手法の発達により自然言語処理は大きく発展してきた。人手によって作成されたテキストデータ(コーパス)や辞書などのリソースを用いることによって、高精度の解析が可能になっている。しかしながら、こうしたリソースの作成には高いコストがかかり、マイナーな言語ではリソースが存在しないこともある。また、大規模ウェブデータが利用できるようになり、情報の抽出源としても、解析対象としても重要になっている。人手によるリソース作成コストの削減を目的として、従来自然言語処理ではシードとして与える少数の事例を反復的に増やすことで大規模なリソースを作成できる弱教師あり学習(プートストラッピング手法)が用いられてきたが、ブートストラッピング手法には反復を繰り返すにつれてシードと無関係な事例まで獲得してしまう意味ドリフトという問題があった。そこで、本講演ではブートストラッピングにおける意味ドリフトがグラフ理論的に不可避であることを明らかにし、グラフ理論に基づく2つのアルゴリズムが意味ドリフトの影響を軽減することを示す。また、さまざまなウェブデータに対して弱教師あり学習を適用した結果について述べ、弱教師あり学習の有効性を示す。

巻号情報

No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

  • LA-I-R

M007282

詳細情報

刊年

2010

形態

電子化映像資料(1時間28分32秒)

シリーズ名

情報科学研究科・ゼミナール講演 ; 平成22年度

注記

講演者所属:本学自然言語処理学講座助教

講演日: 平成22年4月12日

講演場所: 情報科学研究科大講義室

標題言語

日本語 (jpn)

本文言語

日本語 (jpn)

著者情報

小町, 守 (コマチ,マモル)