目次あり
グラフ リロンテキ カンテン カラノ シゼン ゲンゴ ショリ ニオケル ジャクキョウシアリ ガクシュウ
小町守
生駒 : 奈良先端科学技術大学院大学, 2010.4
授業アーカイブ近年機械学習的手法の発達により自然言語処理は大きく発展してきた。人手によって作成されたテキストデータ(コーパス)や辞書などのリソースを用いることによって、高精度の解析が可能になっている。しかしながら、こうしたリソースの作成には高いコストがかかり、マイナーな言語ではリソースが存在しないこともある。また、大規模ウェブデータが利用できるようになり、情報の抽出源としても、解析対象としても重要になっている。人手によるリソース作成コストの削減を目的として、従来自然言語処理ではシードとして与える少数の事例を反復的に増やすことで大規模なリソースを作成できる弱教師あり学習(プートストラッピング手法)が用いられてきたが、ブートストラッピング手法には反復を繰り返すにつれてシードと無関係な事例まで獲得してしまう意味ドリフトという問題があった。そこで、本講演ではブートストラッピングにおける意味ドリフトがグラフ理論的に不可避であることを明らかにし、グラフ理論に基づく2つのアルゴリズムが意味ドリフトの影響を軽減することを示す。また、さまざまなウェブデータに対して弱教師あり学習を適用した結果について述べ、弱教師あり学習の有効性を示す。
No. | 刷年 | 所在 | 請求記号 | 資料ID | 貸出区分 | 状況 | 予約人数 |
---|---|---|---|---|---|---|---|
1 |
|
|
M007282 |
|
|
|
2010
電子化映像資料(1時間28分32秒)
情報科学研究科・ゼミナール講演 ; 平成22年度
講演者所属:本学自然言語処理学講座助教
講演日: 平成22年4月12日
講演場所: 情報科学研究科大講義室
日本語 (jpn)
日本語 (jpn)
小町, 守 (コマチ,マモル)