Next: 目次
Up: soturon
Previous: soturon
目次
文章作成の際に重要情報を書き漏らす場合がある.書き漏れがあると不明瞭な文になる場合や読者が知りたい情報が書かれておらず情報取得において不便になる場合がある.重要項目を文章から抽出し表にまとめ,文章に重要項目が書いていない場合に書き漏れを指摘することで,文章作成を支援することが考えられる.この技術に関する研究はいくつかある.藤原ら [1]の研究では上位下位知識を用いてWikipedia の抽出データから下位語の頻度分析を行い,頻度が高かった下位語の上位語を重要項目と選定して,Wikipedia の抽出データから重要項目の下位語を取り出し,表にまとめていた.しかし,先行研究では抽出された重要項目の種類が少なかった.
そこで本研究では先行研究の改善を目的としてWikipediaからの情報抽出における重要項目の取り出し技術の改良に焦点をあてて研究を行う.具体的には重要項目の種類を増やす目的で研究を行う.
実験の結果,情報抽出の実験においては,word2vec [2]を用いたクラスタリングを利用した実験では正解率は0.82で,先行手法の上位下位知識を利用した実験では正解率は0.72と提案手法の方が精度が良かった.また文章作成支援においても,提案手法のF値は0.92で先行手法でのF値は0.85と提案手法の方が精度が高かった.また,重要項目も先行研究では4個しかなかったが,提案手法では20個に重要項目を増やすことができた.
akano hokuto
2018-03-06