これらを改善するために本研究では重要項目の選定と改良や文章作成支援を行うため,クラスタリングの手法を提案した.
情報抽出の実験においては,上位下位知識と提案手法であるクラスタリングで正解率を求めるた めにランダムに決定した城ページ30件を用いて評価を行った.word2vecを用いたクラスタリングを利用した実験では正解率は0.82で,先行手法の上位下位知識を利用した実験では正解率は0.72と提案手法の方が精度が良かった.類似度を使った情報抽出は重要情報が多く削除される結果になったのでクラスタリング結果のみを使うことを決定した.
また文章作成支援はWikipedia の城ページにおいて実際に情報が欠落していた項目を,情報抽出の実験で適切に空欄として検出できると,文章作成支援が適切に行えたと考える.また,城ページにクラスタ内の類似単語の記述があり,それが表に出力されてなかった場合は不適切とする.空欄箇所に基づく情報の欠落項目の検出性能を再現率,適合率,F 値で評価した.提案手法のF値は0.92で先行手法でのF値は0.85と提案手法のほうが精度が高かった.また,重要項目も先行研究では4個,提案手法は20個と重要項目を増やすことができた.