本研究では, 初めに, 記載必要項目とその項目の検出に役立つ単語を決定する. 多くの論文に出現する単語は記載必要項目の検出に役立つ単語である可能性が高いと考える. そこで, 記載必要項目の検出に役立つ単語を決定するために, 論文内での単語の頻度調査を行う. 論文に出現する単語ごとの出現率を算出し, 出現率の高い単語を調べる. 出現率の高い単語から記載必要項目の検出に役立つ単語であるかを人手で検討し決定する.
さらに, 記載必要項目の検出に役立つ単語を増やすために, 記載必要項目の検出に役立つ単語に類似している単語を調査する. 類似している単語の調査には, 意味ソート[9]を利用して調査を行う.
次に, 記載必要項目の検出に役立つ単語が一つもない論文を記載必要項目が欠落している論文であると判別し, そういった論文を自動検出する. 本研究ではルールベースを用いて検出を行う. 最後に, ルールベースでの検出結果から文章作成支援に役立っているか否かを人手で判別し, 評価を行う. 本研究では記載必要項目を補う必要のある論文を文章作成支援に役立っている論文と判別し, F値を算出して評価を行う.