次へ: a4:段落内に日付けが出現するか否か
上へ: 提案手法に用いる素性
戻る: a2:段落内各文において,助詞「は」で文を区切り,その前部・後部で出現する品詞とその単語
目次
段落内の最初の文頭に「この」や「その」など連体詞が出現する場合は,以前に出現した単語を指し示している.
また,段落内の最初の文頭に「または」や「しかし」など接続詞が出現する場合は,文章間における文脈の関係を示している.
従って,連体詞や接続詞が文頭に出現する場合は以前に段落が存在すると考えられる.
連体詞や接続詞が段落内最初の文頭に出現する場合には1を,出現しない場合には0を素性として用いる.
データ内では,「特定品詞:1」または「特定品詞:0」として
素性を組み込んでいる.
図5.3のように,
段落A内の最初の文頭に連体詞「この」が出現しているため,
段落Aに対し,連体詞が出現するように素性として組み込む
5.3.
平成27年3月4日