次に,モデル化の方法を説明する. まず,文末表現の認定条件を以下に示す.
次に,文末表現は多様であるため,文末表現を構成する任意の3文字に注目し, コメントと返事のブロック対から3文字対を全通り抽出する.そして,その対の頻度を求める.
ここで,2つの3文字列
,
がコメント-返事のブロック対に出現した回数を返す関数を
とする.
と
がコメント-返事のブロック対に出現しやすく,逆に
と
がコメント-返事のブロック対に出現しにくいことを表す関数
を
次式で定義する.
| (3.3) |
| コメント文末 | 返答文末 | スコア |
| めでと | ありが | 4.330733 |
| おめで | ありが | 4.330733 |
| めでと | りがと | 4.317488 |
| … | … | … |
| んばん | おはよ | 3.583516 |
| めでと | うござ | 3.583519 |
| でとう | うござ | 3.540959 |
| … | … | … |
| ですね | ますm | 2.833213 |
| すね! | www | 2.833213 |