に示す.なお,表
は,2-gram(2単語間)である.
| -1.782704
|
| -1.610493
|
| -2.346281
|
| -1.868116
|
において,一番上の行は,左から,
``I"の後に``am"が続く確率を常用対数で表した値
``
バックオフスムージングとは,高次の
-gramの値が存在しない場合,
低次の
-gramの値から推定する手法である.低次の確率を改良したスムージングの手法は,
Kneser-Neyスムージングである.言語モデルの
-gramの作成においては,
一般的にKneser-Neyスムージングが用いられる.