に示す.
| 単文 | ||
| BLEU | 未知語を含む文の数 | |
| 日:単語,英:単語(従来) | 0.2015 | 2,189 |
| 従来+日:文節,英:単語 | 0.2058 | 2,072 |
| 従来+日:単語,英:フレーズ | 0.2063 | 2,030 |
| 従来+日:文節,英:フレーズ | 0.2045 | 2,145 |
| 4つを併用 | 0.2086 | 1,926 |
| 重文複文 | ||
| BLEU | 未知語を含む文数 | |
| 日:単語,英:単語(従来) | 0.1746 | 2,649 |
| 従来+日:文節,英:単語 | 0.1784 | 2,514 |
| 従来+日:単語,英:フレーズ | 0.1760 | 2,457 |
| 従来+日:文節,英:フレーズ | 0.1783 | 2,595 |
| 4つを併用 | 0.1797 | 2,339 |
表
から,単文の翻訳において,未知語を含む文の数が少ないほど,
BLEUスコアは向上している.しかし,重文複文の翻訳において,「日本語文を単語区切り,
英語文をフレーズ区切りとした」学習データから生成されたフレーズテーブルを併
用した場合,未知語は大きく減少しているが翻訳精度の向上は小さかった.この
ことから,重文複文の翻訳精度の向上のために,未知語を減らすことより,長いフレー
ズ対を増やすことが有効であると考えている.