Next: 評価手法
Up: 日英統計翻訳
Previous: デコーダ
目次
パターン翻訳では句辞書と文パターン辞書を人手で作成する必要があったため,コストがかかるという問題があった.この問題に対し,江木らは,句辞書と文パターン辞書を統計的手法を用いて自動的に作成して翻訳を行う``パターンに基づく統計翻訳''を提案した.現在,文献[5]より,パターンに基づく統計翻訳の翻訳精度は,句に基づく統計翻訳の翻訳精度よりも高いことが報告されている.
パターンに基づく日英統計翻訳は,大きく分けて5つの手順で構成される.パターンに基づく日英統計翻訳の流れを図2.10に示す.
図 2.10:
パターンに基づく日英統計翻訳の流れ
|
また,パターンに基づく日英統計翻訳における具体的な手順を以下に示す.
- 手順1
- 対訳学習文とGIZA++を用いて対訳単語辞書を作成
- 手順2
- 対訳学習文と対訳単語辞書を用いて対訳単語レベル文パターン辞書を作成
- 手順3
- 対訳学習文と対訳単語レベル文パターンを用いて対訳句辞書を作成
- 手順4
- 対訳学習文と対訳句辞書を用いて対訳句レベル文パターン辞書を作成
- 手順5
- 対訳句辞書と対訳句レベル文パターン辞書を用いて入力文を翻訳し,出力文を
生成
s122019
2018-02-15