Next: 提案手法の手順
Up: 提案手法
Previous: 提案手法
目次
本研究では,他の統計翻訳器への応用を考慮した,新規の学習データを必要としない新たな未知語処理手法を提案する.日野らの手法では,人手で作成した対訳句辞書を追加するため,新規の学習データを準備する必要があった.一方で,提案手法は,GIZA++により自動作成した対訳単語辞書を未知語処理に用いる.GIZA++は,既存の対訳学習文さえ準備できれば自動的に対訳単語辞書を作成することが可能である.したがって,提案手法は新規の学習データを必要としない.また,藤原らの手法では,新規の学習データを必要としなかったが,句に基づく統計翻訳器(Moses)内で未知語処理を行っているため,他の統計翻訳器への応用が期待できなかった.一方で,提案手法は,一度生成した出力文に対して未知語処理を行うため,統計翻訳器の種類に依存しない.したがって,提案手法は,あらゆる統計翻訳器に実装することができる.
以上のことから,提案手法の特徴をまとめると以下のようになる.
- 自動作成した対訳単語辞書を用いた未知語処理のため,新規の学習データが不必要
- 一度生成した文に対する後処理のため,あらゆる統計翻訳器に実装可能
s122019
2018-02-15