next up previous contents
次へ: 翻訳システム 上へ: graduation 戻る: 表一覧   目次


はじめに

現在, 機械翻訳の分野において, 統計翻訳の研究が注目されている. 統計翻訳において, 対訳コーパスの文数が多ければ多いほど翻訳精度は高くなる. しかし, 利用できる対訳コーパスの文数には限りがある.

そこで, Popovic Maja らは, セルビア語英語間, スペイン語英語間の翻訳において, 小規模の対訳コーパスに対訳句コーパスを追加し, 句に基づく統計翻訳を用いて翻訳を行った[1]. その結果, セルビア語英語間で対訳コーパス200文対に対訳句コーパスとして351対訳句対を追加し, BLEUスコアで0.02の向上を報告した. また, スペイン語英語間で対訳コーパス1000文対に対訳句コーパスとして52,566対訳句対を追加し, BLEUスコアで0.06の向上を報告した.

統計翻訳において日本語英語のような文法構造が大きく異なる言語間で翻訳精度を向上させようとする研究が多く行われている. そこで, 日野らは同様の手法を用いて, 対訳句コーパスとして鳥バンク[2]と英辞郎[3]を用いて, 日本語英語間の翻訳を行った. その結果, 日本語英語間においても翻訳精度の向上が確認できた[4].

ところで, 文は句とパターンで構成されていると考える. そこで, 対訳句を追加することで翻訳精度が向上するため, 対訳コーパスに対訳パターンを追加しても翻訳精度が向上すると仮定した. なお, 本研究に用いる対訳パターンにプログラムで自動的に作成した対訳パターンと, 人手で作成した対訳パターンの2種類を使用した.

本研究では, 対訳コーパスに対訳パターンを追加することによる翻訳精度の効果を調査した. その結果, ほとんどの対訳パターンで翻訳精度の向上が確認できた.

本論文の構成は以下の通りである. 第2章において,各翻訳システムについての説明を行う. 第3章において,評価方法についての説明を行う. 第4章において,提案手法の手順についての説明を行う. 第5章において,実験環境についての説明を行う. 第6章において,自動評価と人手評価の結果を示す. 第7章において,本研究の考察を述べる. 第[*]章において,様々な対訳パターンデータを用いて各手法の比較を行う. 第8章において,結論を述べる.



平成26年3月7日