next up previous contents
次へ: ベースラインシステム 上へ: 翻訳システムの自動作成 戻る: 本研究の翻訳システムの概要   目次

本研究の翻訳システムの手順

本研究の翻訳システムの手順を以下に示す.
手順1
日英対訳フレーズ辞書の作成
まず日英対訳学習文からMoses[13]に付属している``train-model.perl''を用いてフレーズテーブルを生成する.次に,各フレーズ対の両方向へのフレーズ翻訳確率と単語翻訳確率について,それぞれ積を計算する.そして,閾値\(\alpha\)以上の確率を持つフレーズ対を抽出し,日英対訳フレーズ辞書を作成する.図4.2に日英対訳フレーズ辞書の作成手順を示す.

図: 日英対訳フレーズ辞書の作成手順
\fbox{
\includegraphics[scale=0.5]{phrase_dic.eps}
}
最初に,各フレーズ対に対して,両方向へのフレーズの翻訳確率(下線部が直線の確率値)と,両方向への単語の翻訳確率(下線部が波線の確率値)の積を計算する.そして計算した確率値に対して,各確率に対して閾値\(\alpha\)以上の確率を持つフレーズ対のみを抽出し,日英対訳フレーズ辞書の作成を行う.図4.2で作成できた日英対訳フレーズ辞書において,左から,日本語フレーズ,英語フレーズ,双方向へのフレーズ翻訳確率の積,双方向への単語翻訳確率の積を表している.

手順2
日英文パターン辞書の作成
手順1で作成した日英対訳フレーズ辞書を用いて日英対訳学習文から日英文パターン辞書を自動的に作成する.日英対訳フレーズ辞書を参照し,日英対訳学習文中で適合したフレーズ対を変数化して,日英文パターン辞書を作成する.尚,パターン翻訳を行うとき,変数部分に対して候補が莫大になることを防ぐために,変数部分を変換可能なフレーズに含まれる単語数について制限を設ける.図4.3に日英文パターン辞書の作成手順を示す.


図: 日英文パターン辞書の作成手順
\fbox{
\includegraphics[scale=1.0]{pattern_flow.eps}
}
4.3の例では,日本語文``それ を 君 に 5 0 0 円 で 売ろ う .''と英語文``I will give it to you for 5 0 0 yen .''に対して,日英対訳フレーズ辞書を参照し,適合するフレーズに対して変数化を行う.3つのフレーズ``それ'',``君'',``5 0 0 円''が変数化され,日文パターン``X1[2] を X2[2] に X3[4] で 売ろ う .''が生成される.そして同時に英文パターン``I will give X1 to X2 for X3 .''も生成される.日文パターンの変数部分Xに付与されている大括弧内の数値は変数化するときに用いたフレーズが含む単語数であり,単語数が1である場合には``2''とする.``2''とする理由としては,入力文に対してカバー率を上げるためである.

手順3
パターン翻訳
手順1で作成した日英対訳フレーズ辞書と手順2で作成した日英文パターン辞書を用いて,日英パターン翻訳を行う.図4.4に日英パターン翻訳の流れを示す.

図: 日英パターン翻訳の流れ
\fbox{
\includegraphics[scale=1.0]{pattern_translation_flow.eps}
}
4.4において,最初に日本語入力文``私は先生です.''に対して,日英文パターン辞書を参照し,適合するパターンを選択する.次に,日英対訳フレーズ辞書を参照し,適合した日文パターンの変数部分にあたる日本語フレーズ``私'',``英語の先生''のそれぞれについて,英語フレーズを``I'',``an English teacher''を得る.そして,英文パターンと変数部分の英語フレーズを用いて翻訳候補を生成する.複数の候補が出現する場合には,tri-gramを用いて候補を1文に絞り込む.図4.4では,2つの翻訳候補から最終的な翻訳文``I am an English teacher.''を得る.尚,本研究では,パターン翻訳を用いて翻訳した日本語テスト文と日本語学習文をそれぞれ,英'語テスト文,英'語学習文と呼ぶ.また,翻訳結果のtri-gramのスコアが低い場合には,適合すべきでないパターンにマッチしているなど,出力結果に誤りを含む可能性が高いと考えられる.そこで本研究では,翻訳結果のtri-gramでのスコアに対して,閾値\(\beta\)を設け,\(\beta\)以下のスコアを持つ最終的な翻訳文は出力しないものとする.

手順4
統計翻訳の翻訳モデルと言語モデルの学習
英'語学習文と対応する英語学習文を用いて翻訳モデルを学習し,英語学習文を用いて言語モデルを学習する.図4.5にモデル学習の例を示す.

図: モデル学習の例
\fbox{
\includegraphics[scale=1.0]{stat_train.eps}
}

手順5
統計翻訳における英語文生成
英'語テスト文に対して,手順4で学習した翻訳モデルと言語モデルを用いて英'英統計翻訳を行う. 図4.6に英'英統計翻訳の例を示す.

図: 英'英統計翻訳の例
\fbox{
\includegraphics[scale=0.9]{stat_trans.eps}
}
パターン翻訳の出力に対して,さらに統計翻訳を行うことで,パターン翻訳における局所的な誤りを修正できると考えられる.本研究では,デコーダにMosesを用いる.



平成24年3月23日