next up previous
Next: Consideration Up: Statistical Machine Translation using Previous: Other

Results of Statistical Machine Translation

We obtained the BLEU score of 0.4321 for max-phrase-length set to 20 and using 698,973 Japanese-English parallel sentences. Table 4 shows examples of the results of our statistical machine translation.

Table 4: Examples of Outputs
A 静か で 素敵 な すき焼き の 御店 を 探し て い ます . 地図 で 指し て もらえ ます か .
I'm looking for a lovely stores in the calm and sukiyaki . Can I go on the map .
B サイズ は 御 いくつ です か .
What's your size ?
C 月曜日 の 朝 九 時 発 の 一 七 二 便 に 変更 し たい の です が ご 面倒 を 掛け て すみません .
I'd like to change to flight one seven two nine o'clock on Monday morning I'm sorry to give you trouble .
D 地下鉄 の 中 で 財布 を 掏 られ まし た .
Some pick-pocket stole my wallet on the subway .
E もう少し 短く し て 下さい .
A little shorter , please .
F コバヤシ さん が 副 社長 に 昇進 し まし た .
Mr. A コバヤシ|UNK |UNK |UNK I was promoted to vice-president .
G 明日 の トスカ の 予約 を 御 願い し たい の です が .
I'd like to make an appointment for tomorrow トスカ |UNK |UNK |UNK .
分かり まし た こちら が 搭乗 券 に なり ます . 本日 御 客 様 の フライト は イー 二 十 五 の 搭乗 口 から 出発 し ます .
H 出発 の 三 十 分 前 迄 に ゲート に い て 下さい .
Okay . Here's your boarding pass , flight depart from 30 minutes before departure gate for twenty-five cents for today is E .
Please stay at the gate .
I 来週 末 十 五 日 と 十 六 日 に ダブル の 部屋 を 予約 し たい の です .
I'd like to reserve a room for next weekend on Monday and Tuesday to double .
J 日本人 の 八 十 パーセント 近く が 都市 部 に 住ん で い ます .
Nearly 80 percent of Japanese cities, you live ?

Also we studied the comparison experiment of max-phrase-length and the size of parallel sentences. Table 5 shows theses results. In table 5, the 39,953 parallel sentences means IWSLT07 training data only.

Table 5: Results of experiments
BLEU max-phrase-length $ \sharp$ parallel sentences
0.4321 20 698,973
0.4184 7 698,973
0.4315 20 39,953
0.4182 7 39,953

These results shows the following things.

  1. If the max-phrase-length is enlarged, the BLEU sore is good.

    It means that the long phrase table is effective.

  2. Even if the size of parallel sentences is large, the BLUE sore is not change.

    It means that large parallel sentence is not so effective.

next up previous
Next: Consideration Up: Statistical Machine Translation using Previous: Other
Jin'ichi Murakami 2007-11-12