次へ: 正解率について
上へ: 考察
戻る: 考察
  目次
本研究では、最初に英和辞典5,000文と新聞記事5,000文に対して実験を行った。
その結果、日英対訳パターンを自動的に抽出することができた。抽出された対訳
パターンは、対応率が高くて文番号の一致数が多ければ、信頼できる対訳パター
ンと言える。そのため、さらに一致数を増やす必要があると考えられる。
原文データを増やすと、対訳パターンを含む文も増え、文番号の一致数が増え
ると考えられる。よって、一致数を増やすためには大規模なコーパスへの適用が
必要である。
そこで、英和辞典20,000文に対して実験を行ったが、一致数はあまり増えな
かった。そのため、さらに大規模なコーパスへの適用が必要であると考えられる。
しかし、英和辞典5,000文では対訳パターンが31個抽出されたのに対し、英和
辞典20,000文では177個抽出された。このように、原文データを増やすことで対
訳パターンを増やすことができた。
平成14年4月17日