next up previous contents
次へ: 冗長な文の検出 上へ: 冗長な文の収集とその分析 戻る: データ   目次


実験と結果

「冗長性修正文集合データベース」を用いて修正対象になりやすい表現を分析した.表3.3と表3.4に結果を示す.表3.3の「一単語ごと」は冗長な文における修正部分に含まれる 単語の頻度を求めた結果の一部を示しており,「二単語ごと」は 修正部分に含まれる二単語連続の頻度を求めた結果の一部を示している.


表: 修正部分に含まれる表現の頻度
一単語ごと 二単語ごと
頻度 単語 頻度 単語
23 もの 26 で ある
15 行う 7 と いう
10 存在 7 する こと
4 可能 6 が できる

3.3より,例えば「もの」「行う」などの表現が 冗長な表現になりやすいものであることがわかった.

3.4には,冗長な文を冗長でない文に修正した際の修正例の一部を示している.

表: 冗長な表現の修正例
修正前 修正後 例文
ものである 削除 カントは宗教を、道徳の基礎の上に成り立つべきものであるとしている。
を行う する 一人が複数票を投票する複数選挙や等級ごとに選挙を行う等級選挙がある。
存在する ある 今日、数え切れぬほど多くの経済学が存在するものの、私は二つしか認めない。
可能である できる 司法に該当しない国家作用であっても、法律により裁判所に権限を与えることは可能である。
という 削除 歴史的意味においてでないかぎり哲学を学ぶということはできない。
行わ 一方、ヨーロッパ大陸ではキリスト教の精神により古くから慈善事業が行われてきた。
である 削除 一方で劣等人種の血が優勢にならないように、その流入を防ぐことも必要であるとされた。
すること 削除 民主国家では、言論の自由が与えられているため、いくらでも権力者である政治家を批判、弾劾、ときに揶揄することができる。


next up previous contents
次へ: 冗長な文の検出 上へ: 冗長な文の収集とその分析 戻る: データ   目次
tsudou 平成24年3月14日