Next: 再現率高の例「易しい」と「手軽い」
Up: 類義語対ごとの考察
Previous: 再現率低の例「見限る」と「見捨てる」
目次
- (正解例1)
- ヘルメットからはみ出したパーマネントの髪が印象的。
- (正解例2)
- 首都のそばに住む「枠からはみ出た難民」は、伝染病流行の恐れなどから政府にとって、苦々しい存在だ。
- (誤り例1)
- 少ないスポーツ施設の争奪戦で、三ツ沢球技場ではこの冬さっそくラグビーがはみ出した。
- (誤り例2)
- 違反はサークルの線を踏んだり、はみ出て投げること。
表 6.11:
機械学習の結果(再現率低の例:「はみ出す」と「はみ出る」)
| |
再現率 |
適合率 |
総数 |
| はみ出す |
0.94 |
0.87 |
341 |
| はみ出る |
0.24 |
0.45 |
62 |
表 6.12:
機械学習が参考にした素性(再現率低の例:「はみ出す」と「はみ出る」)
| はみ出す |
はみ出る |
| 素性 |
正規化 22#22
値 |
素性 |
正規化 22#22
値 |
| 素性1:UNIGRAM |
0.78 |
素性1:米 |
0.62 |
| 素性1:上 |
0.60 |
素性1:手 |
0.60 |
| 素性1:社会 |
0.58 |
素性1: 自分 |
0.59 |
再現率低の例として,「はみ出す」と「はみ出る」という対がある. これらの語は両方,EDR日本語単語辞書で概念識別子に1042abが与えられており,
EDR概念辞書によるとこの識別子は「ある制限や範囲から食み出す」を意味する.
表6.12より「はみ出す」の方が「はみ出る」に比べて一般的であることがわかった.しかし使い分けに役立つ情報は得られなく,例文を見ても「はみ出す」と「はみ出る」は互いに置き換えられ,人間が見ても判断することが難しい.
これより,この類義語対は特別使い分けが必要でないといえる.
2018-03-09