次へ: 評価実験の問題点
上へ: 安井らの研究とその問題点
戻る: 安井らの研究とその問題点
目次
「V+AのB」型名詞句のVがAとBのどちらに係るのかを判定する自動解析手法
を安井らが提案している[1].安井らの提案手法は6つの個別解析方法を信頼
度(ある解析方法が適応される時に,正解が出力される確率)の高い順に決定
リストとして統合したものとなっている.
6つの個別解析方法は以下のようになっている.
- VPM(Valency Pattern Matching)方式:結合価文法を用いた書く関係解
析による係り先の決定方法
- VCC(Verb and Case element Co-occurrence)方式:動詞と各要素の共起
頻度に基づく係り先の決定方法
- IPS(Inclusion by Particular Symbol)方式:特殊記号の存在に基づく
係り先の決定方法
- CBS(Co-occurrence Between two part of Speech)方式:名詞の品詞と
品詞の組合せに基づく係り先の決定方式
- AAC(Attribute-Attribute Co-occurence)方式:名詞の意味情報の組合
せに基づく係り先の決定方法
- EPA(Exclusion by Particular semantic Attribute)方式:名詞の意味
情報の存在に基づく非係り先の決定方式
VPM方式で用いる結合価文法は,[3]に収録されている.VCC方式で用いる格関
係の共起頻度は,新聞記事などから収集可能である.IPS方式の特殊記号は,
トレーニングデータで出現した(「」,『』,``'')とする.
6つの個別解析方式
の信頼度は,CBS方式が78.7%,AAC方式が76.3%,IPS方式が69.0%,EPA方式
が65.5%,VPM方式が62.6%,VCC方式が56.8%である.ゆえに,決
定リストはCBS,AAC,IPS,EPA,VPM,VCCの順となっている.ここで,各方
式は適用条件が有り,出力が無い場合があるので,適用される解析方法が無
かった時は,デフォルト規則(「A係り」)が適用される.
この手法の評価実験の結果は90%の正解率になったと報告されている.
平成19年3月25日