next up previous contents
次へ: itSO-scoreの算出に用いる好評表現と不評表現 上へ: 共起頻度を用いた評価極性の算出 戻る: 共起頻度を用いた評価極性の算出   目次

itSO-scoreの算出式

名詞句に評価極性を付与する手法としてTurneyらの手法がある.Turneyらは,次式を用い,コーパスから語句$x$の評価極性を算出した[10]. $SO\mathchar\lq -score$の算出式を(2.1)式に,相互情報量$PMI$の算出式を(2.2)式に示す.ここで,$p(a,b)$はコーパス内において語句$a$と語句$b$が同一文で共起する確率を,$p(a)$は語句$a$を含む文がコーパス内に出現する確率をそれぞれ表す.

また,(2.1)式と(2.2)式から変形して,コーパス中での出現文数$hits$で表した式を(2.3)式に示す.$hits$に複数の代入がされている場合はそれらが同時に出現した文数を表す.

$\displaystyle SO\mathchar\lq -score(x) = PMI(x,\lq\lq 好評表現'') - PMI(x,\lq\lq 不評表現'')$     (2.1)


$\displaystyle PMI(a,b) = \log_{2} \frac{p(a,b)}{p(a)p(b)}$     (2.2)


$\displaystyle SO\mathchar\lq -score(x) = \log_{2} \frac{hits(\lq\lq 不評表現'')hits(x,\lq\lq 好評表現'')}{hits(\lq\lq 好評表現'')hits(x,\lq\lq 不評表現'')}$     (2.3)

$SO\mathchar\lq -score$を算出する際にTurneyらは``好評表現''に``excellent'',``不評表現''に``poor''を用いている.また,$hits$の値が0の時,$log$が計算できないため,$hits$には最初から0.01を足している.



平成26年3月7日