next up previous
次へ: 半連続分布型HMMを用いたラベリング精度の検討 上へ: 考察 戻る: 音韻間の解析


全音素にモーラ情報を適用

4 $\sim$ 5の実験では,母音・促音・ 撥音を単語のモーラ数および単語のモーラ位置で分類して音素HMMの学習を行っ た.この節では全ての音素をモーラ情報を使って分類した場合の音素境界位置の 精度を調べた.データベースはMAU,MMY,FAF,FTKを使用し,音響モデルは Diagonal-covariance HMMを使用した.その他の実験条件は表3 と同様である.

実験結果を表8に示す.いずれの話者も,モーラ情報を使って 母音・促音・撥音を分類した場合より,音素境界位置の精度の向上は見られず, 4名の平均では標準偏差が0.47ms$(23.05-22.58)$増加した.

この原因として,モーラ情報を使って子音を分類して音素ラベリングを行って も,子音にはピッチが含まれないために,音素境界位置の精度は向上しなかっ たと考えられる.そして1個あたりの音素HMMの学習データが減少し,そのため HMMの精度が低下し,音素境界位置の精度が低下したと考えられる.


Phone Boundary Positions (Diagonal)
表: 全音素にモーラ情報を適用したときの音素境界位置 (Diagonal)
   全音素分類 母音・促音・撥音分類                
DB  調査音素数   平均値   標準偏差   調査音素数   平均値   標準偏差  
   $n$   $E_p (ms) $   $ \sigma_p (ms) $   $n$   $E_p (ms) $   $ \sigma_p (ms) $  
MAU  15126   -2.51   23.08   17771   -1.47   22.56  
MMY  15048   -1.44   22.45   17663   -0.86   22.12  
FAF  15109   -1.47   23.97   17781   -0.30   23.43  
FTK  15147   -1.07   22.69   17802   -0.67   22.22  
平均      -1.62   23.05       -0.83   22.58  


next up previous
次へ: 半連続分布型HMMを用いたラベリング精度の検討 上へ: 考察 戻る: 音韻間の解析
平成15年12月22日