表4 5の実験では,母音・促音・ 撥音を単語のモーラ数および単語のモーラ位置で分類して音素HMMの学習を行っ た.この節では全ての音素をモーラ情報を使って分類した場合の音素境界位置の 精度を調べた.データベースはMAU,MMY,FAF,FTKを使用し,音響モデルは Diagonal-covariance HMMを使用した.その他の実験条件は表3 と同様である.
実験結果を表8に示す.いずれの話者も,モーラ情報を使って 母音・促音・撥音を分類した場合より,音素境界位置の精度の向上は見られず, 4名の平均では標準偏差が0.47ms増加した.
この原因として,モーラ情報を使って子音を分類して音素ラベリングを行って も,子音にはピッチが含まれないために,音素境界位置の精度は向上しなかっ たと考えられる.そして1個あたりの音素HMMの学習データが減少し,そのため HMMの精度が低下し,音素境界位置の精度が低下したと考えられる.
全音素分類 | 母音・促音・撥音分類 | |||||||||||||||||
DB | 調査音素数 | 平均値 | 標準偏差 | 調査音素数 | 平均値 | 標準偏差 | ||||||||||||
MAU | 15126 | -2.51 | 23.08 | 17771 | -1.47 | 22.56 | ||||||||||||
MMY | 15048 | -1.44 | 22.45 | 17663 | -0.86 | 22.12 | ||||||||||||
FAF | 15109 | -1.47 | 23.97 | 17781 | -0.30 | 23.43 | ||||||||||||
FTK | 15147 | -1.07 | 22.69 | 17802 | -0.67 | 22.22 | ||||||||||||
平均 | -1.62 | 23.05 | -0.83 | 22.58 |