評価実験は,男性話者3名と女性話者3名で行う.実験には音声認識ツールのHTK [7]を使用する.HMMの共分散行列にはDiagonal-covarianceを使用する. その他の実験条件は表1に示す. 実験条件は話者ごとに統一している.特徴量のベクトル数は同一にするのが困難 であるため同じではない.
| 基本周波数 | 16kHz |
| フレームの長さ | 20ms |
| シフト幅 | 10ms |
| 音響モデル | 状態数3 |
| 混合数 話者に依存 | |
| 特徴量 | MFCC(14次元) |
| (特徴ベクトル数) | LFCC(64次元) |
| パワースペクトル(FFTpower)(256次元) | |
| 提案特徴量(FFT_Real_Img)(256+256次元) | |
| FFTpower+FFT_Real_Img(二手法併用)(256+256+256次元) | |
| 共分散行列 | Diagonal-covariance |