next up previous contents
次へ: 謝辞 上へ: hon2 戻る: 継続時間の影響   目次

おわりに

従来研究において,音節波形接続型音声合成法に,言語情報とMFCCの距離尺度の 両方を用いた木に基づくクラスタリングを適用する手法(音響クラスタリング法) が提案された.音響クラスタリング法は,データベースから音節単位で波形素片 を取り出す際,7つの言語情報の条件を完全に一致させるのではなく,一部の言 語情報の条件を言語情報とMFCCの距離尺度の両方を用いた木に基づくクラスタリ ングの結果を用いて緩和する.言語情報の条件を緩和することで,理論上全ての 音声が作成可能であると示された.しかし,音声品質の非常に悪い音声が生成さ れてしまう場合があった.本研究では,この原因として,音声合成において, MFCCの距離尺度と音声品質との間の相関が低いためであると仮定した.そこで本 研究では,MFCCの距離尺度の代わりに,言語情報と人間の聴覚的な知識を用いて 木に基づくクラスタリングを行い,音節波形接続型音声合成法に適用した(言語 クラスタリング法).本研究では,この言語クラスタリング法で作成した合成音 声の音声品質調査を目的とした.音声品質調査には,オピニオン評価実験および 対比較実験を用いた.

オピニオン評価実験の結果,言語クラスタリング音声が3.22,音響クラスタリン グ音声が2.48という値を得た.また,対比較実験の結果,言語クラスタリング音 声が77.8%,音響クラスタリング音声が22.2%となった.以上より言語クラスタ リング音声は,音響クラスタリング音声より高い音声品質であると示され,言語 クラスタリング法の有効性を確認した.

今後は言語クラスタリング法および音響クラスタリング法を改善し,自然音声や ノンクラスタリング音声の音声品質を目指す予定である.



平成21年3月6日