次へ: ポーズの考慮
上へ: 言語クラスタリング法の予備実験
戻る: 予備実験の環境
目次
初期実装
初期に実装した言語クラスタリング法における音声合成の流れを図
22に,図22の詳細な手順を以下に示す.
- データベース中の音節素片8,138個と,作成する音声のラベルを入力
データとして準備する.
- 手順1で示す入力データを,上位のルールから順に照合し,適合した音節
素片が1つ以上存在するクラスタが得られた時点で,照合を停止する.
- ルールより得られたクラスタ中の音節素片を,ランダムに1つ選択する.
- 手順3で選択した音節素片を含む音声を,ランダムに1つ選択する.
上記手順2,3,4を,作成する合成音声の各モーラ位置に対して行い,手順4で選択
した各音節素片を接続することで合成音声を作成する.
初期実装におけるオピニオン評価実験の結果,言語クラスタリング法で作成した
音声は3.1という値を得た.しかし作成した音声を聞くと,前後音素環境にポー
ズ(pau) が含まれている場合,音声品質が劣化することがあると分かった.
図 22:
言語クラスタリング法における合成音声作成の流れ図(初期実装)
|
平成21年3月6日