音声合成システム「WizardVoice™SDK」

概要

サンプル画面
WizardVoice™サンプル画面

 コンピュータ上であらかじめデータベース化された人間の声を使用し、指定された任意の文章を合成音声として出力する音声合成システムです。

文章に応じて、音素のの並びや長さ、声の高さなどの条件が最もよく適合しなめらかにつながる音素を選び出し、それらの音声波形を結合して合成音声を作成します。このため、信号処理により合成音声と比べて、より自然で人間的な合成音声を作成することが可能です。

特徴

合成音声作成時に信号処理を行わないため、より自然な合成音ができます。「WizardVoice™」で使用している音声合成は「コーパスベース方式音声合成」と呼ばれる合成技術を使用しています。

原理

「コーパスベース方式音声合成」では、以下のような処理により音声合成を行います。

コーパスベース方式音声合成の処理


  1. テキスト処理・・・ 入力されたテキストを解析し、読み付与、アクセント位置の判定を行います。
  2. 韻律予測・・・   韻律知識ベースをもとに、合成したい音素系列(テキスト)の韻律パラメータを予測します。
  3. 音声単位選択・・・計算された韻律パラメータをもとに適切な韻律情報をもつ音素を選択し、波形接続に必要なインデックスを求めます。
  4. 波形接続・・・   選択された音素を、一つずつ音声波形ファイル内から切り出して接続します。
  5. 音声出力・・・   生成された音声波形を出力します。

サンプル音声

「WizardVoiceSDK」には3話者のデータベースが含まれています。

話者 発話内容 視聴

女性ナレータ

各種サービスを音声でご案内します。

視聴

男の子

僕は、野球が大好きです。

視聴

女の子

天気がいいので外で遊ぼう。

視聴

製品構成

WizardVoiceエンジン/日本語処理DLL/日本語処理辞書/サンプルプログラム/ドキュメント/データベース3話者(女性ナレータ、男の子、女の子)

動作環境

OS

WindowsXP, Linux

ハードディスク

460MB以上の空き容量(標準データベース 450MB、エンジン 10MB)

メモリ

64MB以上を推奨

対応環境

C/C++言語、Visual Basic対応環境

価格

「WizardVoice™SDK」価格 ¥550,000(税別)
※アカデミック価格についてはお問い合わせ下さい。 

お問合せお見積もり

このページの先頭へ

お問合せ

お見積もり