ATR503音声データベース48k
サンプリング周波数48kHzの高精細ATR音素バランス503文(ATR503文)音声データベースです。
「ATR自然発話音声データベースSDB」と、「ATR自然発話音声言語データベースSLDB」のATR503文データ部分を統合し、48kHz音声をDAT(Digital Audio Tape)音源からリマスターしました。
ATR503文音声の特性を活かし、
VUI(Voice User Interface)開発、学習、評価に幅広く利用できます。
仕様ピックアップ
●発話タスク ATR音素バランス503文
●話者数(男/女別) 537名(212名/325名)
●総発話時間長(男/女別) 41.1時間(15.7/25.4)
●総発話数(男/女別) 32,325(12,348/19,977)
データ構成
男性 女性
48k音声データ :WAV形式(48kHz,16bit,MONO) サンプル サンプル
ラベルデータ :書き起こし音素列,発話区間時刻 サンプル サンプル
収録情報データ:収録要件情報 サンプル サンプル
価格
商用利用 ¥1,500,000(税別)