ATR子供中国語音声データベース

 成長期の子供たちの声を収録した「子供中国語音声データベース」です。音声認識・合成や教育支援アプリの研究開発に最適なデータセットです。
    
概要
「子供中国語音声データベース」は、中国語を母語とする小学生(1~6年生)を対象に、あらかじめ準備された台詞の読み上げをスマートフォンで収録した音声コーパスです。年齢層や男女比を考慮したバランスの取れた話者構成にしており、発話文リストが付属しています。 研究機関や企業での音声認識・合成モデル学習、教育や発話発達研究まで幅広く活用できます。 また、アカデミック・研究・商用利用にも対応したライセンス形態で提供しております。
主な特徴
・小学生(低学年/高学年)、年齢6~12歳を対象とした中国語音声コーパス
・男女比・年齢バランスを考慮した話者構成
・読み上げ文発話スタイル
・発話文リスト付属
・アカデミック、研究、商用利用に対応したライセンス形態で提供

子供中国語音声コーパスの用途

(1) 音声合成、音声認識分野
子供の発話特性を反映したAI音声処理技術の開発に最適

(2) 教育・学習支援アプリ
中国語の発音練習やリスニング教材、発話評価システムへの応用

(3) 発話発達・言語研究
年齢や性別による発話傾向の分析、言語発達研究に利用可能

(4) 音声コミュニケーションサービスの開発
子供向け対話システムや音声アシスタントの自然な会話設計に貢献


デモ・サンプル紹介

音声データ:WAV形式(16kHz,16bit,MONO)
  サンプル1(女性:低学年)  サンプル2(女性:高学年)
発話文リスト:話者ID,発話文
  サンプル1(女性:低学年)  サンプル2(女性:高学年)
(音声波形)
  サンプル1  サンプル2


仕様ピックアップ

発話タスク あらかじめ準備した台詞
総話者数(男/女別) 345名(169名/176名)
総発話時間(*1) 160.05時間
総発話数 81,473発話
(*1) 音声データから計算した発話前後の無音区間を含む時間

パンフレット

詳細製品情報


価格

商用利用  (低学年)  ¥4,505,000 (税抜) / (高学年)  ¥3,995,000(税抜)

研究利用  (低学年)  ¥3,180,000 (税抜) / (高学年)  ¥2,820,000(税抜)

 ライセンス区分については、こちらをご覧ください