声の高さを変えずに、話すスピードだけを変更する
Windows用話速変換ライブラリ
「話速工房(わそくこうぼう)」の販売を開始
NTTアドバンステクノロジ
NTTアドバンステクノロジは、コールセンタなどの音声応答システムや語学教育などの音声関連商品に組み込み、声の高さを変えずに話すスピードだけを変更できるWindows用話速変換ライブラリ「話速工房」を2005年12月15日(木)より販売開始した。
NTT-ATでは、これまでも音声処理技術に関する研究開発のノウハウを活かし、音声処理ソフトウェア音声工房シリーズなどを提供してきた。この度、販売を開始した「話速工房」は、アプリケーションに手軽に組み込むことが可能なDLL(ダイナミックリンクライブラリ)である。音声関連商品の開発者にとって使いやすいAPI(アプリケーションインタフェース)を提供している。
本製品では、声の高さを変えることなく、発声者の特徴を保ったまま話速を変更することができるため、コールセンタを代表とするさまざまな音声応答システムや音声再生・編集ソフトウェア、英語や日本語の語学教育用アプリケーションなど、幅広い音声出力サービスへの適用が可能となる。特に音声応答システムでは、再収録せずにさまざまな速度の音声を作り出すことができるため、聞き手に応じたシステム作りなどに活用できる。また、変換の途中で話速をなめらかに変更することも可能であり、早聞き、遅聞きなどの動作を違和感なく行えるアプリケーションの開発をすることも可能である。
製品の主な特徴
(1)変換途中で話速変更可能
変換の途中においても、話速を自由に変更することができる。
(2)変換単位長(フレーム長)が自由に変えられる
音声をフレーム毎に話速変換するという動作が基本であるので、リアルタイム処理に適用できる。
(3)変換機能をコンパクトなDLLに格納
ライブラリのサイズはごく小さく、わずかな関数により制御できるので手軽に組み込むことができる。
(4)自然でなめらかな音声が得られる
音声の特徴を保ったまま変換されるので聞きやすく、また途中で話速を変更しても滑らかに変化させることができる。
図 製品の応用イメージ
動作環境
- OS:
- Microsoft Windows 2000/XP
- CPU:
- Pentium4 1GHz相当 以上を推奨
- 開発環境:
- Microsoft Visual C++ 6.0以降
*上記記載の製品名は各社の商標または登録商標です。
仕様
- 対応音声形式:
- 16bit PCM、8bit μlaw(いずれもメモリ上に置かれたデータ)
- ライブラリ形式:
- DLL(ダイナミックリンクライブラリ)
- 話速変換倍率:
- 0.2倍~5倍
- モード:
- ファイル処理モード/フレーム処理モード(フレーム長設定可能)
- 対応ピッチ周期:
- 4ms~20ms(推奨値。アプリケーション側から変更可能)
- その他:
- 変換中に話速倍率の変更可能
税込価格
- ・話速工房 開発キット
- (話速工房CD-ROM+1ライセンス)252,000円
- ・話速工房 追加開発ライセンス
- (1ライセンス追加毎に)63,000円