事例紹介

信号処理アプリケーション

適用業務:音声処理

ユーザー ニューヨーク市立大学(CUNY)グラジュエート・センター(Graduate Center)/音声科学、聴覚科学
会社概要 ニューヨーク市立大学グラジュエート・センターには、世界最大の音声科学と聴覚科学の専攻科があります
所在地 米国ニューヨーク州ニューヨーク


課題

音声科学と聴覚科学の学生は、従来、テープレコーダー、信号発生器、アンプ、オシロスコープ、音響スペクトログラフ、そしてテープの継ぎはぎ等に精通している必要がありました。彼らは、今日さらに、音声のデジタル解析、保管と処理に堪能であることが必要です。それらの概念的基礎は、数学とエンジニアリングの知識ですが、大部分の学生は、それらの知識が不十分な聴覚科学と音声病理学(speech pathology)の出身者です。

技術系以外の人々のためのソフトウェアツール

ニューヨーク市立大学(CUNY)のGraduate Centerには、世界最大の音声科学と聴覚科学のアカデミック・プログラムがあります(約60人の在籍者)。アーサー・ブースロイド博士(CUNYの音声・聴覚科学の教授(Distinguished Professor))は、技術系以外の学科出身の学生に技術的なツールを提供するといった問題にしばしば直面していました。彼は、学生に視覚的で、計算に強く、かつ学習し易いソフトウェア環境が提供されることを望みました。

問題の解決

ブースロイド博士は、DSP社のDADiSPを選択しました。DADiSPは、学生が基本的な概念を把握すること、及び先進的な研究を実行することの両面で役立っています。

音声のサンプリング

CUNYの音声・聴覚科学の研究者は、DADiSPをパソコンで動かしています。彼らは、大部分のアプリケーションでは、20kHz、及び12ビットで音声をサンプリングしていますが、データ収集ボードは、モノラルとステレオで、16ビット、22kHzないし44kHzでサンプリングできるものを使っています。彼らは、D/AとA/Dのために現在データ変換ボードを使っています。彼ら自身で考案したアナログ出力インターフェースには、アンティ・イメージングフィルタとパッシブ・アッテネータで終端された低ノイズ、低歪みアンプが組み込まれています。このインターフェースは、聴覚障害をもつ人々に対して役立つ高出力レベルの発生機能など、市販されているインターフェース・ボードに比べてかなり高性能なものになっています。

垂直のライド加速度データ
 

音声波形の処理

ブースロイド博士は、音声・聴覚科学の研究室で学生にフーリエ解析と音声合成を説明するのに、DADiSPを使っています。最初に、DADiSPは、正弦波の生成とその追加の実習に使われています。次の実習では、波形の乗算や振幅変調のスペクトルの表示が行なわれます。これらの話題は、聴覚科学、音声科学及び聴覚学(audiology)における種々の問題と関連があります。それらは、内耳における周波数分析、テスト・トーンのスペクトル・スプラッター、そして補聴器の非線形性によるハーモニック・相互変調歪み等が含まれます。ブースロイド博士は、『学生はDADiSPにより結果をすぐ視覚化できるので、学習と理解を大いに速めることがでる』と言っています。

問題の解決

刺激−反応分析

CUNYの学部学生も、音響心理学の分野で、つまり音声による刺激と音声に対する感覚の関係の研究にDADiSPを使っています。音響心理学の実験は、一般的に、患者の反応に依存する小さく段階的に変化するような特性の刺激の生成を必要とします。刺激は、この研究の初期段階ではアナログ機器で制御・発生されました。しかし、最近、アナログシステムのデジタル制御から完全なデジタル化に移行されました。ブースロイド博士によると、『DADiSPによって、学生は、一つの特性に従って正確に変化する一群の刺激を発生することができるようになり、それによって、この仕事を容易に始められるようにしました』。新しい16ビット マルチメディア・ボードは、学生がコンピュータとヘッドホンのみで音響心理学の研究を行なえるようにしました。またそれにより、彼らは、学校と病院の現地での研究ができるようになりました。この自由度は、実験が器材でいっぱいのラックを使い研究所内で行う必要があった時代に比べ大きく改善されました。

 

オフラインの音声処理

補聴器の研究は、音声・聴覚科学の重要な応用分野です。CUNYでは、DADiSPは、非線形の補聴器がどのように音声の特性に影響するかの研究に用いられています。音声信号は、非常に複雑なので、非線形の補聴器がどのように反応するかを正確に予測することは難しいことです。CUNYの研究者は、個々の音声の主要なパラメータのスペクトル分布を測るための技術を開発しました。音声サンプルは、記録されて、DADiSPワークシートにインポートされます。そこで、振幅スペクトルが計算されて、BASICプログラムにエキスポートされます。このプログラムは、移動3次オクターブ・ウインドウのエネルギーを積分し、その結果をDADiSPに返します。一語または一音のいくつかのトークンのスペクトルは、平均をとられ、そして、主要な領域の周波数と強度は、望ましい分布を得るために結合されます。CUNYの音声・聴覚プログラムでは、DADiSPは、リアルタイム処理のソフトウェアを開発のためにデジタル信号処理アルゴリズムを試作するために用いられています。一度、ワークシートがセットアップされると、研究者は、一度に、1語または1フレーズの記録音声をインポートします。そこから、処理されたバージョンは、オフラインの聴覚試験機にエキスポートすることができます。

DADiSPは、教育と研究にとって非常に効果があります

CUNYの音声・聴覚研究室でのDADiSPの用途は、この分野での研究の方法に革命をもたらしました。ブースロイド博士は、『DADiSPは、教育と研究のツールとして非常に効果があることがわかりました』と言っています。