HOME > natural science Laboratory > 学会へ行こう!プロジェクト > 研究開発テーマ > 視覚・聴覚刺激の統合によるヒトの動的な適応性の最適化

【第2回】五感ってなんだろう? ―音の3次元空間における認識

文責:林 叔克 (2008年4月21日) カテゴリ:視覚・聴覚刺激の統合によるヒトの動的な適応性の最適化(3)

ふとした疑問から始まる、週末研究。 人は音がどこから聞こえてくるか、どのように認識しているのだろうか? 空間の中で、音の発信源を認識する仕組みにせまる。人間の主観的な思いこみをどこまで客観的に表現できるのか、研究はつづく。


研究の背景

人間は空間において音源の位置を認識しているが、どのような仕組みで音源の空間配置を認識しているのだろうか? 音とは空気の振動のことであり、波の強さと周波数によってあらわされる。空気の振動が耳の鼓膜に伝わり、鼓膜の振動が聴覚細胞に伝わることで、音が認識される。音源からくる空気の振動から、どのように音源の場所を認識しているのだろうか。耳がふたつあることを考えると、左右の耳に入る音の大きさによって、音源の空間認識が生まれている事は、実験によって確かめられた。これは当たり前のように思える。そこで、左右の耳に異なった位相の音を聞かせて、どのような認識が生まれるかを実験した。


実験手法 1.位相の相違による音源の認識の実験 ひとつの周波数

LABviewによってプログラムを組み、パソコンからイヤホンに音を出力する。イヤホンをつけた被験者に左右の音の位相の差異によって、どの方向から音が聞こえているように感じるかを答えてもらう。

実験の手順
1.周波数500Hzのサイン波をつくる
2.以下の位相のパターンをランダムに左右の耳に出力する
パターン1.左:y=sin(wt) 右y=sin(wt-π/2)
パターン2.左:y=sin(wt) 右y=sin(wt)
パターン3.左:y=sin(wt-π/2) 右y=sin(wt)
パターンの切り替えは、4秒ごとにおこなった。

3.左右から聞こえる音の位相パターンに応じて、
・音源に方向性がないように感じれば、「なし」と答える
・左に音源があるように感じれば、「左」と答える
・真中に音源があるように感じれば、「真中」と答える
・右に音源があるように感じれば、「右」と答える

4.ランダムに出力した位相のことなった音の組み合わせと、被験者の答えとを照らしあわせて、音のパターンとの一致した率を測定する。


実験手法 2.位相の相違による音源の認識の実験 人の音声

「おーい、ここだよ!」という人の声をサンプルし、ヒルベルト変換により、位相がπ/2遅れた音を生成した。パソコンからイヤホンに以下の組み合わせて音を出力した。イヤホンをつけた被験者に左右の音の位相の差異によって、どの方向から音が聞こえているように感じるかを答えてもらった。

実験の手順
1.「おーい、ここだよ」という人の声をサンプルする
2.以下の位相のパターンを左右の耳に出力する
パターン1.左右同位相
パターン2.左耳への出力をπ/2遅らせる
パターン3.右耳への出力をπ/2遅らせる

3.左右から聞こえる音の位相パターンに応じて、
・音源に方向性がないように感じれば、「なし」と答える
・左に音源があるように感じれば、「左」と答える
・真中に音源があるように感じれば、「真中」と答える
・右に音源があるように感じれば、「右」と答える

4.ランダムに出力した位相のことなった音の組み合わせと、被験者の答えとを照らしあわせて、出力した音のパターンとの一致した率を測定する。


LABviewによるプログラミング

LABviewにサンプルにあるGenerate Sound.viというファイルを変更した。左右のイヤホンから、大きさや位相の異なった音を左右のそれぞれのイヤホンに出力するために、4種類の音の波の波形が出力できるように、sin関数のy軸に対する大きさや位相を変え、配列に代入した。LABviewの列挙体という条件分岐を使って、出力する音のパターンの音を選択した。今回はさらに左右の耳への音の出力パターンを自動的に生成するプログラムを書いた。LABviewの音出力の機能は、1秒ごとに次の音のパターンを読み込んでいくので、これを4秒間同じ音のパターンを出力するようにプログラムを書いた。




実験結果と今後の実験計画

20代の被験者3人に実験を行った結果を以下にまとめる。左右の耳にランダムに出力した位相のことなった音の組み合わせと、被験者の答えとを照らしあわせて、音のパターンとの一致した率を測定した。

・周波数の成分がひとつである音を出力した場合と人の声を出力した場合を比べると、人の声の場合の方が、被験者解答の整合性が高かった。若干の個体差が見られるが、人の声の場合、音の出力パターンと解答に90%以上の整合性がみられた。人の声には様々は周波数成分が混じり合っているので、音源に対する空間認識が高まったといえるのではないか。しかし音の空間認識が人の声に対して、どこまで特異的かはわからない。そこで何種類かの周波数成分を重ね合わせて出力し、どのように周波数を組み合わせれば、最も音の空間認識うまれるのかを実験する。 

・片側の耳への出力を500Hzにし、もう一方の耳への出力を450Hzから10Hzごとに上げていったところ、20Hz以上の周波数の差は「和音」として聞こえるが、周波数の差が20Hz以内になると「うなり」として聞こえてくるようになる。脳の神経系のレベルで音の波の合成が行われるのであろうか。また1Hzの周波数の差も「うなり」として認識できることがわかった。

・音の空間認識において、左右の耳への音の到達時間の差を知覚している可能性を考えてみた。音速を300m/sとすると、左右の耳の間の距離(30cmとする)においての到達時間の差は、1m secになる。これは一般的な神経の伝達速度に比べて速いので、左右の耳における音の到達時間差を知覚している可能性は低いと考えられる。


問題点と改善点

・左、右と答えさせるのは、聴覚の認識を言語の認識でとらえなおさないといけないので、4秒ごとに音源の方向性の認識が難しくなる場合がある。そこで、音の方向性の解答を被験者がキーボードから入力することを考える。

・現時点では、周波数を500Hzとしているが、周波数を変えた実験も行う。音量についても一定の基準をもうけて、実験する。

・4秒ごとに自動的の音の出力パターンの切り替えをおこなっているが、この時間間隔がはやいと感じるか、おそいと感じるかに主観的な差がでる。そこで、自動的に音の出力パターンを変えるのではなく、たとえば「ボタンを押したら音をかえる」というように能動的に出力パターンを変えていく方法も考える。

・音の位相差として、π/2ラジアンを使っているが、500Hzの音が左右の耳の間の距離でづれる位相は、およそ0.5ラジアンである。位相差を実験パラメータとして考えることが今後、必要である。

・位相が急に変わると、クリック音が出てしまい意識が、クリック音にとらわれてしまう。そこで正弦波にガウス分布をかけて、一度、消音してから、次の正弦波を音として出力する方法がいいのではないか

・パルス波をづらしていくと、ふたつ音源があると感じる状態から、空間における音の認識がはじまるのではないか。



▲このページのトップNPO法人 natural science トップ

▲このページのトップNPO法人 natural science トップ