音としての母音


話す能力と聞き取る能力は表裏一体にあるといえるだろうか。というのも人は話すとき体の振動や空気を伝って耳から自分の声を聞いているがそれが声の調音に何らかのフィードバックを与えているであろうから。しかし一方で、人は自分の本当の声を聞くことはあまりない。普段、自分の話し声はからだの振動を通して聞いているし、録音した自分の声に違和感を感じるならばまさのそれである。人の声を聞き取る能力について調べるととんでもないことがわかってくる。
NLM theory母語マグネット理論というのがある。これによると人は生まれてすでにあらゆる母音を聞分ける能力を獲得しているという。その数全部で13個。これが生後の言語環境によって聞分けることのできる母音の周波数成分分布が磁石に引き寄せられるように収束し、生後6か月にはすっかり固定してしまう。そうなると聞きなれた言語の母音の境界線がすっかり引かれてしまい、それ以外の区別が難しくなるという。マルチリンガルな耳というのは生後3-6ヶ月で決まってしまうのだ。これは言語を習得しようとする者には絶望的でさえある事実だ。

この話は酒井邦嘉著、言語の脳科学からの引用で、図は各国母音の分布とその境界線の様子である。英語もかなりのものだがスウェーデン語の母音の数といったらもう大変。ちなみにここで示されている分布、縦軸と横軸はフォルマント周波数と呼ばれるものだ。母音の音としてのスペクトルを見ると各母音ごとに特徴的な周波数が2つあるというものだ。それぞれを第一、第二フォルマント周波数と呼ぶ。基本的には前回示した発音記号一つ一つにこの特徴的な周波数の組み合わせがあることが想像できる。したがって日本語は相変わらず5つしか見当たらない。逆に言うと母音を特徴付けるのはたった2つの周波数の音に帰結してしまう。そう、この2つの音を同時に聞くとそれぞれの母音に聞こえるというのである。このような方法で音声を人工的に作ることは古くから試されており、フォルマント合成と言う名で知られている。

面白いことにこのフォルマント周波数、個人差、性別による差やずれはあるものの、一つの言語圏ではかなり収束することが知られている。さらに面白いことにこの二つの周波数は声の高さにも依存しない。人が歌うとき、メロディーを作る音程は音声のメイン周波数によって決まり、これは声帯の振動周波数そのものである。一方フォルマント周波数はと言うと、声帯の音からのど、はな、口腔内の様子や口の形でできる共鳴音なのである。言語として認識される音の要素成分が高い声でも低い声でも同じく認識されるのは、それは結果ではなく原因なのだ。声帯で声を出さず呼気によるささやきでも母音が表現できるのはそのためである。そうでないとすればどういうことか?低い声を高くするには録音した音声を早回しすれば簡単にできるが、それは「帰ってきたヨッパライ」(これがわからない世代には「はじめてのチュウ」か)のごとく変な声になるのである。何がおかしいかというとこのフォルマント周波数が移動してしまっているからである。それでもなお言葉として認識できるのは、周波数のずれがまだ許容範囲であるか?そう、世の中には「ヨッパライ」のような声を素で出せる人もいるので、子音はちゃんと聞き取れているからか?いずれにしても脳が十分に解読してくれているからである。

formant distribution japaneseこのフォルマント周波数が日本語でどうなっているか。Mokhtari and Tanaka (2000)に各母音のフォルマント周波数F1/F2の分布があるので引用する。被験者5人分がいくつかの単語を発生した時、各単語に含まれる母音のフォルマント周波数F1/F2をプロットしたのが左の図である。個人の中でも母音の周波数はある程度の幅を持って分布しており、また被験者間でも分布のずれがあるが、それぞれの母音を分別、特徴付けるに十分なほど収束していると言えるだろう。先に提示した母音の発音記号表で、最も遠いところにあったあ[a]とい[i]ではこの周波数分布でも決定的な違いが見られる。あ[a]はF1=700〜800Hz、F2=1200〜1400Hzと近いところにあるが、い[i]ではF1=250-350Hz(ほぼ音声のピッチ周波数)とF2=2000Hzという構成である。F1の周波数のばらつきあるいはバンド幅という意味では多くは100Hzほどのまとまっているが例外としてあ[a]のF1は個人レベルで広いようである。一方、F2はすべての母音で幅にして100Hzで示している。発音記号表での口の形や舌の位置と言うのは主観的でかなりわかりにくいが、実際の音声のフォルマント分析となると客観的である。発音記号表は発声の目安となるが、このフォルマント分析で評価することで確実に発声した母音の可否が判定できるのである。

negi参考文献
言語の脳科学、p282-285、酒井邦嘉、中央公論新社、2002
A Corpus of Japanese Vowel Formant Patterns. Mokhtari and Tanaka, Bulletin of the Electrotechnical Laboratory (2000), 64(special).pdfファイル
11 février 2008
13 février 2008 REV[A]


戻る

inserted by FC2 system