STRAIGHTメモ:その3 フォルマント周波数の推定_1
今回は内容を一気に飛躍して,フォルマント周波数の推定ってのを頑張りたいと思う.
その2で説明した用語は,説明なしで使う予定.
フォルマント周波数とは?
フォルマント - Wikipedia
雑句把覧に説明してしまうと,フォルマント周波数(F1,F2,F3,...)がわかれば,音声Aが何の母音か大体わかる.
つまりフォルマント周波数とは,母音(細かくいうと音韻?)の特徴とも言えるようです(専門的に言うと誤りかも).
一応,フリーのソフトでも推定できるが,今回は自作する.
補足:WaveSurferを使うと推定できる.(画像1)
なお推定されたフォルマントは,スペクトログラム上の赤,緑,青,黄の線だ.
(画像1)
フォルマントは下から順に,F1,F2,F3,F4,...と呼ばれる.
画像では,赤線がF1,黄線がF4だ.
フォルマント周波数の推定について
調べた限り,主な方法は二通り.
- 線形予測法(LPC)
- ケプストラム分析
線形予測法はパラメトリックな手法で,ケプストラム分析はノンパラメトリックな手法.
補足:パラメトリックな手法とノンパラメトリックな手法
今回は,STRAIGHTを用いる.つまり,予めスペクトル情報を得られているので,ケプストラム分析を行う.
というより,単純に線形予測法を実装したプログラムがまだ書けないから,ケプストラム分析しか使えない.
スペクトルのピークがフォルマント周波数である可能性が高いので,
画像2で赤丸をつけたような,スペクトルのピークを探してやればいい.
(画像2)
しかし,STRAIGHTで与えられるスペクトル情報は,
画像3よりは平滑化はされているものの,細かいピークが多いので,
これをさらに平滑化して,画像2のような滑らかなものにする必要がある.
(画像3)
この続きはまた次回.