STRAIGHTメモ:その3 フォルマント周波数の推定_1

その1,STRAIGHTの導入
その2,音声関係の用語


今回は内容を一気に飛躍して,フォルマント周波数の推定ってのを頑張りたいと思う.
その2で説明した用語は,説明なしで使う予定.

フォルマント周波数とは?

フォルマント - Wikipedia
雑句把覧に説明してしまうと,フォルマント周波数(F1,F2,F3,...)がわかれば,音声Aが何の母音か大体わかる.
つまりフォルマント周波数とは,母音(細かくいうと音韻?)の特徴とも言えるようです(専門的に言うと誤りかも).


一応,フリーのソフトでも推定できるが,今回は自作する.
補足:WaveSurferを使うと推定できる.(画像1)
なお推定されたフォルマントは,スペクトログラム上の赤,緑,青,黄の線だ.

(画像1)

フォルマントは下から順に,F1,F2,F3,F4,...と呼ばれる.
画像では,赤線がF1,黄線がF4だ.

フォルマント周波数の推定について

調べた限り,主な方法は二通り.

  • 線形予測法(LPC)
  • ケプストラム分析


線形予測法はパラメトリックな手法で,ケプストラム分析はノンパラメトリックな手法.
補足:パラメトリックな手法とノンパラメトリックな手法


今回は,STRAIGHTを用いる.つまり,予めスペクトル情報を得られているので,ケプストラム分析を行う.
というより,単純に線形予測法を実装したプログラムがまだ書けないから,ケプストラム分析しか使えない.


スペクトルのピークがフォルマント周波数である可能性が高いので,
画像2で赤丸をつけたような,スペクトルのピークを探してやればいい.

(画像2)


しかし,STRAIGHTで与えられるスペクトル情報は,
画像3よりは平滑化はされているものの,細かいピークが多いので,
これをさらに平滑化して,画像2のような滑らかなものにする必要がある.

(画像3)


この続きはまた次回.