秋は月がきれい
こんにちは、こんばんわ。かえるのクーです。
(c)アシストウィッグ
ヘアースタイルネタの「アイキャッチ」画像の流れに意味はありません。成り行きです。
|
実験4.1は位相削減の予定でしたが、準備段階で中止となりましたので欠番です。
位相の削減がだめなら、周波数の方を削減(間引き)したらどうなるかの実験をします。
ああ、まったく脈絡ないですが、ラズパイ欲しい!!電子工作してみたい!!
実験
周波数は12音階を基底にしていますが、これをもっと減らしたらどのへんで限界がくるのかやってみます。
12音階の場合、1オクターブは12等分(2の12乗根)単位に分割します。
これを9等分(2の9乗根単位)にしたり、それ以下にして再現性がどうなるかやってみます。
この実験は、「コレ(自己)ジャナイ符号化器」のパラメータをかえるだけですぐ可能です。
結果
オクターブ9音階の場合 ぱっと聞いた感じではそれほど劣化していないと思います。
オクターブ8音階の場合 すこしギターのカッティング音に歪がでてきます。
オクターブ7音階の場合 かなりダメです。
オクターブ6音階の場合 もう完全にアウトです。再現できない音がでてきます。
オクターブ2音階の場合 なぜかガムラン風になりました。例によって感受性の高い方は視聴をお控えください。ボクは嫌いじゃありません。(ちなみに、ボクは「現代音楽を聴いても気持ち悪くならないくスキル」を取得しています。)
ボクの鈍感な耳的には9音階の場合はほぼ12音階と同じに聞こえますので、多少マージンはある感じがします。12音階のほうは何度も貼ったので、改めて聞かれたい方は実験の方を参照ください。
考察
以上、より、基本周波数+位相変化で多少の周波数変動は追従可能ですが、基本音程の半音程度の変動には対応できない感じです。
なんやかんやで「ウェーブレット変換」の技を(音的に)事実上マスターしました。(マスターはおおげさですが、解析でも合成でも使えるようになりましたので、必要最小限の応用はできます。)*1
成果と実用性
いろいろ実験して「ウェーブレット」での符号化:周波数解析(フィルタ)と復号:(ウェーブレット合成)はことのほか性能がよいので、今後も「音の実験」での入力段や出力段に使用すると思います。
ウェーブレットの層の間に、本来の「自己符号化器」を入れて、どのように学習ができるのかを確認していければと考えています。
生物でたとえれば、「ウェーブレット」での符号化部分は「耳の蝸牛」(時系列周波数解析器)、復号化部分は「声帯(万能)」(音声合成器)に相当するともいえます。
「ウェーブレット変換」と「フーリエ変換」についてはこれで一区切りです。(フーリエ変換はほぼスルーです)
今後の実験の方向について
例えばですが、「ウェーブレット変換」でピアノの音(の特徴)を学習して、曲からピアノの音とそれ以外を分離することができるか。などについて挑戦したいと思います。あ、それもとも自分の声をお気に入り声優の声にしちゃうモーフィングやろうかなぁ。(やりたいことは山ほどあります。気が変わって別路線いったらごめんなさい)
道草しましたが、ようやく音の機械学習のスタートラインに立てる感じです
冬がくるまでかんばる!
ポキン金太郎な「かえるキャンディ」売ってました
ではごきげんよう
達者でなァ