クーの自由研究

素朴な疑問を実験します。ボクと一緒に螺旋階段を頂上まで登ってみませんか?貴方の影についていきます。

計算機音楽の自由研究(実験:その4.2)~位相がだめなら周波数削減してみる~

秋は月がきれい

こんにちは、こんばんわ。かえるのクーです。

f:id:np2LKoo:20170925235044j:plain

(c)アシストウィッグ

 

ヘアースタイルネタの「アイキャッチ」画像の流れに意味はありません。成り行きです。

 

実験4.1は位相削減の予定でしたが、準備段階で中止となりましたので欠番です。

位相の削減がだめなら、周波数の方を削減(間引き)したらどうなるかの実験をします。

ああ、まったく脈絡ないですが、ラズパイ欲しい!!電子工作してみたい!!

実験

周波数は12音階を基底にしていますが、これをもっと減らしたらどのへんで限界がくるのかやってみます。

12音階の場合、1オクターブは12等分(2の12乗根)単位に分割します。
これを9等分(2の9乗根単位)にしたり、それ以下にして再現性がどうなるかやってみます。

この実験は、「コレ自己ジャナイ符号」のパラメータをかえるだけですぐ可能です。

結果

オクターブ9音階の場合 ぱっと聞いた感じではそれほど劣化していないと思います。

オクターブ8音階の場合 すこしギターのカッティング音に歪がでてきます。

オクターブ7音階の場合 かなりダメです。

オクターブ6音階の場合 もう完全にアウトです。再現できない音がでてきます。

オクターブ2音階の場合 なぜかガムラン風になりました。例によって感受性の高い方は視聴をお控えください。ボクは嫌いじゃありません。(ちなみに、ボクは「現代音楽を聴いても気持ち悪くならないくスキル」を取得しています。)

ボクの鈍感な耳的には9音階の場合はほぼ12音階と同じに聞こえますので、多少マージンはある感じがします。12音階のほうは何度も貼ったので、改めて聞かれたい方は実験の方を参照ください。

考察

以上、より、基本周波数+位相変化で多少の周波数変動は追従可能ですが、基本音程の半音程度の変動には対応できない感じです。

なんやかんやで「ウェーブレット変換」の技を(音的に)事実上マスターしました。(マスターはおおげさですが、解析でも合成でも使えるようになりましたので、必要最小限の応用はできます。)*1

成果と実用性

いろいろ実験して「ウェーブレット」での符号化:周波数解析(フィルタ)と復号:(ウェーブレット合成)はことのほか性能がよいので、今後も「音の実験」での入力段や出力段に使用すると思います。

ウェーブレットの層の間に、本来の「自己符号化器」を入れて、どのように学習ができるのかを確認していければと考えています。

生物でたとえれば、「ウェーブレット」での符号化部分は「の蝸牛」(時系列周波数解析器)、復号化部分は「声帯(万能)」(音声合成器)に相当するともいえます。

「ウェーブレット変換」と「フーリエ変換」についてはこれで一区切りです。(フーリエ変換はほぼスルーです)

今後の実験の方向について

例えばですが、「ウェーブレット変換」でピアノの音(の特徴)を学習して、曲からピアノの音とそれ以外を分離することができるか。などについて挑戦したいと思います。あ、それもとも自分の声をお気に入り声優の声にしちゃうモーフィングやろうかなぁ。(やりたいことは山ほどあります。気が変わって別路線いったらごめんなさい)

道草しましたが、ようやく音の機械学習のスタートラインに立てる感じです

冬がくるまでかんばる!

 

ポキン金太郎な「かえるキャンディ」売ってました

f:id:np2LKoo:20170926002553j:plain

ではごきげんよう
達者でなァ

*1:ウェーブレット変換といっても離散系の「多重解像度解析」でいろんなことろを「離散で近似」しているのと、とっても冗長でもっと効率化できるはずのところが結構あります。(ウェーブレットも直交系ではなく普通のsin波にハン窓をかぶせたものです)「かなめ」は外していないと思っています。