フロイトローズはチューニングが「狂い」にくい
すでに標準の「ウェーブレット解析」からは分岐して独自進化(退化?)しているかもしれないと思っている、かえるのクーの助手の「井戸中 聖」(いとなか セイ)でございます。
ちなみにタコラの動画は「本当に放送されたもの」のMADです。狂気です。
さて、ギターについてご存じの方には常識かもしれませんが、エレキギターに「フロイトローズ」というチューニングシステム(ギター弦の両端の機器/しくみ)があります。このフロイトローズは、
・チューニングが極端にしにくい・時間がかかる。
・一旦チューニングが合えば、他の方式と比べ「とても」ずれにくい。
・トレモロアーム(音程を変える棒)をぐいんぐいん動かしてもほとんどチューニングが狂わない
・1本弦が切れると、全弦のチューニングが狂う。
(@ギター博士より)
という性質があります。他とかなり違い、チューニングだけでなく「音」も少し違った感じ(視聴上硬い・細いと言われる。倍音は少ない傾向にある。音は伸びないと感じる人と伸びると感じる人はまちまち(ブリッジの性能による)。エフェクターの乗りはとてもいいという人が多い。)があるので、好きな方と嫌いな方が極端に分かれます。
常々個人的にですが、自己符号化器の「学習」はこの「フロイドローズ的なチューニング」の感覚を強く感じます。(学習/チューニングは困難だけど、(弦が切れる以外の)変動にはロバスト/堅牢なところや、結果として全体で調整していることになる点など)
個人差はありますが、全弦のチューニングを20回から30回繰り返し(1弦チューニングするごとに全体チューニングがずれる!)、最後はファインチューニングで合わせる感じで、本当に時間がかかります。(慣れればあたりまえになり、全く苦ではありません)難点をいえば、「きわめて弦高(フレットと弦の距離)を調整しにくい」ことです。チューニングにより「弦高がかわるため」です。
(Wikipediaより)
ウェーブレット解析標準からの違いについて
習慣という怪物は、どのような悪事にもたちまち人を無感覚にさせてしまう。(@ハムレット)
実験・最適化により本ブログでは以下のようになってきています。
・単一のマザーウェーブレットの伸縮ではなく、位相や周波数を考慮したウェーブレット群を伸縮して使用している。(オクターブ的には伸縮していることになるが、同一オクターブ内では伸縮ではなく「周波数と位相を変更」している)
・マザーウェーブレットは教科書にでてくる各種の標準的なものではなく、単純にsin波にハン窓(cos波ベースの窓)をかけたものとしている
・フィルタの性能をあげるため、反転位相での検出(内積が負になる)は棄却する活性化関数(ReLU)を使用している(この点がとても自己符号化器的です。なお、バイアスは使用していません。)
・今回デコードに実測での補正(これは準備するウェーブレット群によりかわるが、ウェーブレット群が同じであればかわらない)を導入します。
自動測定補正してみます
ウェーブレット・デコードの補正倍率をします。1回の補正では補正しきれないことは前回までの確認でわかっているので、繰り返し補正をしていきます。また、発生が少ないとはいえ、「アーティファクトノイズ」は必ず発生するので、元の波形に合致するまでには補正しきれないことも認識しています。
早速やってみます。
いち番上が元波形(20Hz~24KHz~20Hz)のエンベロープ
2番目がそのままデコード(補正なし)
3番目がそのままデコードの歪(音圧をあわせたうえでの波形差)
4番目が1回補正をしたデコード
5番目が1回補正をしたデコードの歪
6番目が2回補正をしたデコード
7番目が2回補正をしたデコードの歪
....です。徐々に振幅差がなくなり、歪もすくなくなっているのがわかります。
補正の手順概略
補正は以下の手順で行っています。
(1)ウェーブレット群の周波数毎に補正値を準備し補正値を1.0とする
(2)元波形をエンコード・デコードして出力波形を得る。このとき、デコードには補正係数をかけてデコードする
(3)出力波形を再エンコードしてエンコード値を得る
(4)元波形のエンコード(強度)と出力波形の再エンコード(強度)の比を補正としてその逆数を現在の補正値にかける(これにより元波形に近づく補正値となる)
(5) (2)~(4)を所定の回数繰り返す
※なお測定評価のため、各回数でのデコード波形、歪波形を出力する
繰り返しの結果
上から、8回目補正(波形エンベロープ)、その歪、9回目補正、その歪、10回目補正、その歪 です。
なお、各歪の末尾が大きいのは、出力波形のいちばん最後が(実験用プログラムが不完全で)少し切れているためで、本来の性能問題によるものではありません。
補正により歪現象の確認
補正なしでのデコード歪(スペクトル)
補正ありでのデコード歪(10回調整補正を使用)
概ね14dB~19dB程度、かなり!改善されていることがわかります。
本来の目的
今回実験している部分は、生物的(もしくはギター的)にはエンコード部が「蝸牛器官」(内耳)(もしくはギターピックアップ&プリアンプ部)、デコード部が万能声帯(もしくはアンプ・スピーカー部)ととらえています。この部分が汎用的に完成すれば、あとは処理部分に注力できると思います。処理部分については、リアルタイム音声モーフィングと、万能ギターエフェクターを目指してみます!
基礎実験として「聴覚」はいい感じになったので、音声で再実験してみます。
その次は「視覚」(目と後頭部視覚野)についてウェーブレット(もしくはガボール)実装を試みます。
*1:オウレットは読書好きですが、ゴシップ誌「レイヴン」が好きなミーハーなところがあります。