クーの自由研究

かえるのクーが素朴な疑問を実験して報告します。

計算機音楽の自由研究(準備:その2.9.3)~機械学習用サウンドデータベースをつくる(ど根性編)

これまでのあらすじ


北の方角から星間弾道遊星の攻撃をうけた赤丸星の科学者は、その制御技術向上により命中精度が各段に進歩していることに愕然とする。このままでは赤丸星の住人、すなわち蛙類はあと1か月で滅亡するという高精度の予測が提示された。別の研究により特定の音波の組み合わせ(楽器音に近いもの)が、「弾道遊星」の制御に用いられているとされる、疑似神経様物質の制御を狂わすことが明らかになった。神経様物質は「音」に対しての非常に敏感な解析特性を示し、制御よりも音波の解析を優先してしまうことにより、「弾道遊星」の軌道制御システムが崩れるのであった。この「音波」の組み合わせを重力波を含むあらゆる帯域のエネルギー波にして放射する迎撃システムに組み込むべく、対遊星迎撃システムの中核をなす「サウンドデータ」を早急に創生しなければならない。それは60000音以上の楽器音が一定のまとまりと、ばらつきをほどよく以て構成されている必要があるという。


f:id:np2LKoo:20170602001056p:plain

このページのおはなしのヒロインを演じる「モリあおがえるのユキちゃん」

スレンダーな美少女です。

エストラインが魅力です。


はたして蛙類はサウンドデータベースを期限内に完成し、滅亡から逃れることができるのであろうか。

蛙類滅亡まで あと 22

現在 4,840音 / 60,000音 (8.1% / 約18.6%ぶんの遅れ)


6/2 それは理論でも技術でもない。心:精神である。

前のぺージがいっぱいになってきたので、6月はこのページで進み具合を報告します。あいかわらず、しばらくは「はてな自体の」日記形式無視ですすめます。あしからず。

今日は音源を探しました。KONTAKT Player(無償版)とライブラリ(無償版)をいれましたが、評判通り音がいいですね~。YAMAHA Motif系の音はKONTAKTのデモ版があったので使えそうか確認していました。デモ版は15分の使用時間制約があるようですが、どうにか使えそうな気がします。

6/3 勇気ある決断

善意の解釈では思考実験、醒めた視点では単なるギミック、批判的な分析では思考錯乱、診療的見地では〇〇病と思われるかもしれませんが、はじめてしまったものはしかたありません(開き直りの境地)。このページはこのお話の路線でいきます。(どう書いてもつまらないフェーズなので)


データベースも創生手法が確立し、軌道に乗り始め5%程度進んでいる。創生の効率化を検討している矢先に大きな問題が発覚した。

創生済のサウンドデータを入手・培養した「疑似神経様物質」に学習させたところ、まだデータ数が少ないとはいえ、いとも簡単に解析が完了し、このまま進んでも「遊星兵器の制御システムを継続的に攪乱させることができない」可能性が高まった。原因の分析結果をもとに戦略会議がひらかれた。


サンプラー音源を元にしているが、3~4音を同一の「サンプリング波形」から周波数だけをかえて音を出しているものがほとんどで、解析にほどよいばらつき」がでない。(楽器としてはこのようにしたほうが効率的で、演奏をさせると違和感がほとんどないケースが多い)

同一のメーカー系列では「波形」の使いまわしがある程度あるようで(上位互換や評判のいい音を後発のサンプラーにそのまま使うなど流れとしてはあたりまえではあるが)、機材をかえてもメーカが同じであれば「同じような音」もありバリエーションに乏しい

・一連の音を録音する場合にリバーブなどのエフェクトや音の強さを一定にして録音している。(フォルテならVolme=127固定にするなど)サンプラーによっては音の強さを変えると音のキャラクターを微妙に調整し、リアリティを増すものが多いが、バリエーションとしてその機能が使えていない*1

例えばピアノの音は周波数の違いもさることながら、『この音は「ピアノ」的と判断できる範囲の音をできだけ広範囲に、ある程度わざとばらつかせながらまんべんなく網羅する。』必要があります。基本的周波数の違い(:シフト)がポイントではなく、時系列で変化する相対的な周波数の組み合わせが重要なのです。この状況(サンプラーの音があまりに貧弱で、たとえばピアノの音に感動するくらいのピアノらしい音がない。ただし「どうにかピアノにきこえないこともない音」はこのデータベースでは網羅性の観点で結構貴重)では、スタジオ巡りをして生音を録音して回りたい衝動に駆られます。ですが、時間はやまほどあるが、お金がない。いや今回の設定では時間がない!!そこで。。。

別メーカの音源を追加で探す。

■網羅性の観点から、もっとひどい音のサウンドフォントも探す(これは探せばたくさんある認識)

■採用するより多くのサンプリングをあつめ、きわめて似たキャラクターのサンプリングセットは除外する。(オーディションする

■1音ごと「ある程度」ばらつくよう、音のエフェクトと音の強さをばらつかせる。(フォルテならVolume=100から127のランダム値、リバーブMIDIでリアルタイム調整できる場合は±30%程度ランダムにばらつかせる。)


「ここが引き返し可能の最終点かもしれない。。。」
長老蛙たちの会議はなかなか結論がでなかったが、ついに最高司令蛙は皆の前で宣言した。
沖田司令蛙:「もういちど初めからやりなおそう!我々は生存確率が最も高い方法を選択する。」
モリあおがえるのユキ:「古代クン、いえ、クー!あなたに蛙類の未来は託されたわ。」
古代かえるのクー:「ボク、がんばる!」

こうして改めて「サウンドデータベース(真)」の創生が開始されたのであった。

はたして蛙類は生きのびることができるのであろうか。

蛙類滅亡の日まで、あと27日

(つづく)


というわけで、リアルタイムにリバーブ等を調整するよう各機材のMIDIのインプリメンテーションチャートとにらめっこしています。さすがに全然わかりません。CM-32Pは全部MIDI経由でコントロールする必要があるので、たいへんです。(ボリュームと電源ボタンしかない。ディスプレイもない)SOUND CANVAS VAがあったのでノイズのひどいSC-55mkIIはあきらめてVSTから録音します。CM-64/32系の音もSOUND CANVAS VAにはいってはいますが、「一部」の音だけなので、CM-32L/P系の音は実機からがんばって録音します。

6/5 心機一転

もういちど、最初からやりなおしています。MIDI機器を制御するためのエクスクルーシブメッセージやコントロールチェンジについてはかなり熟練してきました。PythonMIDI制御をごりごりコーディングしています。MIDIインプリメンテーションチャートがあれば、だいたいの機器はコントロールできる感じになってきました。ボクの学習能力も捨てたものではありません。ソフトとハード機材ではコントロールの考え方が結構違うのでそれ毎にコーディングなので大変です。(ソフトはコントロールチェンジをマッピングして対応するものが多く、ソフトの設定にも手間がかかります。)

1音ごとに、エフェクト(おもにリバーブ、コンプレッサー、イコライザー系の元の音を破壊しないでやんわり変える系)を変化させてかけ、前後の音と「あえて」別な感じにしてばらつかせています。(エフェクト設定変更もMIDI制御です。) 音の録音時に(エフェクト系の)設定と確認(音のかぶりや処理結果)が増えてしまったので、以前にもまして進み具合が悪いです。その都度の設定もさることながら、リバーブ系の音が次の音にかぶり、音の開始検出に失敗することが多々あり、そのたびにパラメータを調整してやりなおすので、時間がかかっています。このままでは今月中に完了できそうにありません。何か対策を立てないとやばいですが、今のところ気力で乗り切るくらいしか思いつきません。。。

6/6 「46のガマ作戦」

もう引退したマシンに、(つかえるかどうかわかりませんが)Windows10の評価版をいれてみます。OSソフト自体は認証なしで1ヶ月使えると思いますが、問題はスペック的に音が途切れないで録音できるかどうか、(それよりそもそもWindows10が動くかどうか)です。やってみます。ちなみに現在1台(現役マシン)で録音していますが、あと3台増やして4台にします。それらしい名前をネットで検索し、コードネームを「46のガマ作戦」と命名しました。(サテお立合い。1台が2台。2台が4台。4台が。。。:ちなみにIT業界の計算方法では1人で60000分かかる仕事は60000人でやれば1分で終わるそうです。IT(業界)ってすごい!)ATOM機(Celeronですらない)でどこまでできるかわかりませんが、何事も挑戦です。早速インストールでつまずき中です。吉とでるか凶とでるか。。。あと、音源の追加のほうは、「KONTACT」の目途がつきました。助手の知り合いでKONTAKT/KOMPLETEの(半額キャンペーンの)注文をした人がいて協力いただくことになりました。

 

6/7 ボクの悩み事 解決するです?

上の記事はまさにボクの(リアルの)悩み事そのものです。「●経験的モード分解(不完全)」は初めて知りました。ウェーブレット変換しかないかなぁ。。。と思っていたので、とても参考になりました。どうも有難うございます。

さて、IT業界の人に聞いたら『「炎上プロジェクト」に人を大量投入したら、初期習熟(教育)コストで一層破綻し、全体統制がますます効かなくなる。火消しができるくらいの精鋭熟練者あつめないでどうするよ!!』は、IT現場あるあるだそうです。

ちなみに、ATOM機はいまだにディスク認識できずに停滞中です。始まる前に作戦失敗のきざし。。。→ソフトが原因とおもっていたらハードが原因だったあるあるでした。DISKのSATA電源が不安定(接触不良?)で別系統のSATA電源ケーブルをつかったらあっさり解決しました。→インストール完了。。。

机の上には3つのディスプレイと、4つのキーボード(うち一つは楽器)と、3つのマウスが並んでデイトレーダのようになりました。ヘッドフォンが1個しかないのが欠点です。(あと1台は別の部屋)

録音マシンではPythonは3系しか使わないので、AnacondaとPycharmを入れます。波形確認用にSoundEngine FreeとAudacityを入れます。SoundEngine FreeとAudacityは特定の目的で使い分けると便利なので両方入れます。あとで似たような環境をつくることもあるかもなので、何を入れたかメモしておきます。


OS:Windows 10 (64Bit): ダウンロード版(去年ダウンロードしたものを持っていましたが、3月下旬の時点のパッチ適用版に更新されているので、そちらを使いました。

アーカイブソフト:lhaplus

サウンド確認用:SoundEngine Free / Audacity

ASIOを使えるようにする:ASIO 4 ALL または USB Audioのドライバなど

ASIO動作確認用/録音用:SampleTank2 (Freeまたは10日お試し版)

Python環境:Anaconda (最新版 4.4.0/Python3.6だった)

開発環境(IDE):Pycharm Community(2017.1.3版)

・easy_install.exe pip (pipを使えるようにする)

・anaconda3とanaconda3\Scripts にpathを通す

・pip install pyaudio  と pip install  pygame

MIDI IN とMIDI OUTをMIDIケーブルで直接結線。あ、


6/8 なにかが足りない! 

やばい。この録音方法はMIDIインターフェースが必須なのでした。そしてボクはMIDIインターフェースを2つ持っています。録音に使いたいパソコンは4台です。さて、MIDIインターフェースがないと動作しないことに今まで気が付かなかったのは、何が足りなかったからでしょう???答えは秘密です!

助手に相談したら、RS-232C-MIDI変換ドライバを入れて2つのCOMポートをクロス接続(実結線)すれば、MIDIインターフェースがなくても動作させられる。と助言をもらいました。よくわかりません。

Windows10で動作しないといわれる昔のオーディオインターフェイスカード(MIDI付)でも、MIDI部分だけは動作する「かも」しれないとのことなので、昔のインターフェースカードを発掘中です。

助手からは「定義したあとは放っておいても次々に、1日中録音するようなしくみにしないと厳しいのでは?」との意見ももらいました。貴重なご意見有難うございます。a

6/9 縄文土器「こわれもの」「危機」どっちが好き?どっちもYES


真田技術蛙長:「このままでは到底今月中に完成することはできない。これが死守すべき進み具合のグラフ。。そしてこれに実際のグラフを重ねると。」

「・・・。」どこからともなく深いため息が漏れ、作戦会議には絶望とも言える重い空気が流れた。

沖田司令蛙:「なんとかならないのか・・・このままでは・・・」

真田技術蛙長:「現場のほうでは4倍の速度で作成する方法を模索したのですが、技術的な壁があり目途がたっていない状況です。私に秘策がひとつだけあるのですが、ただ・・・」

沖田司令蛙:「なんだね?言ってみたまえ。」

真田技術蛙長:「いままで成功例が1例しかなく、たいへん危険な方法なのですが。。。次元圧縮という禁忌の技法があるのです」

沖田司令蛙:「続けてくれ。」

真田技術蛙長:「我々はご存知のように4次元の世界に生きています。時間と空間的3次元をあわせて4次元です。目的達成のためにこのうちの1次元を圧縮して物事の本質・特徴を浮き彫りにする手法です。これを生身の蛙に適用するのです。」

説明は続いたが、ついに沖田指令蛙は最終決断を下した。

「これで学習能力・知的能力が飛躍的に向上し、解決できるめどがつくのなら。。。」

翌日、皆の期待のもと、次元転換装置の扉はあけられた。はたして成功なのか?

2次元という平面に次元圧縮された「古代かえるのクー」は皆の前に颯爽と姿を現した。

古代"平面"かえるのクー:「根性、根性。ど根性!!」

皆の表情は凍り付き、気を失うものもいた。どうしてTシャツに張り付いているのか疑問を呈するものもいた。

はたして蛙類に未来はあるのか。

蛙類滅亡の日まであと21日。。。


(編集部より) 連載休止のお知らせ。ご愛読いただいております「宇宙音感 ア・バオア・クー」は都合によりしばらく休止となります。誠に申し訳ございません。

再開ができるようになりましたら、改めてお知らせいたします。


1週間ばかり(リアルな)旅にでることになりました。その間データベース作成は休止となります。地道にやっていたのでは間に合わないことが明白ですが、まだあきらめたわけではありません。きっと、小人さんまたは妖精さんがなんとかしてくれます。

小人さんどうも有難う!RWC 研究用音楽データベース「楽器音データベース」(50 楽器, 29.1 Gbytes)ボクの探していたのはコレかもしれない。いや、まさにコレだ。

RWC研究用音楽データベース: 楽器音 15,000円 収録91時間

「例えば,RWC-MDB-I-2001 No. 01 のピアノでは, 3メーカー(Yamaha, B¨osendorfer, Steinway)のピア ノで,88鍵すべての鍵盤を,それぞれ4奏法(ノーマ ル,スタッカート,ペダル,同音の連打)で,強,中, 弱の3段階の強さで弾いたものを収録した」

おおお!本物だぁ

後藤真孝先生のページはみていたのに何で気が付かなかったのでしょう。(何か足りない!)

ほかにも

McGill University Master Sample」DVDなら3枚セット:入手方法未確認:もしかして有名図書館なら所蔵していて借りられるのかな?

Iowa Musical Instrument Samples」ホームページから$10以上の寄付と研究・利用目的を書いてダウンロードの模様です。

暫く悩んでみます。

 BGM:セカイシックに少年少女 / After The Rain (そらる×まふまふ)

 

*1:エフェクターの使用は原音重視の観点からは微妙ですが、ピアノや弦楽器はホールも楽器の一部(楽器からすればエフェクター)であるともいえると思います。実際サンプラー音は「エフェクター」を使ってはじめてそれらしい音に聞こえるものも多いため、積極的に使って調整する方向で考えます。エフェクターのパラメータも当然ばらつかせます。