読者です 読者をやめる 読者になる 読者になる

クーの自由研究

かえるのクーが素朴な疑問を実験して報告します。

計算機音楽の自由研究(準備:その2.5)~改めて音を情報として扱う基礎を復習する

 

はじめに

サウンドを本格的に扱うにあたり、基礎知識を整理雑記します。いろんな本を読みましたが、単なる備忘録でおもいつきの羅列のため、正しい理解に興味のある方はリンクの方を参照ください。(本当は実験をしてないのでネタがないだけです。穴埋めのため、内容は薄いです。ごめんなさい。)

f:id:np2LKoo:20170427213540p:plain

今時点でわかっていること、わからないことを愚直に再入門のつもりで書いていきます。

なお、前回のピアノ音のサンプリング解析は「(音の)不確定性原理」にひっかかり停滞中です。

音とは何か

・あるものに衝撃やエネルギーを与えるとそれが振動になり、空気や液体、あるいは個体などの媒体を波として伝搬して他へ伝わるものです。
振動が隣接する媒体の粗密の揺らぎ:波(分子の位置変動)を発生させ、それが伝わります。(粗密波:縦波)
気体の場合は周波数の高い気圧の微小変化とも解釈できます。

音を聞く

生き物は生存のため、いろいろなセンサーを開発してきました。とりわけ目は優れた器官で、特に深海にも行けるイカは微小な発光や反射を検出できるよう、大きな目をもっています。(生きているダイオウイカの目の眼力はすごいです!)目については改めていつの日にか考察するとして、視覚の次に重要なのは一般的には聴覚といえるでしょう。

だいたいの生物は縦波を耳(鼓膜)などの器官で音を聞きます。(耳については書いたことがあるので省略します。物理的にフーリエ変換することがミソです)
測定方法により各種データがありますが、人間で20Hz~20KHz(ただし個人差と年齢差は大きい)、イヌで15~60kHz、ネコで25~70KHz、イルカ類で70Hz~150KHz、クジラ類で5Hz~12KHz、コウモリで1200Hz~400KHzくらいです。高い音系では他に蛾が高音が得意です(300KHzくらいまでOKな種もいるようです)(種や文献によってかなり差があります)
高い声で会話するイルカはさすがに周波数が高いです。水中では高い音の方が伝わりやすいそうです。低音の魅力のクジラは低い音が得意のようです。ちなみにイルカは高い音は顎の下骨で拾うそうです。
レーダ機能装備のコウモリは人類でいう「超音波」で夕闇もへっちゃらです。
アメンボのように水面の横波を「聞く」生物もいますし、多くの動物は足からも振動を検知しますし、土の中にいる生物は鼻先や顎や体全体で音を検知(この場合は主に低音域)するものもいます。
かえるは前にも紹介しました10Hz~4KHzとなっている文献が多いです。20KHz以上の声で鳴く友達のかえる(もちろん聞く器官もあります)もいます。ちなみにかえる本人のコメントとしては1~2時間の気圧そのもの変化:DCレンジ(ほぼ0.0001Hz)も(音といえるか微妙ですが)「聞く」ことができるので、研究者の方にはもっと正確な評価をお願いしたいところです。(なお解剖調査には強くクレームを言いたいです)

音の伝搬は(感覚的に)かなり遅い
音は気圧・気温にも影響をうけますが、概ね秒速5センチメートル340メートルです。
すぐ近くで雷が落ちた!と思っても音が聞こえるまで結構時間がかかる感じです。
ちなみに光は秒速299,792,458メートルくらいなので光のほうが88万倍速いです。

情報量としては光・視覚のほうがはるかに大きいですが、動物間のコミュニケーションとしてはほとんどの生物が、音の発生器官と検出器官を発達させ、音によるコミュニケーションを可能にしているものが多数います。光は(発光できても)変調して情報をのせるのか生物にとっては困難なようです。

波とは何か

「すべてのものは波でできている」というオカルトを信じています。光も素粒子も電子も原子も分子もタンパク質も生物も地球も宇宙もつきつめれば波でできているんです。(くどい)
ちなみにここでのオカルトとは正規の用法:「人智を超えた神秘の知識」として使用しています。
前フリはこれくらいにして、真面目にいきます。

光も音も「波」ですが、音波は「遅い」のでその「波」としての性質をより体感できます。波の性質を羅列します。
・一番基本的な(そして理論的な)波は定常的なサイン波です。
・波を表す性質として周波数振幅位相があります。
・波は「瞬間」としては存在せず、時間の経緯とともにある現象です。
・波は重ね合わせや打ち消しあいが際限なくできます。
・波は反射(こだま)、屈折(海中で飛行機の音を聞く)、回折(障害物があるのに音が回り込んで聞こえる)などの性質があります。
・定常波でない短い波で一定の条件を満たすものは「ソリトン」として形状、速度がかわらない(減衰しないでエネルギーが保存されている)ものがあり、一種の粒子性をもつものもあります。
・音などを「短い」基本的な波の重ね合わせで解釈する「ウエーブレット」という考え方があります。
・理論的な(定常的な)波は現実にはそれほど存在しません。始まりと終わりのあるもののほうが圧倒的に多いです。

音を情報として扱う方法について

人間の聞こえる範囲を可聴領域、それ以上を超音波、それ以下を重低音(音でなく振動で感じる)ということが多いです。(呼び方はシチュエーションや学問でいろいろ)
音の波をデジタル情報にするにはいろいろな方法があったようですが、現在はPCMを基本としている認識です。
PCM(pulse code modulation)とは音の波形を一定の時間軸毎に、振幅をパルス符号化(振幅量をデジタル化)して表す方式です。
デジタル化により、実音との差が歪やノイズとして発生しますが、視聴上問題ないレベルとなるよう規格が決められているそうです。
CDは16Bit44.1KHz(振幅は±32768、周波数は22.05KHzまで)です。聞くと不自然な感じはもちろんないですが、ツールで極端に拡大するとギザギザででこぼこに見えます。
このサンプリングレートで演算をかさねると「不自然な」歪やノイズが発生し二次加工の(実用性としての)限界にもぶちあたります。
PCM関連の技術や名称、特徴を列記します。
AD変換:アナログ波形をデジタルに変換する。このとき量子化ノイズが発生するのはしくみ上の宿命である。
DA変換DACなどともよばれる。デジタルをアナログに変換する。アナログ処理のしかたによって好みがわかれ「音のいい悪い」の趣味の世界ともなる。

音の周期:sin波であれば、0°から360°(2πrad)までの1周期
周波数(frequency):1秒間に音の周期が何回あるかを示したもの
振幅(amplitude):音の大きさであり、振動の振れ幅でもあります。
波長(wavelength):文字通り波の長さです。例えば1KHzの音であれば約34cmです。波長の1/4管は共鳴しやすいので、1KHzであれば8.5cmの管が共鳴しやすいです。マイクのセッティングで17cm(前後の)距離を間違えると位相が反転しちゃうことになります。
位相(phase:繰り返しのどの部分(角度であらわす)かを示します。単位は度(°)またはラジアンです。
  人類は位相の変換にたいへん敏感で、耳の集音特性による振幅感度の変化と位相の変化により首を少しだけ動かしただけで音のする方向を正確に推定できます。
定位(アジマス):どの方向から音が聞こえるかが明確であること。
音の大きさ(音圧):dB(デシベル)という単位が主に使われます。人間の感覚にあわせての扱いやすさから、常用対数のスケールになります。  3dB違うと1.4倍、6dB違うと2倍違うそうです。20dBで10倍の違い、40dBでは100倍の違いです。ちなみに同じ騒音のものを2つならべると3dB増加する(1.4倍のうるささになる)といわれています(計算できるようです)。「デシ」リットルなんて理科の実験にしか使いませんが、dB(デシベル)はよく使いますね。
音の分類:大きく分けて楽音噪音(シンバルなど音高をもたない打楽器など)、騒音雑音があるようです。

 

音のデジタル処理

 サンプリング周波数:アナログの音の波形をデジタル化するために一定時間毎に標本化(サンプリング)を行う。この単位で周波数と同じくHz.44.1KHzのサンプリングであれば、1秒間に44100回サンプリングする。
量子化
・CDは量子化Bit数:16Bit、サンプリング周波数:44.1KHz
・DVDは量子化Bit数:16Bit、サンプリング周波数:48KHzである。
・アナログをデジタルにするとき必ず微小な誤差が発生する。これを量子化ノイズという。

 ナイキスト周波数:サンプリング周波数の1/2までの音を再現可能で、これをナイキスト周波数といいます。(CDのナイキスト周波数は22.05KHzです)。逆の言い方をすればサンプリング周波数以上の音はどうころんでも「再現」できません。
この、量子化誤差とナイキスト周波数による誤差がデジタル処理の限界ともいえます。これらが「気にならないよう」いろいろな工夫がされてきました。
最近の動向:デジタル処理の高速化、高容量化、マイク、スピーカの高音特性の劇的改善、通信の高速化などにより「ハイレゾリューション」(高解像度)となってきています。

折り返し雑音(エイリアシングノイズ):ナイキスト周波数を超える高い周波数の音があった場合、これをサンプリングすると折り返し雑音が発生し、本来の音でないものが雑音としてはいる。そのため、AD変換ではナイキスト周波数以上はフィルタリングする前処理が行われる。ダウンサンプリングする場合にもフィルタリングは必須となる。

ディザ:一定のアナログ雑音を加えることにより、特定周波数のノイズを相対的に分散させノイズをめだたなくする手法。
ピアノの音の減衰音を44.1KHz16bitで(静かな環境で音が聞こえなくまる最後まで)そのまま録音してこのまま再生して終盤のかすかな部分をやや音量をあげて聴いてみると、聞くに堪えない酷い音がしているのがわかります。量子化は「リニア」なので量子化雑音は微小音ほど大きく感じることになります。消える間際に高い周波数の音が「キン」となっている感じです。ディザをくわえると、それを感じず、かずかな雑音の中に埋もれていきます。

オーバーサンプリング:最終目的とするサンプリング周波数よりも高い周波数(普通は整数倍)でサンプリングすることである。これにより、デジタルフィルタ処理などの前処理としての演算処理が行えるため、アナログ回路がシンプルになる(結果としていい音になる「かも」)
ΔΣ変調機:1ビットのコンバーター積分器を組み合わせたもの。CDの原データの生成に使われている。原理はそのままにあえて多ビット処理するものもある。DSDや1ビットアンプ、1ビットレコーディング機材は高値嶺の花で無縁だが、技術的にはとても興味がある。
ノイズ・シェイピング:ΔΣ変調機が用いている、量子化ノイズを削減するための手法。
ノイズ・シェイピングの説明はこちら(う~ん。この会社すごい。)

アップサンプリング:サンプリング済の波形を元のサンプリング周波数より高い周波数(もしくはビット数も増やす)に変換すること。「疑似ハイレゾ化」でもあるが、「元の音より基本よくなる」という人と「情報は既に失われており、音は変わることは確かだが本質的によくなるわけではない」人と「むしろ元のサンプルを適切に処理した方が原音に近い」人がいるなど、趣味の領域の話もありました。「音質にこだわる」ことはないのでここはスルーします。アップサンプリングすると、その後いろいろな演算をするときに誤差が少なるなる(当然計算量やメモリ使用量は激増する)良い点(とコスト)があります。

個人的興味のありかなど
ちなみにボクは「AD変換でへんな味付けがされておらず、後段のDA変換がまともであれば、アップサンプリングしても音は基本的に変わらない」と思う派です。ただ、オーディオは「こんなことで音がかわるものか」「論理的には変わるはずがない」変化で「結構音が変わる」オカルトの世界であると正しく認識しています。(オーディオの趣味はオカルト好きのボクと同じ魂を感じます。)
ちなみにアップサンプリングしても元のサンプリングのナイキスト周波数以上の周波数が出てくるものではありません。(でてきたとしたらそれはノイズです)ただし、ソフトやハードで積極的に「生成」して補正しようとしているものも多数あります。これにはそんなに興味はありません。
アップサンプリングはその後のデジタル処理の誤差が少なるできることに関してはとても興味があります

 

音を解析する方法

 解析などでそのまま音の波を扱うのが適さない場合、他の情報に変換してオペレーションすることがあります。
フーリエ変換:音はsin波の重ねあわせで表現できることから一つの波形を、複数(周波数、振幅、位相)のsin波であらわす変換を行うもの。Wikipediaの画像が感覚的にわかりやすい。
ウェーブレット変換フーリエ変換と並ぶ周波数解析手法の一つ。フーリエ変換では連続したsin波(時間的に定常している)の重ね合わせを基本とするが、ウェーブレット変換では小さな波(ウェーブレット:時間的に局在化している)の重ねあわせで表現し解析を行うものである。時間及び周波数の両方の特性をつかむことができる。
http://www.elmec-gms.com/software/weveletdif.html
多重解像度解析:実質的な離散ウェーブレット変換はこちらをさしている場合が多い。

(音波に関する)不確定性原理:短時間の変化を識別するには(フーリエ変換の)窓は小さくする必要があるが窓が小さいと周波数特定が困難となる。窓が大きいと周波数特定は容易になるが、周波数変化の検出が困難となる。量子力学で有名なハイゼンベルグの不確定性原理と似ている。(本質は同じ)


人間が感じる周波数と音の大きさの関係は一定ではなく、「特性」があります。
補正:人の特性を考え、(不完全な再生が疑似的に自然にきこえるよう)特性を変化させるケースがあります。聴覚を意識した補正されたものは、さらに他の補正や加工をしようとするときの障害になることがほとんどです。元の状態に戻してから加工します。
失われた22KHz以上の周波数を倍音構成から推定して加算することにより、より自然な音として感じることがあるようです。最近は安価なデジタルアンプにもMP3補正やCD音補正で疑似ハイレゾにできる製品も多いようです。ボクの持っているアンプにもたぶんついていたはずです。(ボクのアンプは(一般のアンプからすれば)安価なほうですが、簡易マイクで部屋の周波数特性や視聴位相を測定して補正する機能がついていて、買ったとき1回やりました。「もちろん」補正前後の違いはわかりませんでした。
ボクは良い音には鈍感ですが、悪い音には敏感なほうかもしれません。MP3の音は大抵ひどいので聞くことができません。)

 

加工・エフェクト系

 フィルタ
周波数によって音を通したり、通しにくくしたりするもの。フイルタを通すと特定周波数が減るだけでなく、一般的に周波数によって位相がずれる(位相が歪む)
急峻な特性をもつものは位相を極端に崩す傾向にある。位相歪は耳障りな高音として聞こえることが多い。

 コンプレッサ
音の強弱を圧縮し、縮小させる。録音、再生機器には有効に再生できる範囲が限られており、この範囲に効果的に収めるようにする。ギターエフェクターの場合、ギターの減衰を弱め、持続音を長くするなど、音の加工に積極的に使われる。

リミッタ
ギターのピッキングなど一瞬だけ極端に音が大きい場合、全体を小さいしないと収まらなくなる。一定以上の音を一定の音に収まりやすくするため、大きな音に対して極端にコンプレッサーをかける。全体の音圧をあげるためにも積極的につかわれる傾向にある。

ディエッサ-
空気が歯に当たる時に発生する歯擦音(しさつおん)を軽減するエフェクター。マイクが拾いやすく再生では大きく聞こえるため軽減させる。歯擦音('ess'音)は周波数が高く、デジタル加工するにあたっても多く含まれていると扱いにくいソースになるため軽減させる。

 

カルト系
ピュアオーディオ:少し極端ですが、これぞピュアオーディオです。

 

このページに出てきた用語はこの後のページで普通に使っていくと思います。

よろしくお願いします。

「XXXの自由研究(そのn)~副題」表題は評判が悪いです

 ・「夏休みの自由研究」を検索する小学生や父兄の方の検索のじゃまになる。
・検索や一覧で並んだときに、一覧の横幅によっては内容がわかりにくい
・2個以上同じ感じの記事になると、両方ともトップ10ページ検索から消え去るので勿体ない。(トップページに出たので気を良くして続編を書いたらともに検索圏外になるのはあるあるです)
ですが、へそまがりを自他ともに認めるボクは初志貫徹でこの表題を続けます。
100個くらいコンスタントに記事を書いていけば、Googleで「計算機音楽」と入力すれば「自由研究」が次の候補に出るようになるはずです。

ちなみに「自己符号化器」については、あれほどがんばって書いたのに、googleの単独検索で1個も表示されません!Librosaでの検索はおかげ様でトップページにでます。(興味ある方は 「Librosaで検索」)検索の順位はあまり気にしないのですが、検索のランクの仕組みにはとっても興味があります。

「自己符号化器」と「自由研究」の複合キーワードでは検索されるのですが、世の中にこの組み合わせで検索する人は誰もいません。

余談ですが、当初このページは図は表をいれてわかりやすくするつもりですが、書いているうちにむなしくなってきたので、諦めました。あしからず。

 医療では音情報をかなり重視していると再認識

あたりまえですが、診断の聴診器は伊達ではないのですね。体のあらゆる音を「自己符号化器」に学習させて、かついろいろな症例の音も学習させておけば、安価で簡易な音診断できる医療補助器具がつくれそうです。(認可をうけるため症例検証や臨床データをとるとなると高価になりますよねぇ。)音以外のセンサー技術も最近とっても興味があります。Raspberry Piが無性に欲しい今日このごろです。

 おもしろそうなので、他にどんな音アプリがほしいか考えてみましょう。ほとんどひみつ道具的ですが。

こんな音アプリがほしい!

「音響捜査官 響〇子」

音を聞いたら場所やシュチュエーションを推定してくれるアプリ

「心理カウンセラー 雅治」

音声を聞いたらどんな気持ちなのかを推定してくれるアプリ(春ドラマはみてないなぁ)

「帝王のボイトレ」

歌や演奏を聞かせたらどこがいいところか、どこが改善ポイントかアドバイスしてくれるアプリ

「そんなこったぁ(Cortana)しり(Siri)ません」

無駄話の相手になってくれるアプリ。Siriさんは何気につれないです。Cotanaさんは人の話を聞いてません。

「音の博士」

あらゆる「ある」音が何なのかを推定するアプリ。(漢字の音読はできません。)

「きき耳ずきん」

動物と会話できるアプリ。いまの技術を集約すれば十分可能なはずなのですが、研究する人すくないのかな。。。

 

がんばって考えても「ほんやくコンニャク」にはかないません。

 

計算機音楽の自由研究(準備:その2)~フーリエ変換の窓サイズを決めます

準備はまだまだ続きます

実験の前にパラメータなどの細部の調整をします。

f:id:np2LKoo:20170418000822j:plain

もっと粗くしてもよかったり、逆にもっと細かくするべきパラーメタを確認します。

おおまかな内容

今日はフーリエ変換の窓のサイズと波形の端っこのフーリエ変換をどうやるか考察します。

なぜやるのか

フーリエ変換は計算する範囲で解像度がかなりかわります。

窓を広くとるにこしたことはないのですが、広いとその範囲での周波数特性のピーク値の解像度があがる反面、「瞬間」の周波数特性ではなくなっていきます。

なので、実際に波形をみながら窓サイズを決めます。

準備のやり方

昨年勉強して作成した(あるいはどこかのパクリだったかな?)フーリエ変換のプログラムをそのまま使用します。

np2lkoo.hatenablog.com

入力をピアノC1 (MidiNote:24)にしてやってみます。準備:その1でも使用したSteinwayのピアノの音です。

f:id:np2LKoo:20170417235620p:plain

波形を指定するとFFT計算してグラフを出すプログラムでした。

Fig.1が入力した波形、Fig.2がハン窓を通した波形、Fig.3が周波数検出量、Fig.4が位相情報、Fig.5がフーリエ逆変換した波形(ハン窓を通した波形に復元できる)

窓サイズをかえて計算した結果を比較すると以下の感じです。

f:id:np2LKoo:20170417235930p:plain

倍音構成がきれに検出できています。これを時系列にならべてSin波を合成できれば元の音を再現(近似)できるはずです。

結果

できれば8192にしたいところですが、実サンプリングの半分の幅となり、おきすぎます。4096サンプルではピークがはっきりわかりません。

よって6144を採用します。

立ち上がり部や末尾部の周波数特性の計算について

立ち上がり部や末尾部はそのまま窓をあてはめると端っこになり、中心にこないためちゃんと計算できません(窓枠の端はほぼゼロになります)。ところが窓の中心にむりやりもってくると、開始部や終了部が切れているので正しい特性を導出できません。

そこで、一般的な手法かどうか知らないのですが、波形を折り返して合成し、計算させたい部分の中心にもってきて計算してみます。

音の始まり部

1.位相を反転させます

2.時間軸を反転させます。

3.音の起点をやや重ねてミキシングします。(音の立ち上がり部の連結なので、クロスフェードは不要だと思います。)

4.音の起点を中心に窓を設定してフーリエ変換計算します。

これは「音のなり始めをうまく点対称にすると、歪の少ないほぼ連続音にできる。」ものです。倍音の位相が打ち消しあわないように目立った倍音の位相をあわせてミックスします。

この場合基音はわずかにずれる(歪む)ことになりますが、大局には影響ないとおもわれます。音の起点を中心とした波形になるので、ここを中心にして窓設定し、フーリエ変換を行えば立ち上がりの周波数特性が拾えます。文字がみにくくてすみません。

f:id:np2LKoo:20170418023712p:plain

音の終わり部

1.音の終わり部付近で基音のゼロクロスポイントを探します。(基音の周波数は推定できている。または予め分かっている前提です)

2.基音のゼロクロスポイントで、位相反転、時間軸反転します。

3.倍音の波形部が打ち消しあわないようにミキシングポイントを調整します。(音量に変化がないようクロスフェードさせます)

4.末尾部分を中心に音が疑似的に折り返すので、ここを窓の中心としてフーリエ変換計算します。f:id:np2LKoo:20170418023806p:plain

加工した音はこんな感じです。

f:id:np2LKoo:20170418023846p:plain

 途中と最後の「シュッ」という音がハンマーノイズです。これがとても重要でこの周波数特性を正確に知りたくてこんなことをしています。

音の始まり部、終わり部を疑似的に連続音に加工しましたので、窓枠を動かしながらフーリエ変換を行い、計算します。

今回は手動で行いますが、これを自動的に行えるようにしたいと考えています。

さぁて。来週の計算機音楽は?

クーです。次回はこれらのサンプリングからピアノの音がどれくらい復元できるかやってみましょう。(フーリエ逆変換ではなく、時系列の周波数特性からの波形合成)乞うご期待。

じゃんけんぽん。

今日のKoo'sキッチン おいしい!ただし、高い!

今日のKoo'sキッチンは「味の素 豚のあふれる肉汁にXO醤と葱油が香る ザ★シュウマイ 」です。スーパで冷凍食品一律XX%引きの日に値段を見ず、間違って買ってしまいました。XX%引きになっていない!と勘違いするほどのお値段でした。でも、本当においしいです。タケノコの食感といい、粗びき肉の粒度といい、肉汁感といい絶品でした。ただ、値段が高いので殿堂入りにはできません。あしからず。

今度も間違って買ってしまう気がします。

計算機音楽の自由研究(準備:その1)~実験のデザインをします

神様でも冷やし中華でもなく自由研究はじめました

今年の自由研究は冬眠後忘れた言葉や記憶を思い出すための準備期間としてなかなか始動していませんでした。寒さが薄れるにつれ、ようやく体調も安定してきましたので、ことしも自由研究を始動します。
Pythonに至ってはすっかり忘れてしまったので、ゼロから再入門です。
筆も遅く、マイペースなのでたまの更新ですが、近くにお寄りの際はぜひお越しください。
今年は「計算機音楽」やります。

f:id:np2LKoo:20170415202937p:plain

そして「打倒、電卓音楽!」(検索のライバル)

なぜやるのか

視覚、聴覚、触覚、味覚、嗅覚が五感と言われています。*1
また、いわゆる五感の他にも第六感がよくいわれますが、乱暴に分けると
・五感の統合や高度な「心」の応答により物事の本質理解や予測を行うもの と
・第六感の「センサー」自体が体に備わり、外界と通信できる(チャンネルはたくさんあるが、同調(チューニング)しないとつながらない)
の2種類あると感じています。
UFO、オカルト大好きのボクは両方とも「あり」と信じています。
話がそれましたが(第六感はさておき)、脳ではこれらの情報を各種「ニューロン」の「組み合わせ」によって情報処理しています*2
「計算機音楽」の自由研究では、サウンドや音の解析と再構成をほぼ同時に行っていくことになると思っています。
コアな処理部分は「自己符号化器」を使いますが、時系列情報として扱うことが必要になるので、接続をフィードバックさせたくなると思います。ピュアな(フィードフォワード型の)「自己符号化器」でなくなったり、「リカレントニューラルネットワーク(RNN)」や「自己組織化マップ(SOM)」に浮気するかもしれません。あらかじめご了承ください。

本自由研究では聴覚の学習をモデル化して研究します。

入り口は「耳」
本サイトは医学的な「神経科学」にもかなりの興味があることから、ごちゃまぜ(よく言えば「ハイブリッド」)な状況となっております。
今後とも体に対する医学的な理解も重視してアプローチしていきます

耳に関することは「こちら」が詳しいので参照ください。

 

f:id:np2LKoo:20170415211006p:plain

f:id:np2LKoo:20170416184046p:plain 

f:id:np2LKoo:20170416184202p:plain

 

有毛細胞」がどんなものか、のイメージを持てていただければと思います。

出口を「声」とした場合
楽器演奏を出力(たとえばMIDI情報出力など)としてもよいと思いますが、当面は単純なサイン波の重ね合わせ(フーリエ変換)になります。

もっと進めば、出力を「声」を計算合成(モデリング)するモジュールにつなげて学習していけたらと思います。

時系列をどう扱うか

「動画」はもちろん時系列です。
「静止画」はある瞬間の映像で、その静止画だけでみると時系列要素はありません。
ところが、「サウンド」は情報自体が時系列であることから逃れられません。一瞬の音を切り取り、それを継続して鳴らしたところで、元の音とは全く別ものになってしまいます。

サウンドは時間とともに周波数(の重ね合わせ)、振幅、位相が変化することにより「サウンド」としての情報が成り立ちます。
残念ながら「自己符号化器」は時系列には適さないといわれています。
そこで、時系列情報を含んだ情報をまとめて1つの情報として扱います。例えば(なんのことはない)よく見る横軸が時間のグラフそのものを扱うような感じです。

f:id:np2LKoo:20160922024411j:plain

よく見る「スペクトログラム」のグラフそのものに変換して処理することでもいい気がします。このグラフは「周波数、振幅、時間」はありますが、「位相」情報がありません。「位相」は音の分析と再構成にはとても大切な情報なので、将来的にはこれを含めた情報として扱っていくように考えます。

 実験用標準フォーマットの公安9課考案

 学習で使用するスペクトログラムの標準フォーマットを考えたいと思います。(当サイト実験でのみの統一フォーマット)

実験用の標準フォーマットを仮に考えてみます.

ピアノの音を例にとって波形をみてみましょう。題材/素材は「Keppy's Steinway Piano」です。
Keppy様(KaleidonKep99)のフリーのサウンドフォント(SF)としてチョー有名ですが、説明に使わせて頂きます。ちなみにKeppy様はイタリアでBlack MIDI Teamの方です。*3

さっきコメントを書いたら早速返事をもらいました。嬉しいです。

f:id:np2LKoo:20170415225637p:plain

本題がないので横道にそれてばかりですが、波形確認によく使うソフトは「Audacity」と「SoundEngine Free」です。
どちらも好きなのでその時の気分により使うのを変えることがあります。サンプリングドット単位の細かな操作をしたいのであればAudacityのほうがやりやすいです。
今回はSoundEngine Freeで読んでみました。

f:id:np2LKoo:20170415220549p:plain

C1(Note:24)32.7Hz

ピアノのいちばん低いドの音

立ち上がりが鋭く倍音が多い

ピアノなのでとても鋭い立ち上がりです。実験の題材にする素材は(マシンスペックの関連で)できるだけシンプルで短い必要があるので、短く切って加工することにします。

 元のサンプリングは27秒なのですが、15秒分だけ貼ってみます。ちなみにステレオです。音量には注意ください。

テスト入力サンプルフォーマット

 いろいろやってみた結果以下のフォーマットにします。

よくあるCDフォーマットの16Bit44.1KHzモノラルで2^14=16,384sample=だいたい0.372秒とします。48KHzのソースの場合は16,384sampleでだいたい0.341秒です。
16,000サンプルまでを評価に使い、後の384サンプルは減衰させます。(急に音を止めると聞くときクリッピングノイズが聞こえ、耳が痛いためです。)さらに384サンプルの末尾16サンプルは無音とします。 

下の例は48KHzなので、0.341秒です。(モノラルwavファイル:32970Byte)

耳の入り口はこの情報です。

スペクトログラムのフォーマット (仮)

 周波数(Frequency):12半音で一オクターブを区切り、G#0:25.957Hz(MidiNote:20)からG9:12543.85Hz(MidiNote:127)の108つのSin波周波数区分(9オクターブ)の周波数クラスを考えます。(FRQ0~FRQ108)
各周波数クラスに対し、
  強さ(Amplitude):最低128段階で近似します
  位相(Phase):360°を最低128等分して近似します。(今回はリザーブとし、使用しません)
音は立ち上がりがとても重要なので、立ち上がりの解析を細かくします。
2048サンプル、4096サンプルまで、8192サンプルまで、16000サンプルまでで、それぞれ2点ずつ、計8点で周波数を時系列測定します。
以上より、サウンドサンプル1音を108×8=864のパラメータ情報で表します。*4
さすがに時系列8点は少ないとは思いますが、ボクのプァスペックなパソコンではこのあたりが妥当と考えます。

神経/自己符号化器への入力はこの情報になります。

耳の器官(人類の場合は蝸牛(かたつむりみたいなぐるぐる部分))で物理的にフーリエ変換されますので、神経の入力はこのスペクトログラム自体がフォーマットになります。サンプルサウンドからこのスペクトログラムへの変換が「前処理」になります。

学習用サウンドカテゴリ番号の素案

学習の判断を円滑にするためにサウンド要素にカテゴリ番号を持たせます。

[サウンドカテゴリ番号、サブカテゴリ番号、サウンドカテゴリ内の識別番号、ノート番号、コメント欄]を持つものとします。
たとえば、図書館ライブラリ的な統一管理番号を考えます。蛙界にサウンド研究用標準フォーマット普及させるつもりです。


 楽器系(楽音)


1 GM MIDIサウンド (/サブカテゴリ番号はGM2番号 / 識別番号は楽器IDなど)
2 PIANO (:以下14まで実音サンプリング/メーカによる分類/製品種別のID)
3 ORGAN
4 Guitor
5 Base
6 Drums
7 String系 (1億円のバイオリンと10万円のバイオリンの聞き比べ:格付けチェック遊びをしたい)
8 ブラス系
9 リード系
10 その他楽器(分類不明だが楽器には違いないもの)
11 民族音楽楽器(シタールはこちら)
12 Percussion(ドラム以外のシンバルやカホンはこちら)
13 シンセサイザ(数理計算波形含む)
14 楽器複合音(音楽のフレーズ/断片/音楽にならない不協和音含む)
15 コラージュ構成作品、環境向けアンビエント(シンセサイザ含む)
16 音楽曲(古典、ポピュラー)
17 音楽曲(自動作曲:ENIAC組曲、計算機音楽はこちら)
18 音楽曲(現代音楽)


人系


21 男性歌声(音楽解析向け)
22 女性歌声(音楽解析向け)
23 男性話声(言語解析向け)
24 女性話声(言語解析向け)
25 男性音声(心理解析向け)
26 女性音声(心理解析向け)
27 医療系人体音(病理解析)


生物系


41 動物の鳴き声(マルチモーダル情報統合研究用)
42 動物の鳴き声(動物コミュニケーション研究用)


自然系(非生物系)


61 自然界純音(単発系:水滴の音はこちら)
62 自然界純音(持続系:雨の音、波の音はこちら)
63 自然界雑音
64 自然界騒音(嵐の音はこちら)


生活系


81 生活純音(単発系:特定の動作の音、風鈴などの非楽器)
82 生活純音(持続系)
83 生活補助/道具系(自発的に音を発する個人所有レベルの機器類:車、バイクはこちら)
84 生活騒音(交通機関、工事などはこちら)
85 生活雑音


工業系


101 生産設備(異常検出など)
102 生産機器(騒音低減研究用途)


分類法別(特殊用途)


121 国際十進分類法(図書分類準拠)
122 日本十進分類法(図書分類準拠)

0 まったくもって分類不能な音


なお、各カテゴリで未分類のものはゼロの識別を使用します。
自由研究の過程で少し調整するかもしれません。
サウンドサンプルに上記のようなラベル付けをして学習させます。

サウンドの出力について

 サウンドの出力は、入力とは別のしくみで行うものが、「学習」を実験するにあたっては興味深いです。
音であれば「発声」か「演奏」がいいのですが、どちらも敷居が高いです。
最初はてっとり早く、フーリエ逆変換とサイン波合成でサウンドを再現させてみます。

画像学習で有名な(そして昨年お世話になった)MNIST は Modified National Institute of Standards and Technologyの略だそうです。アメリカの工業規格をモジっているのですね。

「計算機音楽」の自由研究のサブタイトルとして、自己符号化器を用いてサウンドを学習する本自由研究にも「愛称」がほしくなりました。思い付きですが、K'SSSR(Koo's Sound Science Summer Reserche)にします。*5

再現されたスペクトログラムを元にフーリエ逆変換して、音波にするのが出力です。

人類の声帯はきわめて制約の大きい発音装置ですが、ここでは理想的な発音装置(万能正弦波合成装置)が発生するとして処理します。

まとめ

 サウンドの自由研究をします。愛称は「K'SSSR」です。
「K'SSSR」標準フォーマットを決め、実験します。
まずはピアノの音再現で実験します。
MNIST向けの「自己符号化器」を「K'SSSR」向けに修正します。
ピアノ以外の音でも実験をします。

展望とか希望(野望?)

 学習済の複数のニューロンセット(ユニット)を使って、ニューロン圧縮、抽象・一般化のテストをしたいです。 

最近何をたべてもおいしい!

 コンビニやスーパのレトルト食品がたまらないくおいしい。最近作り手の情熱が伝わるような商品が増えてきている感じがします。
今日の殿堂入りは濃厚イタリアンな「青の洞窟PREMIUM 熟成ベーコンのカルボナーラ マスカルポーネチーズソースと共に | 日清フーズ」です。
チーズソースがいい感じに溶け合い絶品のおいしさでした。
Koo'sキッチン殿堂入りおめでとうございます。

 

*1:細かく分類すると体に備わっているセンサーの種類だけ感覚の種類があります。
たとえば皮膚だけでも、触覚の細分種類として痛覚、温度覚(直接触ってのもの、赤外線を感じるもの)、圧覚、振動覚、複数の触覚や情報処理を組み合わせた識別(位置覚、立体識別能力、物性識別能力(気体、液体、個体)、etc
皮膚の構成要素として、触覚のセンサーの応答性順応性に種類があり、体の表面における分布も積極的に調整されてきています。

*2:。「組み合わせ」のしくみについては、目下全世界の研究者が目を血走らせて研究いますが、なかなかわかってこないくらい複雑なのだとおもっています。ニューロン(の組み合わせ)は「汎用」ですから画像で各種情報処理を行えるなら、サウンドや音楽、音声でももちろん問題ありません。センサー(感覚器官)のつなぎ方(エンコード用の接続)、応答のつなぎ方(デコード用の接続)が違うので注意が必要だと思っています。サウンド関連は画像処理よりも断然一般情報が少なく、実験したり、英語の論文を検索したりしなければなりません。
英語は日本語以上にわからないため、かなり努力するつもりです。

*3:Black MIDIとは縦スクロールのピアノロールを縦横無尽のキャンバスに見たて、人間には演奏不可能な音符ピアノロールで絵をかいていきます。中には1曲の中に数万~数十万のオーダで音を入れます。
だいたい[Synthesia] というMIDI Playerソフトが使われるようです。これもまた一つの芸術。

*4:MNISTの入力が28×28=784なので、それほどオーダを増やさない程度の情報量に絞りました。
MNISTの画像学習が目の「網膜細胞」から「視覚野」の学習に相当するのに対し、音の学習は耳の「有毛細胞」から「聴覚野」の学習に相当します。
MNISTが784個の網膜細胞からの学習に相当し、サウンド学習(K'SSSR)は108個の有毛細胞からの8点時系列情報の学習になります。

*5:研究が崩壊(SSSRで検索!)するかもしれないことを暗示します。ちなみにボクはピロシキ好きです。不評なら変えます

妄想は孟宗竹のように茂るも、そうだっけ?タケノコまだ?

今年の方向性を模索中

サウンドの解析を軸にする方針はゆるがないのですが、「自己符号化器」部分の実験
の方向性の案を考え中です。

たしはワタシのそっくりさん。

あなたもワタシとよく似てる。

おとなりさん、なかよくしましょ、そうしましょ。

f:id:np2LKoo:20170409011834j:plain

3章 基本SOM

4章 SOMの生理学的解釈

おイルカ、深くもぐって

大きくジャンプ。

いつのまに、青い動物たくさんいるぞ。

f:id:np2LKoo:20170409011849j:plain

7章 再帰ニューラルネット (RNN)

8章 ボルツマンマシン

・自己符号化器はいわゆる「古典的ニューラルネット(NN)」(単方向接続順伝搬(Feadforward)で同一中間層内の接続なし)ですが、「リカレント(再帰型)ニューラルネットワーク(RNN)」と「SOM(自己組織化マップ)」にもかなりの興味があります。時系列を扱いたいんです。
・短期記憶と長期記憶、言い換えれば「抽象度の低い学習済ニューロンから抽象度の高いニューロンへの学習の転移(圧縮)」にもかなり興味があります。(機械学習の「転移学習*1」とはちょっと違うのですが、なんて呼べばいいのかわかってないのでとりあえず学習の転移」(心理学用語)「学習の統合転送」(フツーの言葉)としておきます。ただ、転移はどちらも学習のドメイン(領域)が異なることに対する概念なので、私の用法は初めから間違ってます。何と呼ぶのが適切か検索中です。仮に統合転送にしました。*2)最近では利根川教授の研究が話題ですね。「科学誌サイエンス」に発表するとのことなので入手したらじっくり読みます。わぁAAAS会員は年$40かぁ。おこずかいと相談。
・学習済もしくは学習中のニューロンについての「削減・消滅」について興味があります。
・最近このサイトでもやっていたいわゆる「耳コピー」について、たとえば「元の楽曲に対し、手持ちのピアノ音源の音を提示し、元のピアノパート演奏を手持ちのピアノ音源で近似した場合の演奏を創生する」ことをやりたいです。これをいろんなパートに適用し、ミックスダウンしてカラオケを作れば、きっとミクやルカに気持ちよく歌ってもらえますよ、きっと。

リカレントニューラルネットワークについて

リカレントニューラルネットワーク(Recurrent neural network:RNN)は、中間層同士が結合をしています。
中間層同士を全結合した確率リカレントニューラルネットワークがボルツマンマシンです。
結合にフィードバッグなどのループを形成するので「状態」を保持することになり、時系列データの扱いに適していると言われています。

ニューラルネットワークの簡単な紹介はこの説明(PDF)

やや専門的な話題であれば

ニューラルネットワークで時系列データの予測を行う - Qiita

あたりはどうでしょう。 

SOM(自己組織化マップ)について

これはWikipediaに簡潔にわかりやすくまとめられていました。このまとめは秀逸な感じがします!

もう少し詳しい(けどシンプルな)説明は以下にありました。

SOMとは(1) [SOM JAPAN]

なお、掲載のSOM動作デモはWindows10では動作しませんでした。WindowsXPでは動作しました。

GIF画像での説明もありましたのでリンクします。

子供でもわかる「自己組織化マップ」

ここまで読まれて、進化系モデルを考えた場合、ジブンの立ち位置について、不完全な原始生物が環境の要因によって完全なる存在(イメージとしての神)に至る進化(SOM暴露過程)の「とある一要素」の「とある一つの状態」が「ジブン」であるイメージを持たれた方は、ボクと似た感覚であると思います。(ボクは両生類の進化の枝に乗ってますが ;)

SOMの発想は「物理的に近接するニューロンは学習の過程や結果が影響しあう」ものであり、リカレントニューラルネットワークもしくは制限ボルツマンマシンの感覚に近いと感じています。(勉強中です)

ニューロンへの学習の統合転送(ニュ-ロン圧縮を伴う)

ニューロンの削減については「抽象化」「一般化」と密接な関係にあると感じていますし、いろんな本やサイトでもそのように言われています。
海馬のような汎用短期記憶部から有用な情報を大脳皮質などの長期記憶部へ統合転送学習をさせる場合、一般的に「ニューロン圧縮」が行われているイメージがあります。(現在いろんな本の記憶や想像がごっちゃになっていて頭の中がカオスなので以下すべてボクのイメージ(想像)として書いていきます)
学習の定着がどのような仕組みでおこなわれているのかとても興味があります。
学習を統合転送させる場合は、必ず学習する側はきわめて活発な活動を行うはずです。

すでに学習済でその学習対象の入力信号が発生していないときにでも(あるいはその時にこそ)学習の統合転送が積極的におこなわれるはずです。
そのときは学習済側ニューロンセット(短期記憶:Nsとします)と学習側ニューロンセット(長期記憶Nlエヌエルとします)は一時的であれ接続されるはずです。(学習の統合転送中状態)そこで入力と出力が同じように動作するためには「入力信号を疑似的かつ積極的に」発生させる必要があります。それがないと、Nl側が「学習できません」。
入力が雑音であれ、関係ないことであれ、各種の信号がNsNlにはいり、NlはNsの出力結果をまねるように「学習(まねぶ)」していきます。
Nlは最初は比較的少数のニューロンからはじめ、必要に応じてニューロンを増やしていきます。
NlがNsと近似できるようになってくれば接続状態が解除されます。*3

学習の統合転送イメージまとめ

  • 1.  Nsが学習をする。比較的抽象度の低いほぼ「みたまま」「聞いたまま」の学習でよい。
  • 2.  NsのセットとNlが学習の統合転送用接続される。(Nlのニューロン数は比較的少数からはじまる)
  • 3. 「入力信号」によりNsセットの反応と同じになるようにNlが学習していく
  • 4.  Nlのニューロン数で不足する場合はNlにニューロンを加えていく
  • 5.  ある程度学習が収束し、一定の近似状態になれば学習の統合転送用接続は解除される。
  • 6.  同時にNsへの接続元のニューロンからの接続がNlに対しても行われ、Nsに対する接続はジョジョに解除される。
  • 7.  Nsでおこなわれていた処理がNlで行われ、以降学習はNlに対して行われていく。
  • 8.  元のNsの内部接続は解除され(忘れ)、新たなNsが学習される。(同じニューロンでも違うニューロンでもよい)
  • 9.  新たなNsと学習済の「とあるNl」と関係があるかもしれないので接続してみる。
  • 10. かなり近い応答をするので、Nsを「とあるNl」に統合転送することにした。(統合転送用接続維持・強化)
  • 10'.全く違った応答をするので、Nsを「とあるNl」に統合転送することをやめた(統合転送用接続解除)おしまい。
  • 11. 最初と同様にNsの応答をまねるようにNlが学習していく。必要であればニューロンを追加する。
  • 12. Nlがすでに大きなニューロンセットであれば、結果として慎重に微調整していくことになる。
  • 13. Nlがかなり大きなニューロンセットであれば、機能単位として固定化し、Nsとの接続は起こりにくくなる。
  • 14. Nlはそのような状態になっても自身のみで学習をすすめ、微調整をしていく。
  • 15. Nlに対して信号があまりこず、活動をほとんどしない場合、該当部位にエネルギー供給が少なくなり、結果として活性度合が低いニューロンから接続を解除していく(=忘れる)。(他のニューロンセットに再利用される)

以上のようなことが高い多重度で、比較的長期間行われる(と勝手に想像)。

ここまでの動作でNsよりもかなり少ないニューロンでNlが形成され、内容的には「抽象化」「一般化」されている状態になっていると考えます。

イメージを共有できた方は、「じゃぁ夜に夢を見るのは、積極的に脳内で疑似的「入力信号」が生成され、それにより学習の統合転移転送学習がおこわれているためで、たまたま潜在意識から顕在意識の部分に信号が流れた場合はその重ね合わせによって、映像や音の記憶部分が刺激されるからなんだよね。想像だけど。」と思われるかもしれません。
現実はもっと複雑だと思いますが、こんな動作に近いのでは?という感覚があります。

こんな動作モデルを自己符号化器をベースにして作成し、実験してみると面白いと思っています。
ボクとっても気になります。

実験もせず空想の世界にひたっておりますが、もうしばらく空想の世界はつづきます。(まだ、発想が定着しません)統合があるんなら分化(概念細分化)もあるよね。。。etc...

おいしいけど、あえて殿堂入りではないです

最近は食卓(プァ)グルメコーナ的ではありますが、おいしいもの紹介です。

いつでも新鮮 しぼりたて生しょうゆ | キッコーマン

です。

キッコーマン いつでも新鮮塩分ひかえめ丸大豆生しょうゆ | キッコーマン

もほぼ同じ感じですが素材の味がより引き立ち、「塩分が少ないだけではない」味わいがあります。

さっぱりとしたシンプルな味なのですが、とても気に入っています。こんなのを大量生産されたのでは、ご近所の老舗お醤油やさんの存続の危機です。おいしすぎてお醤油業界を再編させかねないとおもわれるため、地道な小規模活動に肩をもつボクはヘソをまげて殿堂入りさせません。どうかいままで通り老舗お醤油やさんも贔屓しつつ、こちらの商品も興味があれば、味わい比べなど如何でしょうか?筍のお刺身でお試しください。

 

*1:転移学習:新規タスクの効果的な仮説を効率的に見つけ出 すために,一つ以上の別のタスクで学習された 知識を得て,それを適用する問題 :別の関連した問題のデータや学習結果を再利用

*2:追記:学習の転移としていた表記を単純に統合転送に修正しました。転送だけでは単なるCopyのようなので、ニューロン圧縮の動作を含めてそのように呼びました。仮の名称で、ボク用語なのでご注意ください。正しい用語を見つけたら差し替えます。学習の統合と転送についてはこちらの先生も興味をお持ちのようですが、用語の用法は特にわかりませんでした。

*3:機械学習のいわゆるLong Short-Term Memory(LSTM:長・短期記憶)とは違います。ここでは長期記憶(Nl:Neuron set of Long-Term-Memory)と短期記憶(Ns:Neuron set of Short-Term-Memory)は神経科学/大脳生理学的な用法で使っています。機械学習系と神経科学系は似て非なる概念に同じような用語をマッピングしているので紛らわしいことが多々あります。

初心にかえる

計算機音楽のカテゴリ

「計算機音楽」はボクが検索するせいだとも思いますが、グーグルで「けいさんきお」とまで入れると「計算機音楽」が選択肢に現れるようになりました。

これは『「計算機音楽」というカテゴリが形成された。』と言ってもいいのではないでしょうか。

初心にかえって「計算機音楽」のことを考え、モチベーションを上げてみます。

助手の聖(アキラ)によれば、『短期的な知識や技能よりも長期的な「モチベーション」のほうが10倍大切』とのことです。う~ん。うさぎと亀ですね。

計算機音楽のことを調べましたので、わかったことをまとめます

計算機音楽とは

「計算機音楽」をボクがやりたいことのカテゴリ名称として選んだ訳ですが、「計算機音楽」について調べていくと、ある本にたどり着きます。

それは「Bit 別冊 コンピュータと音楽」という1987年に出版された本です。この本にまとめられている内容が(学術的な論文とは別に)音楽とコンピュータに興味のある人々に「コンピュータと音楽」の関係を大きく意識づけたと思われます。

この本はたまたま助手の聖(アキラ)が持っていて見せてもらいました。

特に「坂崎 紀」先生の「計算機と音楽の接点」が「計算機音楽」の概念そのものであるといっていい気がします。先生のHPはリンクフリーと書いてあるのでリンクさせていただきます。ボクにとっては本当に神様のような存在です。

情報処理学会誌「計算機と音楽<特集>」1988-06もとても気になるのですが、こちらは未確認です。 (入手方法がわからない)

そしてもう一人神とあがめる方は「平田 圭二」先生です。

かの「コンピュータ音楽 -- 歴史・テクノロジー・アート --, 東京電機大学出版局 (2001)」の訳・監修者の一員でもあります。

Vol.17 No.1 (2002/01) 音楽と人工知能 – 人工知能学会 (The Japanese Society for Artificial Intelligence)

計算機のための音楽でない音楽

をたいへん参考にさせていただいております。

ほかにもたいへん参考になる諸先生方のページもよませていただいております。

感謝申し上げるとともに、ここを原点として実験・研究していきたいと思います。

また「パソコン黎明期」の各種記事も参考にさせていただいております。

このサイトの音楽嗜好や参考情報はかなり古い時代へのオマージュから成り立っています。今後ももしも元気がなでいときは、いつでも原点にかえり、元気をもらおうと思います。

今後ともよろしくお願いします。

広告を非表示にする

人類のみなさん ボクと競争しようよ

挑戦状

ボクは(自称)「かえるのクー」といいます。

機械学習を勉強中です。

人工知能開発に至る24年計画(別名:死の池もんじゃ文書)の今年は2年目にあたります。

何事にもライバルは必要だと思います。

そこで、人類のみなさん、僕と「(強い)人工知能」開発の競争をしませんか?

ボクも負けないように一生懸命頑張ります。

ボクの予定寿命は8年で、完成までに3世代かかると見積もっています。

対決は今から23年後の2040年4月1日では如何でしょうか?

f:id:np2LKoo:20170401022730p:plain

 

その時点での人類最高の人工知能と、可能であれば対決したくよろしくお願いいたします。ボクもそれまでに、漁師量子コンピュータを調達し、最高の汎用知性アルゴリズムを開発し、最高の教育をします。ボクの子孫(三世)が勝ったらたぶんそのまま世界制服征服しちゃうと思います。

どうぞよろしくお願いいたします。

待つ春の日に Koo Wells

るりいろのへやへようこそ

はじめまして

井戸中 芽守(いとなか めもる)といいます。

本名ではありませんが、そのまま「メモル」とよばれています。

最初はフィシのことだとおもったら違いました。

f:id:np2LKoo:20170329210538j:plain

フィシではなく

f:id:np2LKoo:20170329210048j:plain

メモルでした

アキラくんから言われた、むちゃ振りの曲演奏の作成については、ようやく時間がとれるようになってきたので、すこしずつやっています。

はじめてなのですが自己紹介はご勘弁ください

1人称:「あ」の指定がありました。

『ふつうに「わたし」がいい!』といったら『「わたし」は「わたしちゃん」の固有名詞だからだめ』とクーに言われました。

「あ」はとっても言いにくいし、使いにくいと思います。このブログの縛りは変すぎです。アキラくんが愚痴るのもわかります。

ニックネーム:「なんでもいいよ」と言ったら「昔のアニメ」にはまっている人がつけてくれました。悪くはないと思っています。そう。ニックネームで呼び合うんです。へんですよね。今は慣れたけど。

特技:自分でいうのもなんですが、音に対してとても敏感です。敏感すぎて困ることも多いです。音楽はそれほど好きというわけではありません。コンサートは音が大きいので行けないです。音楽が得意でない割に、「耳コピー」はできます。(が、楽器も弾けないし、DTMもすこしできる程度なので似せてと言われても、結局似ないのですが。。。)

そのほかプライベートなことは、あまり公開したくないので、以上です。

曲はもうすこし時間をください

「あ」がブログを書くことはほとんどないと思いますが、今回はアキラくんが放牧で行方不明中なので、中間報告をかねて書きました。半分くらいの出来な感じです。

最近つるんでる「るぅりぃ」と相談して「聖なる館」のしたに「るりいろのへや」を作りました。(「るぅりぃ」と相部屋です)

動画も完成したら、このページはこのままで[PPAP!]へ複写してください。

 業務連絡:アッシュくんへ。もうすこし音を埋めたあと、仮ミックスにかかろうと思います。なぜかピアノのピッチがおかしく、バランスもこれからですが、ミックス前でも雰囲気はわかると思うので、とりあえずこのファイルの音に差し替えておいてください。サンプリングを多用しているところは、問題なければこのままいきます。完成したらこのページからののリンク差し替えますので、改めてお知らせしますね。

(追記)ほぼできましたのでPPAP!に入れてみて、張りなおしました。仮完成ですが、もう少しこまかなバランス調整をするかもです。(フレーズ毎の音量にかなり段差があるのはわかってますが、それ以外に突っ込み所があれば教えてください。)

(さらに追記)連絡がとれないので、クーと相談しててきとーに作ってアップしてしまいました。ひどい出来ですが、一区切りすることを最優先しました。絵は描けないので、写真とコラージュでお茶を濁しました。アキラ君方式です(苦笑)音が小さくなりとっても悪くなる原因はわかりませんでした。るぅりぃ手伝ってくれた有難う。ではまた。

youtu.be

「あ」は舞わないし、月も響まない!!

「あ」が、こう書くこと自体すでにクーの術中のような気もするなぁ。

ちなみに鵺(ぬえ)はレッサーパンダだという説があります。

「あ」が書くと一層混沌として分かんないんじゃないのかなぁ。書いてよかったのかなぁ?(「あ」が書くと...ではなく、「メモル」が書くと...のほうがまだしもですよねぇ?)

どうだぁ。これぞ蛇足だぁ!