クーの自由研究

マスターのかえるのクーは、弟子達の召喚術により新たな依り代を得てⅡ世として復活しました。

今年は音声変換(モーフィング)の実験

事実上の長期休息?

 

こんにちわ、こんばんわ。かえるのクーです。

 

自己符号化器」の自由研究の3年目です。

今年はブログの立ちあがりにつまずいたうえ、諸状況(時間とか資源とかetc)が整わないため、ゆるゆるとすすむことになりました。

本来であれば、今年は、自己符号化器(もちろん中間1層)で音声を題材にした、教師なし学習による分類まで行うつもりでした。

それで、自己符号化器を一区切りして、パソコンも新調し、自己符号化器をスタック・積層構造にしてディープラーニングに入門しようと思っていました。

 

ところが

 「メモリ」も高騰したまま、「GPU」も仮想通貨の発掘作業?が人気のためか、発売時点より高いものさえあります。当然手がでません。PC更新は来年以降に先送りです。

 ゆる~く進む題材として音声変換(モーフィング?)をやろうと思います。人声や、歌声のフォルマント変換です。

これだけであれば、別に「自己符号化器」や「機械学習」は不要ですが、「読み上げのロボットボイスを、お気に入りの声優さんの声に変換してみたい。」そのために特徴を学習して、自己符号化器でエンコード、デコードして、目的の声質に。。。

などと考えています。

ほとんど知識や時間がなく、「モーフィング」できる気がしないのですが、以前のブログは「やるぞ!」と宣言したら「できちゃった」こともあったので、勢いは大切だと思っています。なので、

 

今年の自己符号化器のお題は「音声変換(モーフィング)」です。

 

f:id:np2LKoo:20180502224038p:plain

なお、「声」については著作権や肖像権に準じる扱いのようで、基本的に発声した人の著作物であとみなすようです。特定の作品の形式となる場合、は放送局やプロダクション、制作会社や委員会が著作権を持つとみなす場合もあるようです。

ロボットボイスをベースに学習済の特徴でモーフィングした場合、どのような扱いになるのか興味があります。

 

気が付けば 崖の下 井戸の底

Pythonを再学習 :半年もやってなかったら、すっかり忘れました。 改めて「入門 Python3」を購入したので、いちから勉強しなおします。

ビショップの黄色本も初めから勉強しなおします。