今年は音声変換（モーフィング）の実験

こんにちわ、こんばんわ。かえるのクーです。

「自己符号化器」の自由研究の３年目です。

今年はブログの立ちあがりにつまずいたうえ、諸状況（時間とか資源とかetc）が整わないため、ゆるゆるとすすむことになりました。

本来であれば、今年は、自己符号化器（もちろん中間１層）で音声を題材にした、教師なし学習による分類まで行うつもりでした。

それで、自己符号化器を一区切りして、パソコンも新調し、自己符号化器をスタック・積層構造にしてディープラーニングに入門しようと思っていました。

「メモリ」も高騰したまま、「GPU」も仮想通貨の発掘作業？が人気のためか、発売時点より高いものさえあります。当然手がでません。ＰＣ更新は来年以降に先送りです。

ゆる～く進む題材として音声変換（モーフィング？）をやろうと思います。人声や、歌声のフォルマント変換です。

これだけであれば、別に「自己符号化器」や「機械学習」は不要ですが、「読み上げのロボットボイスを、お気に入りの声優さんの声に変換してみたい。」そのために特徴を学習して、自己符号化器でエンコード、デコードして、目的の声質に。。。

などと考えています。

ほとんど知識や時間がなく、「モーフィング」できる気がしないのですが、以前のブログは「やるぞ！」と宣言したら「できちゃった」こともあったので、勢いは大切だと思っています。なので、

f:id:np2LKoo:20180502224038p:plain

なお、「声」については著作権や肖像権に準じる扱いのようで、基本的に発声した人の著作物であとみなすようです。特定の作品の形式となる場合、は放送局やプロダクション、制作会社や委員会が著作権を持つとみなす場合もあるようです。

ロボットボイスをベースに学習済の特徴でモーフィングした場合、どのような扱いになるのか興味があります。

Pythonを再学習：半年もやってなかったら、すっかり忘れました。改めて「入門 Python3」を購入したので、いちから勉強しなおします。

ビショップの黄色本も初めから勉強しなおします。

クーの自由研究