事実上の長期休息?
こんにちわ、こんばんわ。かえるのクーです。
「自己符号化器」の自由研究の3年目です。
今年はブログの立ちあがりにつまずいたうえ、諸状況(時間とか資源とかetc)が整わないため、ゆるゆるとすすむことになりました。
本来であれば、今年は、自己符号化器(もちろん中間1層)で音声を題材にした、教師なし学習による分類まで行うつもりでした。
それで、自己符号化器を一区切りして、パソコンも新調し、自己符号化器をスタック・積層構造にしてディープラーニングに入門しようと思っていました。
ところが
「メモリ」も高騰したまま、「GPU」も仮想通貨の発掘作業?が人気のためか、発売時点より高いものさえあります。当然手がでません。PC更新は来年以降に先送りです。
ゆる~く進む題材として音声変換(モーフィング?)をやろうと思います。人声や、歌声のフォルマント変換です。
これだけであれば、別に「自己符号化器」や「機械学習」は不要ですが、「読み上げのロボットボイスを、お気に入りの声優さんの声に変換してみたい。」そのために特徴を学習して、自己符号化器でエンコード、デコードして、目的の声質に。。。
などと考えています。
ほとんど知識や時間がなく、「モーフィング」できる気がしないのですが、以前のブログは「やるぞ!」と宣言したら「できちゃった」こともあったので、勢いは大切だと思っています。なので、
今年の自己符号化器のお題は「音声変換(モーフィング)」です。
なお、「声」については著作権や肖像権に準じる扱いのようで、基本的に発声した人の著作物であとみなすようです。特定の作品の形式となる場合、は放送局やプロダクション、制作会社や委員会が著作権を持つとみなす場合もあるようです。
ロボットボイスをベースに学習済の特徴でモーフィングした場合、どのような扱いになるのか興味があります。
気が付けば 崖の下 井戸の底
Pythonを再学習 :半年もやってなかったら、すっかり忘れました。 改めて「入門 Python3」を購入したので、いちから勉強しなおします。
ビショップの黄色本も初めから勉強しなおします。