クーの自由研究

マスターの かえるのクーは8年の任期を終え消失しました。クーⅡ世の中の人絶賛募集中です。(特にオリオン座&プレイアデス方向の方は優遇します)助手がメイド喫茶から生還し、リハビリを兼ねて復帰しています。

Windows10+WSL2+Ubuntu+pix2pixが動くか確認します

なにごとにも敵対的「ライバル」は必要

くん、君には負けない@花形満。。。えっ?!。。。完全敗北だ。重いコンダラ、かえるのクーの助手の「井戸中 聖」(いとなか あきら)でございます。

f:id:AssistantOfKoo:20210519190654p:plain

結局pix2pixがいちばんよさげなので、この週末はpix2pixで遊んでみます。

先週まで、画像処理には興味がなかったのに、完全に道を踏み外してしまいました。ちなみに私の王道は(本当は)「音声・サウンド」処理のはずでした。

流石にGAN(Generative Adversarial Network)は知っていましたが、GAN(をもとにした逆強化学習)がこれほど趨勢を極めているのは知りませんでした。「pix2pix」もおととい知りました。いえ、本当は何年も前から「何回も」いろんなところで目を通しているはずなのですが、「画像なので」興味がそそられなかた模様です。世の中進んでいます!いまさらながらやってみます!

f:id:np2LKoo:20210520212435j:plain f:id:np2LKoo:20210520212857p:plain

知らぬは恥だが、伸びしろがあります!

デモで遊んでみる

昨日の紹介で、「すぐにやってみれる」サイトを貼っていなかったので、こちらの方に貼ります。超有名みたいなので、やってみられた方も多いでしょうが、始めての方はお楽しみください。(ちなみに私は知りませんでした)

是非独創的な猫を芸術してくだい。(本家からもリンクが張られているので、お墨付きのサイトかな?)

古い建物や、カバンをつくったりもできます!

すごいのは、サーバ処理かとおもいきや、クライアントに学習済モデルデータをダウンロードして「JavaScript」で推論しているところです。(なのでクライアントPC性能にすごく依存します)

超たのし~。

JavaScriptで14,000行ほどありましたので、お暇な方興味のある方は解析してみてください。

 多分みなさまからは4年おくれ(=周回遅れ以上)ですが、趣味の世界なので地道に楽しみます。

 とりあえず環境設定してみます。

 先週末作成したWindows10+WSL2+Ubuntu18.04+Python3.7の環境にpix2pixを入れて動くかどうかやってみます。pix2pixの環境情報は3~4年前くらいのものがBaseなので、現在無理のものは強硬突破してみます。PyTorch / Tensorflow etc の実装が山のように(Gitレポジトリで1000以上)たくさんあってどれがいいかわからなかったのですが、上記のデモURLのサイトのレポジトリを見てみます。

(PyTorchがいいとおもったのですが、本家のがうまく動かせませんでした)

mariel@XXXXXXXX:~$ virtualenv -p python3.7 venvP2P37
source venvP2P37/bin/activate
 Tensorflow 1.4.1 が要求されているが、古すぎてpipできないので、1.15.5をいれた
pip install tensorflow-gpu==1.15.5

python pix2pix.py --mode train --output_dir facades_train --max_epochs 200 --input_dir facades/train --which_direction BtoA

で学習しているっぽいメッセージがでるが、超絶遅いです。 1epoch=10分程度なので、200epoch回には24時間以上かかりそうです。(GPUがうまくきいていなさげです)

 python pix2pix.py --mode test --output_dir facades_test --input_dir facades/val --checkpoint facades_train

おお!学習がそれなりにできて、ほぼデモのようにできました!

(長すぎるので途中で止めちゃいました)

では、次に学習データを作成してみます。

Train用のデータサンプルはこんな感じです。

f:id:np2LKoo:20210520220227j:plain

この例では右側をInputとして、左側のような建物の「面構え」を出力できるように学習します。

サンプルでは256×256の右左で 512×256のjpeg画像を 400枚学習していました。400枚も編集するのは自分には無理なので、明日どうするか考えてみます。まぁpythonでたぶんやるんです。

いちおう問題なくうごいたことを報告いたします。

 

以上、かえるのクーの助手の「井戸中 聖」でした。