クーの自由研究

マスターのかえるのクーは、弟子達の召喚術により新たな依り代を得てⅡ世として復活しました。

夏休みにもかかわらずUnity(ML-Agents)で遊ぼう

バナナも溶ける暑さです

こんにちわ、こんばんわ。かえるのクーの助手の「井戸中 聖」(いとなか セイ)でございます。

よくも悪くも、飽きるまでやる性格が災いして、ブログの内容がつまらないことを深くお詫びいたします。

さて、「打倒Release20学習済ニューラルネット!」は「未だ成らず」です。

概ね20対30の点数割合で敗北です。
現在の問題点を整理します。

一日三省

ボールを見失ったあと、探そうとしない。

エージェントの目を盗めていないので、見失ったあとのリカバリに対する報酬を与えられないため、ボールの位置把握が最重要であることをなかなか教えられません。

多くの場合、ボールを見失った後ゴールを決められるか、ボールに気づかず後退し、オウンゴールするパターンとなります。

 

攻撃のポジショニングが悪すぎる

相手陣地深くにワントップで陣取るが、いつまでたっても自チーム(といっても1人)からパスがこない。なのに、ボールをもらいに行かない。

ポジショニングの評価が適切でないためです。これは改善の余地が大いにあります。

ボールへの反応が遅い!(慎重すぎる)

どんなスポーツも瞬間を制するものが勝利します。応答速度が良い場合に報酬を与える方法を考えます。

メンバーには本当に「ピクミン」のチームワークを見習ってほしいと思います。ダンドリはたいせつ!

 

「少佐、目をようやく盗めました」

「イシカワ、腕が落ちたか?」

なかなかエージェントのインターフェースがアクセス(インターセプトw)できず苦労しました

黄色になってますが実は青色のエージェントです。

各エージェントは正面に対して左右60度、で11方向の視覚センサーを持っています。(視線の先に存在するのが何か判別できます)

このエージェント(青)の真正面[0]には紫のゴールネットが見えています。

右48° の[9]には「⚽ボール」が見えています。

これで、ボールを見失っていない/見つけることに対しての報酬を与えることができます。

視線方向ごとにボール、青ゴール、紫ゴール、壁、青エージェント(選手)、紫エージェントがあるかを1つ識別できます。

では、コーディングに励みます。