バナナも溶ける暑さです
こんにちわ、こんばんわ。かえるのクーの助手の「井戸中 聖」(いとなか セイ)でございます。
よくも悪くも、飽きるまでやる性格が災いして、ブログの内容がつまらないことを深くお詫びいたします。
さて、「打倒Release20学習済ニューラルネット!」は「未だ成らず」です。
概ね20対30の点数割合で敗北です。
現在の問題点を整理します。
一日三省
ボールを見失ったあと、探そうとしない。
エージェントの目を盗めていないので、見失ったあとのリカバリに対する報酬を与えられないため、ボールの位置把握が最重要であることをなかなか教えられません。
多くの場合、ボールを見失った後ゴールを決められるか、ボールに気づかず後退し、オウンゴールするパターンとなります。
攻撃のポジショニングが悪すぎる
相手陣地深くにワントップで陣取るが、いつまでたっても自チーム(といっても1人)からパスがこない。なのに、ボールをもらいに行かない。
ポジショニングの評価が適切でないためです。これは改善の余地が大いにあります。
ボールへの反応が遅い!(慎重すぎる)
どんなスポーツも瞬間を制するものが勝利します。応答速度が良い場合に報酬を与える方法を考えます。
メンバーには本当に「ピクミン」のチームワークを見習ってほしいと思います。ダンドリはたいせつ!
「少佐、目をようやく盗めました」
「イシカワ、腕が落ちたか?」
なかなかエージェントのインターフェースがアクセス(インターセプトw)できず苦労しました
黄色になってますが実は青色のエージェントです。
各エージェントは正面に対して左右60度、で11方向の視覚センサーを持っています。(視線の先に存在するのが何か判別できます)
このエージェント(青)の真正面[0]には紫のゴールネットが見えています。
右48° の[9]には「⚽ボール」が見えています。
これで、ボールを見失っていない/見つけることに対しての報酬を与えることができます。
視線方向ごとにボール、青ゴール、紫ゴール、壁、青エージェント(選手)、紫エージェントがあるかを1つ識別できます。
では、コーディングに励みます。