クーの自由研究

マスターのかえるのクーは、弟子達の召喚術により新たな依り代を得てⅡ世として復活しました。

Unity ML-Agents でサッカーチームを強化しよう

11万年以上の今「間氷期」の中で一番暑い7月かも?

こんにちわ、こんばんわ。かえるのクーの助手の「井戸中 聖」(いとなか セイ)でございます。そんな学説もあるんだとか?

「サッカー」について、Release20オリジナル教育済「ニューラルネット」にようやく勝利できるチームが1つできあがりました。

ローカルため池杯2023

大会キャッチフレーズ「ため池で一番強いのはオレ様たちだ!」

 なぜため池ハザードマップは義務でない? - 株式会社イエステージkai: 和歌山の不動産売却・購入仲介

ここで、今大会のレギュレーションを今更ながらおさらいします。(今決めたものもあります)

・Unity ML-Agents Release20の「Soccer」Examplesを使用する。

・変えていいのは、「強化学習」のプログラムとそれで教育した「ニューラルネット」のみ。(強化学習プログラムはC#、ニューラルネットはONNX形式)

ただしML-Agentsの「mlagents-learn」(Python)の機能変更は許容する。

・Unity側センサーやオブジェクトの機能、設定等の変更は不可とする。(機能以外の「色」などのカスタマイズはOK)

・勝敗は45分ハーフの90分で決めるとする。(基本的に休憩なし:)

・予選リーグとリーグ上位2チーム決勝戦(1試合)を行う。

・リーグ勝敗は勝ち点「勝ち3:同点1:負け0」とする。同じ勝ち点同士の場合は特失点差で決する。

・今大会のエントリは4チームとします。

その他こまかな点

リーグ参加資格:Release20「ニューラルネット」に10分程度の試合で恒常的に勝てること

学習時間目安(基本的に制約なし)

    (画像はイメージです)

・基本学習 24時間(チーム共通:強化学習プログラム:Release20オリジナル版を使用:学習は「ゼロ」から開始)

・チーム向け学習24時間(各チーム専用:学習プログラム:)

・チーム補強学習24時間(各チーム専用:補強用学習プログラム:主に弱点克服) 

※リーグ戦前に極端な力の差がないことを確かめる「親善試合」を行う。必要に応じて(親善試合のなかで)追加学習を認める。

ただいま、B,C,Dチーム向け、基本学習24時間中(共通)です。

なお、Aチーム(AMA:オートモードアタッカーズ)は基本学習を試行錯誤のうちに実施済なので、再学習しません。

質問を受信しました

Q:『学習済のRelease20「ニューラルネット」自体をベースにして、そこから学習を派生できないんですか?』

A:ごもっとなご意見です。前向きに検討して善処いたす所存にございます。

(おそらくはmlagents-learnの改造が必要な案件です。あ、mlagents-learnって.exe なんですね。)

う~ん。半日わるあがきしましがた、厳しいです。素直にゼロから学習させます。