由於本系列研究紅蓮最終都走向自我滅亡,以致沒有合適的紀錄影片
(自我滅亡: 演化出不合理或不理想的動作,而後卡在低分長時間無法進化)
將從結論開始進行文字記錄
1.逐步誘導 (先給予簡單目標,才慢慢提升目標難度或複雜度)
理論上可行,但實際上難以調適
主要是ML還是會對得分發展"模式"
所以如果發展的模式和目標改變的方式不匹配,就會導致自我滅亡
例如本系列研究,紅蓮發展的模式大多都不是真的追逐球,而是"筆直的前進" (因為當前紅蓮出生會自動面對球),對於能觸碰球之後,球的轉移反應遲鈍甚至導致自我滅亡
2.距離系誘導是可行的
但要注意係數與Smooth調適,否則容易出現前撲等短期效益的得分模式
3.體能和隨機性還是影響很大
紅蓮根據體能,發展的模式就會有顯著差異
因此同時推測希望紅蓮發展跳躍等動作,出生高度也有顯著影響
下個研究將取消逐步誘導設計,並且將紅蓮出生高度也隨機化
另外預定下個研究將實驗膝蓋可以觸地,以確認是否有足部碰撞穿透現象等可能性