前往
大廳
主題

紅蓮奔跑01

夏洛爾 | 2021-10-17 17:16:24 | 巴幣 4 | 人氣 112


練出了一個以地面划船形式奔跑的紅蓮

暫時在研究過程得出了一個創見
連續性獎勵(獎勵每個Action)應該獎勵最佳化"行為",而非"狀態"

原先獎勵紅蓮,只要移動速度投影至向量 (0,0,1) 長度越長則分數越高
會導致紅蓮在某個環節開始選擇自殺,可能是因為相較用腳觸地,飛撲的狀態,可以延長維持速度的時間

某次實驗之後改以獎勵移動速度投影至向量(0,1,1)長度越長則分數越高
可以理解成紅蓮的移動傾向要包含同時往上跳,才會取得高分

但奔跑本身就是兼具往上蹬的動作,因此取得比較穩定的訓練模型
下個實驗將嘗試是否能訓練出更能奔跑的模型
將進行以下改動

1.紅蓮的大腿活動範圍縮減
側開角度: 90->50
前後抬腿: 90->70
軸心旋轉: 30

2.Velocity Buffer改為10

另外記錄以下假說
在前期實驗,紅蓮有出現扭成一團現象,可能導致這個現象的原因
也許涉及難波跑,紅蓮有可能藉由旋轉身體,來讓腳部蹬地力量增加,但是這個趨勢導致紅蓮誤以為旋轉身體是件好事而走入了死路

其次是物理系統失真,也許紅蓮發現特定失利方式,有機會造成肢體擠壓反彈等,利用物理系統的缺口,進行某種非現實物理性的加速技巧,而這個趨勢導致紅蓮過度追求擠壓身體等等
這個假說在過度浮誇的物理數值上似乎有更常發生的傾向

其三是關節軸運算優先序
在某次改動為了讓紅蓮的大腿接近一般人類,又受制於Unity的關節系統限制(YZ角度僅能設定對稱角度)
因此將主要旋轉(跨步)軸,移至Y軸,而X軸成為側開軸

但有可能Unity關節系統在運算X有和YZ軸不對等的優先或其他特性,也許要嘗試重新讓X軸成為主要軸,再透過Hip Remap去限制非對稱的側開範圍

創作回應

更多創作