前往
大廳
主題

紅蓮參數紀錄

夏洛爾 | 2022-05-23 14:08:56 | 巴幣 0 | 人氣 91

發現紅蓮真的非常纖細,各種參數略有差異,引導出的結果就可能大相逕庭

===Alpha.1===
Date: 5/23 9:09
速度限制 > 8
傾斜限制 < 70
引導速度 y=1

結果: 右腳加速為主,左腳只是輔助甚至妨礙
推測: 由於能跑幾步才跌倒,推測是速度限制相較體能過低,因此單腳加速就能維持超過速度限制,因此沒有發展出強制雙腳跑動的必要性

===Alpha.2===
Date: 5/23 14:07
速度限制 > 10

結果: 左腳跨步為主,右腳會用內旋往前擺動,但因此右腳踏地後平衡會失衡
推測: 未限制內旋,導致異側腳如何往前跨步探索進入

===Alpha.3===
Date: 5/23 17:19
重新調整紅蓮髖關節活動範圍 (原本側開角度為不恰當設計)
增加側身限制 < 40
增加大腿內旋與側開限制 < 30

結果: 連跨步都不會

===Alpha.4===
Date: 5/23 23:18
恢復紅蓮髖關節活動範圍 (原本側開角度為不恰當設計,但是受制於Unity限制,唯有X角度可以適用髖關節前後跨步,而對稱YZ則必然導致側開角度為不恰當,但無法採用斜向對稱原因不明,可能受限於Unity關節系統)

結果: 會跨步。但是只會一步
推測: Force sharping採用處罰導致紅蓮動作傾向很低

===Alpha.5===
Date: 5/24 9:30
移除Force sharping會造成的處罰,僅結束episode
速度限制 >9

結果: 能跨步,但是異側腳會不自然觸地
推測: 跨步瞬間可能對root有一定反作用力造成的旋轉量

===Alpha.5===
Date: 5/24 9:30
移除側身限制

結果: 能跨步,但是異側腳會不自然觸地
推測: 獎勵角度向量角度太大,紅蓮過度追求y向量,異側腳觸地是為了向上跳躍

===Alpha.6===
Date: 5/24 21:06
觀察項改為紅之座標體系
獎勵角度.y = 1 => 0.2
速度係數最高速度 = 15 => 12
速度和視線得分比值 = 8:2 => 7:3

結果: 能跨步,但會前撲

===Alpha.7===
Date: 5/24 11:43
速度獎勵改為 平均速度 投影到 獎勵速度向量 的 長度
出生位置單一化

結果: 能跨步,但只有右腳,能跑好幾步,但進展緩慢
推測: 限制大腿動作可能間接導致大腿動作探索不順利,出生位置單一化則導致持續面對新參數(抵達新距離)而使模型建立錯誤與發展遲緩

===Alpha.8===
Date: 5/25 10:08
移除大腿內旋與側開限制
出生位置恢復隨機
Learning Rate= 2e-4 => 3e-4
速度限制 > 9 => 15
觸地容許時間 = 0s => 1s

結果: 能跨步,但只有右腳,但進展緩慢

===Beta.1===
Date: 5/25 23:13
速度限制 > 15 => 10
移除奔跑方向限制
生命耗盡處罰為 -2
速度限制處罰為 -1
出生傾斜角度 = -0.2 => -0.1
觀察項也加入紅之座標校正
力量調整Spring of Hip/Knee/Ankle => 9000/3000/1000
力量調整Damper of Hip/Knee/Ankle => 30
力量調整Maximum force of Hip/Knee/Ankle => 45000/15000/5000
Velocity Buffer = 5 => 10
出生半徑 = 0-300 => 100-300
batch_size = 4096 => 2048
buffer_size = 40960 => 20480

結果: 會跑了,跑得很狂,而且跑的超級直,唯一缺點是遇到目標會直接衝過頭然後陣亡
推測: 首先衝過頭部分本來就不期待,因為沒有對停在目標附近這件事本身做誘導
而變得會跑部分,坦白說完全搞不懂,目前推測是力量調整造成的效果,也許力量比例超乎想像的影響人體工學,其次是傾斜角度,再來是Velocity Buffer

將繼續調查到底什麼因素會造成什麼效果,還有各種Force sharping的效果與副作用

創作回應

更多創作