前往
大廳
主題

狗頭人哨兵 起身(PPO)_1

夏洛爾 | 2023-09-25 12:27:41 | 巴幣 100 | 人氣 76


重點實驗項目
1.碰撞會判定Impulse,並造成比例程度的Life損耗
2.全身包含Foot都是弱點,頭是超級弱點
3.Exertion: 高速擺動會降低得分,exertion數值和部位階級有關,根據改變幅度平方倍率
4.Stacked = 1,   Decision Interval = 8,假設反應速度不需要那麼快
5.負分結果制獎勵引導受身,移除動作影響,完全只根據站立與死亡時間給分,存活每秒-0.03 * (1+exertionRatio),死亡每早1秒-0.1,因此死亡會介於-1 ~ -0.6,而站立會借於 -0.6~0
6.觀察項是305,Hidden Unit只有384

實驗時間:
Step: 5e7
Time Elapsed: 56793s (15.78hr)
Mean Reward: -0.19

實驗結果:
實驗結果為成功

狗頭人會避免頭撞擊地面,而且有緩衝動作
另外晃動現象也變少
最後起身仍然很有效率

創作回應

更多創作