前往
大廳
主題

紅蓮受身6

夏洛爾 | 2022-05-21 23:38:03 | 巴幣 0 | 人氣 68


和紅蓮受身5完全相同場景採用SAC訓練

訓練結果大相逕庭
是一個喜歡靜止站立的紅蓮
另外視線角度會喬得很準

但基本上不移動,不知道在其成長過程中到底發生了什麼

由於電腦變好現在訓練進度飛快,女兒一下就長大了,總是不知不覺錯過女兒的成長過程

但可以得證PPO和SAC可以在同問題有完全不同的發展傾向與結果,但由於Obersevation和Action相同,所以根據情況可以應用在Model切換

下個實驗將在紅蓮受身5的成果上進行
Force Sharping

創作回應

更多創作