載入模型的設定應該要像這樣,勾4bits就是四位元量化讀取模型,在這種情況下訓練模型只需要7.5GB的顯存
抱歉打擾。之前在站上有詢問您語言模型的事情,感謝您說明gguf不能訓練。我申請Llama2下載。下載model-00001-of-00002.safetensors跟pytorch_model-00001-of-00002.bin。但是,他們都沒辦法被載入text generation web UI。想請問您是否我哪裡操作有誤? 或是我可以到哪下載可以訓練的模型? 謝謝您