主題

LLaMA初步心得，對話NPC滿天下的時代快來臨啦

獵奇一哥 | 2023-03-25 00:32:23 | 巴幣 102 | 人氣 1280

很多人看到ChaGPT，就越欲試，覺得AI對話用在NPC可行。

因此就有人利用OpenAI的API整合到遊戲，更有公司推出相對應的開發工具。

NPC 活起來了？有人嘗試了將 ChatGPT AI 活用於 RPG 遊戲甚至是寫程式了

用 AI 生 NPC 對話！Ubisoft 推 Ghostwriter AI 助遊戲開發

我有整理一篇 AI記事-發生事件記下來

你會發現，說話、聲音語氣、圖片、3D建模、遊戲生成等等，全部都已經到位了，只差整合這個動作，而整合難麼?

也是有超簡單的，因為你只要知道API，都能做，這是軟體工程師非常容易做的事情。

不過API有個問題，

如果玩過chatGPT應該會知道，他常常受限於提供的公司，

所以一定還是得回歸到怎麼樣在自己模型產生奇蹟的問題上，

我想目前大多共識已經慢慢形成，就算沒講應該，看到FB、微軟跟google他們最近幾個月做什麼，也該有點敏銳度，預訓練的時代基本上已經不是資本額沒超過10億美金的小公司能碰的，去年還能在1億美金，今年1億美金可能連邊都碰不到。

我想未來比較需要的還是微調的部分，而微調的部分，我還是建議去看林沐跟另外一個老師的課，他們很多paper講得非常不錯，

有個概念後會比較容易懂現況。

我想有做過LLM課題的人都會注意到 Training Compute-Optimal Large Language Models

下面這張圖

這張圖到底在說什麼呢?

其實這是張殘酷的微笑曲線，

也是去年到今年各路學者都想證明的一件事情，大力出奇蹟，

X軸是參數，B是billion，所以30B=300億，而目前GPT-3是1750億，Google PaLM是5400億，你可以將它當作人類神經元多寡。

Y軸是training loss ，你會發現到中間時出現過擬合，越來越糟。

而台灣很慘，多半訓練做到6B就收手，也沒錢，正好在死亡谷這邊，

而圖中30B才開始有討論性，若依照GPT與LLaMA的文件來看，湧現的通常要超過60B，

但我想大多公司都沒辦法做到30B，

AI這東西分為邏輯推理跟訓練，

訓練又可分預訓練與微調，這個講不完，

不過你只要知道，

學習初期(預訓練)非常難，後面累加知識(微調)很簡單，

而應用知識(推理)又相對學習簡單很多，

在你個人電腦跑6B甚至20B邏輯推理並不難，但要預訓練，例如GPT-NeoX僅有20B就需要96張A100(約3000萬台幣)連續運作三個月(電費另算)，而且有時成敗也是三個月後才比較有定論，所以通常公司不會只有一套訓練，而是多方案，所以這年代，你手中沒個1億美金，公司預訓練必須找對沒人研究的項目，要不然別碰。

OK，如果你沒有預訓練哪來的基礎模型，

很幸運這年代有一堆模型可以免費拿來用，

例如

GPT-J

GPT-NeoX

OPT

LLaMA

這些模型，其中最受關注的是LLaMA

他提供7B、13B、30B與65B

這幾個模型你玩過就會發現，30B以下有很多真的都是人工智障，其中OPT非常明顯，有很多不如650M這種小模型，甚至他們只會鸚鵡學說話，但65B，突然的變得有智慧。

可玩的通常是外流模型

你可以去找

LLaMA Dalai：因為LLaMA念起來跟喇嘛同音，所以他取名Dalai達賴，惡搞。Dalai這裡算是討論最完善，它裡面有記憶體與RAM大小關聯，你可以玩到65B，3/24推出docker之後，Windows建議用Docker安裝，因為很多蠢問題都會解決，但若你是MacOS，而且是silicon晶片是最佳選擇，回答速度遠遠快於x86，我們成功讓65B流暢跑起來是在Mac Studio M1 Ultra，在I9 13900K上跑的表現很糟，後來也有試試Macbook air的M1，他也是跑得比I7 12700流暢不少。不過或許未來會改變，實際上如果不追求過高的要求，7B在很老的電腦都能跑，只是回答速度不快。
alpaca.cpp：玩7B門檻很底，回答的表現也不錯，問程式也沒問題，但無法回答中文。
text-generation-webui：他跟stable diffusion Automate1111提供的webUI一樣，都是用gradio建立的，因此穩定性與表現都不錯，不過要小心，他似乎有病毒，然而他能玩的模型就多很多，介面也比較友善，也能用GPU加速，是個不錯的入手項目，另外即便他聲明可以用LLaMA，但我無法真的使用LLaMA。