前往
大廳
主題

Google推出Gemini Pro 1.5版,OpenAI推出影片生成模型Sora,以及...

這可不是鬧著玩的 | 2024-02-16 12:29:46 | 巴幣 2 | 人氣 269

1. Gemini 1.5: Google針對Gemini Pro模型推出1.5版,採用混合專家模型(MoE),從而提高模型的效率,以及擁有超長的上下文窗口,支援高達1百萬個Tokens(Gemini 1.0只能輸入32,000個Tokens),相當於1小時的影片、11小時的音訊、超過3萬行的程式碼、超過70萬個單字,此模型透過AI Studio和Vertex AI向開發人員和企業客戶提供 1.5 Pro 的限量預覽版,未來將會向大眾推出。


2. Sora: OpenAI進軍新領域(Runway瑟瑟發抖),推出可透過文字、圖片或影片生成影片的模型 - Sora,基於DALL·E 3的多項能力,可生成長達1分鐘的影片,並支援影片編輯等,將首先用於紅隊演練來評估AI風險與危害,並提供給視覺藝術家、設計師、電影製作人使用,但OpenAI強調該模型尚未成熟,還無法處理複雜的物理、因果關係和空間細節,同時OpenAI正在研發可檢測影片是否為Sora生成的工具。


3. Stable Cascade: Stability AI推出新一代的文生圖模型 - Stable Cascade,採用Würstchen架構,能夠在高度壓縮的潛在空間上進行操作,降低訓練成本、提高推理速度,由3個模型組成(Stage A、Stage B、Stage C),並推出Stage B(7B、15B)、Stage C(10B、36B)、Stage A(0.2B)的checkpoints,輸出的圖像品質比Stable Diffusion、SDXL更好、速度也更快,並推出步驟B、C兩種模型,官方建議使用Stage C的36B參數的模型以確保高品質的圖片生成,同時提供用於訓練、微調、ControlNet和LoRA的所有程式碼。



送禮物贊助創作者 !
0
留言

創作回應

相關創作

更多創作