前往
大廳

主題

Gemini: 由Google所推出的多模態AI大模型

這可不是鬧著玩的 | 2023-12-10 13:43:18 | 巴幣 2 | 人氣 404

~~官方開源預計要等到12/13號(三)~~

(已開放使用！！)

官方API、使用平台：

Makersuite(更名為Google AI Studio)：設計、輕鬆遊玩AI模型的線上IDE平台，已從原本的PaLM 2模型改成最新的Gemini Pro、Pro Vision模型，其中的Pro Vision模型為支援圖片交流的，大家快來此平台玩出新火花吧。
Google Cloud上的Vertex AI平台：可更完整的控管使用Gemini模型，須付費，但有試用金。

Vertex AI平台上的Gemini API使用範例 (Github)

Gemini API 文檔：可使用Python、Node.js、Web、Swift(iOS)、Kotlin(Android)、REST API等方式建構開發，使用前記得先在Makersuite(Google AI Studio)平台取得API Key。

Gemini API SDK (Github)：

Docs (文檔)
Python
JavaScript
Go
Swift (iOS)
Kotlin (Android)

價格：
Gemini Pro、Pro Vision API每分鐘限制60次的呼叫。
Google AI Studio (免費) vs Google Cloud上的Vertex AI (須建立帳單)：

📌 介紹：

由Google於12/06號推出的最強多模態模型，可處理文字、圖像、視訊、音訊和程式碼等內容進行理解並推理。
Gemini是第一個在MMLU(大規模多任務語言理解）方面超越人類專家的模型。

🌟 Gemini的三種規模:

1️⃣. Gemini Ultra（最大）: 適用高度複雜任務，在2024年初會推出給企業和開發者使用。

明年初將會部署至Google Bard。

2️⃣. Gemini Pro（中等）: 最靈活通用的模型，12/13會讓開發者和企業客戶在Vertex AI和AI Studio等平台中使用。

支援32K的文字脈絡長度，具備函式呼叫、嵌入、語義檢索、客製化知識基礎及聊天功能。
12/07號已部署至Google Bard中，目前僅限英語版。（查看支持的地區）
12/08號已部署至新增10多項新功能的新版的AI筆記管理平台NotebookLM，目前僅支援美國地區。

3️⃣. Gemini Nano（最小）: 最有效率且可以部署在手機等終端裝置的模型，12/6起提供給安卓開發者申請使用，可透過Android AICore建立Gemini為基礎的裝置用應用程式。

分為2個版本，分別為 Nano-1（1.8B，18億參數，針對低記憶體裝置）、Nano-2（3.25B，32.5億參數，針對高記憶體裝置）。
採用4-bit量化技術進行部署，改善效能。
已向 Google 自家的旗艦 Pixel 8 Pro 開放，以進一步釋放其所用 Tensor G3 晶片的 AI 潛力。
Gemini Nano在Android行動裝置上。

📊 各基準測試：

∆ 文字、數學、推理、程式碼等方面...

∆ 圖像、影像、音頻等方面...

∆ 與其他模型的比較

∆ Gemini的三種規模(Nano、Pro、Ultra)互相比較

🌟 已部署至Google Bard中(12/07號，目前僅限英語版)：

📺 官方展示Gemini強大的多模態功能：

Hands-on with Gemini: Interacting with multimodal AI (Youtube)

後續爭議：

Google坦承影片非真實呈現，實際操作時間比影片來得更長，並且操作的過程也不是即時或語音進行，而是靠靜態圖像與提示操作。
DeepMind首席副總裁Oriol Vinyals針對影片造假嫌疑的後續回應，稱影片中的所有使用者提示和輸出都是真實的，為簡潔起見而進行了縮短，該影片展示了使用 Gemini 構建的多模態用戶體驗是什麼樣子。我們這樣做是為了激勵開發人員。

The potential of Gemini (Youtube): 展示科學、推理、音頻、程式、數學與物理方面的能力。

✨ 與知名科技型Youtuber馬克·羅伯(Mark Rober)合作展示整合至Google Bard的Gemini Pro能力：

Mark Rober takes Bard with Gemini Pro for a test flight (Youtube)

📰 相關消息：

Blog：

Ｘ(Twitter)：

不斷更新中...

#Gemini Nano #Gemini Ultra #Gemini Pro #Gemini #AI #Google

1

送禮物贊助創作者 !

0

創作回應

這可不是鬧著玩的 a35963596

追蹤創作集

作者相關創作

作品資料夾

Gemini: 由Google所推出的多模態AI大模型

Google推出Gemini Pro 1.5版，OpenAI推出影片生成模型Sora，以及...

Google Bard改名為Gemini，並釋出搭載Gemini Ultra 1.0模型的付費版Gemini Advanced服務以及專屬App

Magika: Google開源基於AI的檔案辨識工具，擁有99%以上的辨識率、毫秒級的速度...

Meta推出LLaMA 3模型，分別有80億、700億參數，而最大的4000億參數量模型正在訓練當中！

國科會推出TAIDE-LX-7B模型

3D Gaussian Splatting的JS庫gsplat.js現在支援動態3D場景渲染

Claude 3：繼Claude 2後的下一代新模型，碾壓GPT-4、Gemini Ultra等模型

FunSearch：DeepMind所推出，能在數學、科學等新舊問題上找到更好最佳解的新技術

OpenAI DevDay首屆開發者大會: 釋出GPT-4 Turbo新模型、多種AI應用

DragGAN: AI圖像編輯器，可隨意拖動改變對象的姿勢、形狀、表情、佈局等

大型語言模型LLM演化樹及實踐指南

全球資訊網(WWW)今年35歲了

聖誕樹星團NGC2264

A Place In My Heart feat. moumoon - 聽了會讓人十分溫暖又振奮人心的歌

The Crane Wives — Curses

兩個交集的世界...

Hololive－星街すいせい

【討論】活動「ジュビリー」以及星街彗星合作抽卡開催中(~4/2、~4/10)

偶像大師灰姑娘女孩星光舞台

【討論】星街すいせい×デレステコラボキャンペーン！3月11日より開催！

偶像大師灰姑娘女孩星光舞台

【心得】彗醬——今天也很可愛! 黏土人 hololive 星街彗星!

綜合公仔玩具討論區

【心得】星街彗星黏土人＋天文學盒玩

虛擬 Youtuber（Vtuber）

相關創作

[速報]Google Gemini app繁體中文版正式上線啦！

1

146

OpenAi付費的ChatGPT-4 Turbo與Copilo上的ChatGPT-4 Turbo模型有一樣嗎？

0

236

[實測] Claude 3、Google Gemini Pro v1.0、ChatGPT-4 Turbo - 詐騙對話紀錄文本分析測試

1

1747

人工智慧模型的前因後果理解挑戰：以ChatGPT與律師需求為例

3

1060

CES 2024：生成式AI成為主流，領先技術走向明確方向

0

189

[動眼看] Gemini Pro模型實測：圖片推理分析 + 生成YT影片摘要 + 文件讀取(2024/02/02更新)

1

657

Claude 3模型與Google Gemini Pro v1.0模型的視覺推理對決

1

370

掌握未來工作趨勢：生成式Ai的革命性自動化技術探析

0

876

ChatGPT在實際應用中的限制：加航ChatBot事件的啟示

0

520

[有雷]以「愛、纏、殺：誰是恐怖情人？」進行ai模型推理測試

0

886

提升Google翻譯品質的實用方法和注意事項

0

227

使用Gemini Pro(原Google Bard)寫Python貪食蛇遊戲

0

152

探索GPT模型：學術優越性與推論挑戰

0

230

達人 gemini使用心得。我被gemini的功能給震驚到了

10

728

[教學]生成式AI最強應用法 - 逐字稿實戰篇

0

240

2023 「生成式AI大爆發」與展望

1

185

何謂創意？何謂優化？人如何不被ai所取代？

0

124

第一手實測繁體中文版的Bard(西元2023年9月19日更新)

2

1213

Google相機的一個很實用的Ai自動化功能 - 自動切換夜拍模式

0

175

[AI tutorial] 劍星 Stellar Blade EVE 製作技巧

0

0

更多創作

這可不是鬧著玩的 a35963596

追蹤創作集

其他創作

作品資料夾