前往
大廳
主題

DeepSeek R1、ChatGPT-4o、Mistral AI 、o3 mini、xAi gork3、Google Gemini 2.0 Flash Thinking推理測試

劍心san | 2025-02-08 02:14:26 | 巴幣 6 | 人氣 1268

我先說明這個測驗,該內容不是空穴來風、也不是隨便杜撰出來的,而是根據我職場工作上實際遇到的問題,所擷取出來的表格畫面,本身沒有針對模型來優化內容,畢竟這本來就是針對人類員工而設計的表格,完全是出自於我個人,在實際解決問題之後的突發奇想實測。

本次的題目:



首先是DeepSeek R1





再來是ChatGPT-4o




緊接著是Mistral AI :





然後是o3-mini


再來是X平台上xAi gork3:





最後是Google Gemini 2.0 Flash Thinking :




那正確答案就是,Google Gemini 2.0 Flash Thinking所推理決策的內容,才是真正實際可行的正確答案,這個題目對於從事運輸業十年的資深員工來說,這個問題本身真的就只是小菜一碟。




送禮物贊助創作者 !
0
留言

創作回應

林包包
居然是谷歌勝出
2025-02-08 15:14:04
劍心san
我也感到意外
2025-02-08 18:47:08

更多創作