并非
GPT-5.4-Pro 在复杂问题以及科研能力上仍旧是无敌 虽然思考时间很长 但是质量独一无二
在coding方面能力并不比Claude差 除开前端能力 不过前提是你给的prompt足够详细且清晰
大致上同意,但老實說比這些沒啥意義,選一套用法能最大程度放大你工作流效率跟增益的最重要。
有時候最強的模型不一定最能放大,也有時候確實需要強模型的能力。
而且每個人都有自己的使用方式,不用太在意那種個人體感怎樣怎樣的,那種事情能相信的話我們做科研就不用跑benchmark了。
總歸市場上能有多方選擇絕對是好事,不會說有了麥當勞,肯德基跟摩斯就不能生存。
我也觉得…赶时间写论文用一个就好了 不用试下那个又试下这个很费时间诶
grok很強,排個人八字盤,只有它是對的,其他都在亂講,一堆自圓其說的程式
2026 第一賽季$20 usd plan T0仍然是Claude code opus, Chatgpt codex gpt5.3
就看Gemini 下個賽季怎麼追上來了
ModelScope這樣放會不會突然變超強
然後回來幹翻全場🤣
個人同時用GPT Gemini Grok處理同一件事
分析資料正文並深度評論及改正建議
GPT處理速度快,統整能力很強,很會記憶先前給的所有訊息,但得出的結果資訊及用語比不上其他兩個專業,不過認真說是最具有對話感的模型
Gemini給非常高的情緒價值,不管喂什麼東西給他一致好評,得不太到深度公正的評價,但不得不說banana產圖方面仍然無敵
Grok我很驚訝他的用語及改正建議,非常詳細且深度專業,但免費版額度太少,而且講太多他會忘記之前塞的資訊開始講自己的
現在改用Genspark統整所有模型,貴了點但用量大的話值得,會依據條件挑選適合的模型,主力是Claude沒錯
除了基模领先,anthropic为agentn方面也是遥遥领先,现在体验下来没有一个能比得过claudecode
OpenAI 希望還有喘息空間,畢竟沒錢燒很難再發展下去,感覺退坑也太多了,續命太難了。
前陣子他們的炒幣比賽都輸了呀
Deepseek 應該前3
日本都借他們來用了