大模型爭霸的下一站：不僅是超越GPT-4，更是尋求模型之間的平衡應用

2024-05-07 08:51 來源：A5專欄我來投稿撤稿糾錯

文 | 智能相對論

作者 | 沈浪

知名科學雜志《Nature》發表了一篇關于大模型規模參數大小爭議的文章《In Al, is bigger always better?》——AI大模型，越大越好嗎？隨著大模型應用走向實踐，這一問題不可避免地成為了當前AI行業發展的焦點與爭議。

有人認為，大模型當然是越大越好，參數越大，性能越優。也有人認為，小模型更好，消耗更小，更能精準地解決專業問題。兩相對比之下，各有各的道理，懸而未決，究竟什么才是AI大模型發展的出路？

這一問題或許在日前商湯科技舉辦的技術交流日活動上有所解答。在活動現場，商湯科技發布了行業首個“云、端、邊”全棧大模型產品矩陣，以滿足不同規模場景的應用需求，對大模型的場景應用提出了新的思路，并且全新升級了“日日新SenseNova 5.0”大模型體系，綜合能力全面對標GPT-4 Turbo。

當然，在當前節點上，領先的意義已經不僅僅是超越GPT-4，更是探索出能解決實際應用問題的有效路徑。

01、離譜or靠譜？日日新端側大模型“暴打”GPT-4

在技術交流日活動的現場，商湯科技以一個很有趣的畫面闡釋了大模型與小模型之間的差別?；谌视螒虻漠嬅嫜菔?，商湯科技將自家的SenseChat-Lite 版本日日新端側?模型與GPT-4進行PK。

一開始，GPT-4還能略占上風，但是SenseChat-Lite出拳速度更快，隨后各種連招打到他根本反應不過來，只得被商湯科技的模型“暴打”，直接K.O出局。

這一結局似乎太離譜了？商湯科技對此做了解釋：實際上其中的差距并非模型能力強弱問題，而是在不同的適用場景之下小模型決策速度快。當大模型還在計算的時候，小模型已經完成了判斷并且出拳了，而且實實在在打到了對手身上。

正所謂，“天下武功，唯快不破”！對比大模型，小模型在具體的場景應用中有著更明顯的決策優勢。

因此，業內正在形成一個全面的共識：在實際應用中，大模型并非越大越好，而是得看具體場景需求。前不久，美國AI公司Anthropic發布Claude 3系列模型，一度超越GPT-4，登頂全球最強大模型。其中Claude 3系列就給出了不同量級的模型產品，包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，以便適用于不同的企業和場景。

同樣的，基于這一思路，商湯科技也在搭建完善的基模型體系與小模型系統方案，并發布了一系列的垂類大模型和端側大模型。其中，SenseChat-Lite版本端側大模型就可以面向手機、平板、VR 眼鏡、智能汽車等提供輕量、高效的大模型能力，結合端云解決方案，及時適應變化的環境和需求，保持高性能和準確性。

對比來說，中國更注重實踐。商湯科技在這個思路上給出的解決方案更具有主動性和服務意識以及更有實踐價值。具體的，商湯端側大模型不僅是參數量級小，還講究端側部署與端側處理能力的強化，在解決實際問題上響應更快速。

與此同時，商湯科技還面向金融、代碼、醫療、政務等多個領域推出了邊緣產品“商湯企業級大模型一體機”，在實際場景應用中更能滿足專業化需求，主動貼合客戶需求。比如，“大醫”醫療健康大模型一體機就可以在醫療機構內部一鍵部署大模型應用，實現“開箱即用”，并有效針對智能問診、導診、病歷結構化、影像報告解讀等場景，支持智能調整回復內容的語言風格、詳略程度、格式要求等。

當然，這也是目前商湯科技在AI大模型領域領先行業的關鍵點。同樣的思路，以小模型為應用焦點，商湯比別人多走了幾步，提出了軟硬兼顧的解決方案。

02、在尺度定律之下，沒有永恒的“最強”，唯有“日日新”

從經濟性而言，小模型更利于企業應用與解決實際問題。那么，是否對于AI行業而言，就不需要訓練大模型了？

實則不然。

在技術交流日活動現場，商湯科技提到了一個同為業內共識的理論：尺度定律。在普遍的認知中，以尺度定律為參考，隨著模型的參數變大、數據量變大、訓練時長加長，則算法性能會越來越好。

OpenAl于2020年曾發布一篇論文《Scaling Laws for Neural Language Models》，其中也有類似的觀點，即模型性能隨著模型參數大小的增長而變好。因此，在后續的大模型迭代中，OpenAI通過構建一個巨大的海量數據集，再簡單增加GPT模型的深度，就做出了具有驚人的涌現能力的大模型產品。

對此，很多廠商也作了相關驗證，包括谷歌、商湯科技等。其中，谷歌曾精調了三個尺寸的Minerva模型，分別使用了80億，620億和5400億個參數的預訓練PaLM模型。

結果發現，Minerva的性能隨著規模的擴大而提高。在整個MATH數據集上，最小模型的準確率為25%，中型模型達到43%，最大模型突破50%大關。

由此，基于尺度定律的認知，他們發現自家的模型產品在一定測試級上超越GPT-4的能力，并非不可能。如今，商湯科技發布的最新的“日日新SenseNova 5.0”大模型體系，其性能就超越了GPT-4。

其中，日日新·商量大模型5.0主模型在語言、知識、推理、數學、代碼等領域的能力，在主流客觀評測上就達到或超越了GPT-4 Turbo，在聊天、多輪對話、信息提取、寫作等場景能和GPT-4 Turbo相媲美。

更值得一提的是，日日新·商量多模態大模型的圖文感知能力達到了全球領先水平，在多模態大模型權威綜合基準測試MMBench中綜合得分排名首位，并在多個知名多模態榜單MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU 取得領先成績。

換句話說，在尺度定律的認知下，GPT-4被超越是遲早的事情，AI大模型領域沒有永恒的“最強”。

當然，若要登頂最強，雖說可行，但絕不簡單。大模型的參數爭議，其中就有能耗的問題。谷歌曾坦言，PaLM的訓練在2個月內消耗了大約300個美國家庭一年的電力消耗，其中所需要的算力、數據等基礎設施絕非常規企業可以負擔。

在這一點上，商湯科技秉持“大模型+大算力”的“雙輪驅動”戰略布局又一次為其拓寬了道路。其中，SenseCore商湯大裝置作為商湯科技前瞻決策所打造的高效率、低成本、規?；男乱淮鶤I基礎設施，可以支撐超過20個千億超大模型同時訓練，并支持萬億參數大模型的全生命周期生成，為大模型的打造提供了非常關鍵的支撐。

簡單來說，雖說有尺度定律作為理論支持，但是以SenseCore商湯大裝置為代表的大算力才是商湯科技能超越GPT-4的底氣。從這個角度來看，商湯科技做AI，比大多企業要更加純粹且徹底。

03、大模型的最優解，是場景平衡

從國內外的實驗與實踐來看，模型的大小之爭意義不大，離開基礎理論和場景應用去拋棄任何一方都不可取。因此，目前主流的AI廠商在迭代和發布系列模型時，往往都會推出主模型與小模型以及垂類專業模型，根據場景需求按需提供服務。

這一點將在接下來的時間里拉開專業AI服務商之間的差距。目前，日日新SenseNova5.0大模型體系采用了混合專家模式，這樣做的目的在于通過將模型分割成多個具有專門功能的模塊，使得模型在推理過程中能更有效地利用計算資源，并可能提高模型的泛化能力和應對復雜任務的性能。

具體來看，商湯瓊宇發布的3D高斯潑濺技術，就具備輕量化的web渲染能力，可以產生更輕量的模型資產，使城市級三維模型的構建和編輯重建效果更加真實，成本更低，也可以應用在更多場景。

這是混合專家模式思想在實際應用中的體現，通過不同技術和模型組件之間的配合，實現了對特定任務定制化處理和資源優化，從而加速大模型在不同場景中的應用，實現AI普惠。目前，瓊宇已服務客戶超過60個，實現了15個城市120多種場景的重建。

因此，當我們把目光投遞到實際中的場景問題，就會發現大模型和小模型均有用武之地，問題則在于如何去平衡地調配資源，實現最優解。由此來看，商湯科技對混合專家模式的應用，可以視為是一種領先行業的熟練決策。

未來不屬于大模型或小模型，而是大小模型之間的平衡。因此，“AI大模型是否越大越好”類似的問題不必糾結，但需要面對，即如何去打造大模型，又如何把大模型的能力調配出小模型服務好市場，會是各大廠商接下來的必修課程。

*本文圖片均來源于網絡

此內容為【智能相對論】原創，

僅代表個人觀點，未經授權，任何人不得以任何方式使用，包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡，且未核實版權歸屬，不作為商業用途，如有侵犯，請作者與我們聯系。

•AI產業新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能十萬個為什么》

•【重點關注領域】智能家電（含白電、黑電、智能手機、無人機等AIoT設備）、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。

申請創業報道，分享創業好點子。點擊此處，共同探討創業新機遇！

相關標簽: 大模型

解密Kimi：大模型應用當紅頂流是如何練成的？

拋開營銷戰，或許在中國也可以探索新的大模型應用聚合方式、供給方式以及商業利潤分配的方式，對大模型公司來說，這將是一個新議題。

標簽：

大模型
大模型的現在進行時：走出對話框，走向產業端

大模型熱潮涌動了一年多后，越來越多人平復了激動的情緒，開始從客觀的視角重新思考大模型的價值和機會。紅杉資本在AlAscent2024的開場演講中提到，大模型的創造能力和推理能力，第一次實現了以類似人類的方式進行交互，將支撐起數十萬億美元的市場。然而和AGI的遙遠夢想相比，大模型的創業者們卻不得不正視

標簽：

大模型
李彥宏放話：百度AI大模型絕不搶開發者飯碗

關注盧松松，會經常給你分享一些我的經驗和觀點。昨晚，李彥宏內部講話稱：AI大模型開源意義不大，百度絕不搶開發者飯碗。但你一定要說話算話哦，可千萬別說：“我永遠不做手機，誰再敢提做手機就給我走人”，結果5年后自己的手機銷量排名第一。如果百度也這么干的話估計AI也沒人用了。李彥宏認為：從商業模式的角度來

標簽：

大模型
360 AI員工“紅衣”入職事業部承擔多項安全運營工作

近日，科技巨頭360公司宣布，其全新AI員工“紅衣”正式入職事業部，標志著公司向智能化、自動化方向邁出了堅實的一步。據悉，“紅衣”由360安全大模型支持，具備高度智能化和自主學習能力，能夠在多個領域提供高效、精準的服務?！凹t衣”是首位正式入職的數字安全專家，由360安全大模型支持，在安全運營工作中，

標簽：

大模型
AI大模型博鰲破局：端云結合，驅動新質生產力

在“博鰲時刻”，vivo藍心大模型等被明確定調為，是打造“新質生產力”的孕育沃土。作者|楊銘編輯|劉珊珊海闊風清，椰林蔥郁中，風口上的AI大模型，站上博鰲亞洲論壇2024年年會多個主題分論壇的C位?！拔磥硎菍儆贏I大模型的，千行百業將被重塑或被革新挑戰?！北姸嗉钨e、參會人士在博鰲的激昂熱情，再次明確

標簽：

大模型

特斯拉與百度在自動駕駛的全維度較量

將在2025年見分曉

標簽：

自動駕駛

特斯拉

百度
2025年10個頂級GPU云平臺：Serverless+RL開啟AI普惠時代

近期，“AI新云”（NeoCloud）概念在科技圈和投資圈引發熱潮。今年3月，被業內稱作“英偉達親兒子”的AI基礎設施企業CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創公司，上市不到3個月市值飆升359%，達881億美元。CoreWeave的“身價暴漲”吸引了無數視線。對此，不少

標簽：

ai智能
阿里巴巴梭哈AI

2024年往前數三年，我們稱之為阿里巴巴失去的三年。

標簽：

阿里巴巴

ai智能
華為盤古大模型5.5發布：深度思考模型將上線

一場人工智能領域的革新風暴正從華為開發者大會現場席卷全球產業界。2025年6月20日，在東莞舉行的華為開發者大會HDC2025上，華為常務董事、華為云計算CEO張平安揭開了盤古大模型5.5的神秘面紗。這一全新版本在自然語言處理、計算機視覺、多模態、預測和科學計算五大基礎模型上實現全面突破，標志著中國
OpenAI 推出開源客戶服務代理框架支持商業或實驗用途

一行代碼未寫，企業已獲完整客服系統——這將是AI代理普及的新起點?！敖裉鞓酥局鳤I代理技術從實驗室走向產業的轉折點?！監penAI產品負責人OlivierGodement在項目發布聲明中如此評價。就在今日，這家AI巨頭通過HuggingFace平臺開源了一套完整的客戶服務代理框架，采用寬松的MIT許

標簽：

ai技術
夸克App上線“夸克老師”：AI實現個性化輔導，精準攻克學習難題

6月17日，阿里巴巴旗下智能信息平臺夸克App正式推出全新學習產品“夸克老師”——一款集講題、批作業、出題、找試卷于一體的AI家教。該功能依托通義千問大模型，通過指令微調、強化學習等前沿技術，首次實現“因材施教”的個性化輔導，標志著AI在教育領域的應用邁入新階段。技術突破：AI模擬真人教學，推理能力

標簽：

夸克

字節旗下AI工具豆包電腦版與網頁版上線“AI播客”功能，用戶可一鍵生成雙人對話播客

2025年6月17日，字節跳動旗下智能助手豆包正式在電腦版及網頁端全量上線“AI播客”功能，用戶只需上傳PDF文檔或網頁鏈接，即可一鍵生成由兩位AI主播演繹的對話式播客節目。這一創新功能憑借高度擬人化的語音效果和秒級轉化效率，迅速引發內容創作者、學生群體及職場人士的關注。技術突破：真人級語音交互，秒

標簽：

豆包ai
DeepSeek越強，Kimi越慌？

AI的生死競賽

標簽：

deepseek
全球AI巨頭正在賭：誰搞定MCP，誰就是未來老大

我不是危言聳聽，現在全球的AI巨頭都在做MCP，毫不夸張的說：誰能把MCP做起來，誰就擁有AI生態控制權，誰就是AI圈的老大。你們有沒有發現，MCP在2025年初開始特別火爆，互聯網技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺，提供50+預置MCP服務。不過大都只面向阿里系產品。(2)騰

標簽：

ai智能
對話李軍：人工智能是“第五范式革命”

2025國際人工智能程序設計精英挑戰賽（IAEPC）在香港中文大學成功舉辦。作為主辦方之一，歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中，李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決，更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港，更加推動和普

加載更多

大模型爭霸的下一站：不僅是超越GPT-4，更是尋求模型之間的平衡應用

相關文章

解密Kimi：大模型應用當紅頂流是如何練成的？

大模型的現在進行時：走出對話框，走向產業端

李彥宏放話：百度AI大模型絕不搶開發者飯碗

360 AI員工“紅衣”入職事業部承擔多項安全運營工作

AI大模型博鰲破局：端云結合，驅動新質生產力

特斯拉與百度在自動駕駛的全維度較量

2025年10個頂級GPU云平臺：Serverless+RL開啟AI普惠時代

阿里巴巴梭哈AI

華為盤古大模型5.5發布：深度思考模型將上線

OpenAI 推出開源客戶服務代理框架支持商業或實驗用途

夸克App上線“夸克老師”：AI實現個性化輔導，精準攻克學習難題

字節旗下AI工具豆包電腦版與網頁版上線“AI播客”功能，用戶可一鍵生成雙人對話播客

DeepSeek越強，Kimi越慌？

全球AI巨頭正在賭：誰搞定MCP，誰就是未來老大

對話李軍：人工智能是“第五范式革命”

熱門排行

編輯推薦

大模型爭霸的下一站：不僅是超越GPT-4，更是尋求模型之間的平衡應用

相關文章

熱門排行

編輯推薦

大模型爭霸的下一站：不僅是超越GPT-4，更是尋求模型之間的平衡應用