文 | 智能相對論
作者 | 陳泊丞
在2024世界人工智能大會暨人工智能全球治理高級別會議產業發展主論壇上,百度創始人、董事長兼首席執行官李彥宏談了些對于AI大模型的看法,語驚四座。
他先是指出,“百模大戰造成了社會資源的巨大浪費,尤其是算力的浪費。但同時也使得我們追趕世界上最先進基礎模型的能力得到了建立。”
而后又強調,“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值。”同時李彥宏也表示,要跳出移動時代的思維邏輯,避免掉入“超級應用陷阱”,不是只有10億DAU的應用才叫成功。
可以說,李彥宏的發言挺激烈的。這似乎也是第一次有大佬在這么高級別的場合去把“百模大戰”和大模型的發展攤開了說。
當然,秉持著類似觀點的,也不只是李彥宏。
金沙江創投主管合伙人朱嘯虎在6月的黑馬大課上也提到,很多創業者盲目投資AI底層技術。雖然創造了“百模大戰”的盛況,但也造成了社會資源浪費。
他強調,“很顯然,AI創業的賺錢風向,已經徹底變了。”
怎么變?
除了李彥宏、朱嘯虎之外,還有獵豹移動董事長兼CEO、獵戶星空董事長傅盛,智譜AI COO張帆、百川智能創始人王小川等大佬在不同的場合也或多或少談到了大模型行業競爭轉變的方向,能最終達成共識的關鍵點在于“場景”和“應用”。
聚焦基礎大模型的“卷”所導致的“百模大戰”似乎該喊停了,大模型的重點還是得“卷”場景應用。
大佬們在這一點上達成了共識。今年以來,大家的口風都變了!
不要過度競爭基礎大模型,該“卷”場景應用了
在過去一段時間內,美國涌向了大量專注于大模型應用開發的創業公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。
同時,像OpenAI、Anthropic這樣的大模型頭部領軍企業以及如谷歌、微軟等科技巨頭也在致力于利用開源模型或自主研發的基礎模型,開發出各種應用場景的解決方案。
GPTs的推出以及OpenAI宣稱的一系列給開發者讓利的行為,都旨在吸引更多的創業團隊參與到GPT技術的創新和應用中,從而豐富GPT生態系統,幫助OpenAI在接下來的時間內占據大模型領域在場景應用方向的優勢。
以國外大模型行業的趨勢來看,國內這些大佬們的口風轉變并非空穴來風。
目前,百度文心一言的日均調用量已經超過5億,而在兩個月前百度官方才剛剛宣布文心一言的日調用量超過2億。
期間2個月的時間,調用量就發生如此之大的變化,可見大模型要“卷”場景應用不僅僅是廠商們的推動,還有整個市場的需求已經擺上臺面,呈現出爆發式增長趨勢。
類似的信號也在阿里云的主場上釋放。
在世界人工智能大會上,阿里云CTO周靖人公布了近期通義大模型和阿里云百煉平臺的最新進展——近2個月,通義千問開源模型下載量增長2倍,突破2000萬次,阿里云百煉服務客戶數從9萬增長至23萬,漲幅超150%。
談及大模型,比起參數上的比較,現如今國內的大佬們似乎更愿意去告訴市場自家的大模型如何好用,有多少人用,接下來還能怎么用等等一系列與場景應用落地相關的事情。
而以朱嘯虎為代表的投資者們也開始在應用層去尋找大模型的投資機會。
市場的風向變了,不僅僅只是大佬的口風在變。
“超級能干”的應用在哪?
“AI時代,‘超級能干’的應用比只看DAU的‘超級應用’更重要。”在世界人工智能大會上,李彥宏試圖為接下來的大模型應用開發趨勢下一個結論。
然而,“超級能干”的應用或許理解起來并不難,市場懸而未決的問題在于這樣的應用是如何開發出來的,又是如何推向大眾?
基于現階段的行業表現,「智能相對論」認為有幾點思考值得探究。
一、在“超級能干”的應用背后,大模型技術的迭代和適配是必要的。
行業的趨勢大多殊途同歸,大模型領域在今年以來掀起的MoE架構迭代趨勢,則是代表了在技術方面大模型正為“卷”場景應用而作支撐。
如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆侖萬維的天工AI、浪潮信息的源2.0-M32、通義千問團隊發布的Qwen1.5-MoE-A2.7B等國內外大模型都采用了MoE架構。
MoE架構通過引入專家網絡(Expert Networks)和門控機制(Gating Mechanism)實現了模型的稀疏化和模塊化,在數據處理、算力資源調配、輸出結果優化等方面都有相當不錯的反饋。這為大模型的場景應用落地和推廣提供了非常關鍵的技術支持。
比如,微軟就提出了一個端到端的MoE訓練和推理解決方案DeepSpeed-MoE,其通過深度優化MoE在并行訓練中的通信,減少通信開銷,實現了高效的模型并行。此外,DeepSpeed-MoE還提出了基于微調的專家排序機制,可以根據訓練過程中專家的損失動態調整輸入樣本到專家的分配,提升效果。
二、“超級能干”的應用意味著一場更商業化的生態競爭。
技術沒問題,但商業化路徑不清晰仍然會在今天的市場面臨崩盤。日前,微軟官網更新了一條通知——“GPT Builder即將停用”。曾經掀起AI圈無數熱議與高潮的GPTs似乎正在走向敗局。
誰又能想起,當時GPTs概念橫空出世的那場發布會還被外界形容為“OpenAI的iPhone時刻”。
OpenAI本意是想借助低門檻的技術能力以及全球開發者們共同打造出一批“超級能干”的應用,結果卻因技術問題帶來的體驗瑕疵以及模糊不清的貨幣化政策,讓GPTs這一概念的商業化路徑始終走不通,最終只能“涼涼”。
“超級能干”的應用大多是建立在成熟的商業生態之上,或許全球的AI廠商都需要認清楚這一點。值得一提的,在大洋的彼岸,阿里云在2022年11月牽頭發起的開源AI模型社區剛剛斬獲2024 SAIL之星獎的魔搭ModelScope。
歷經一年多的發展,魔搭社區已成為國內規模最大、最活躍的AI模型社區,匯聚5500多款優質模型和上千數據集,為超過560萬開發者提供了模型及免費算力服務?;蛟S,OpenAI沒能走通的生態路徑,在中國會有新的生機吧。
三、“超級能干”的應用必然萌芽于行業場景中。
朱嘯虎送給大模型創業者的忠告,“不要迷信AI,聚焦尖刀場景盡快落地。”——場景是孵化“超級能干”應用的搖籃,然而更深入地來看,也不能只看場景,最終還得看用戶反饋和價值呈現。
醫療、教育、金融、制造、交通、農業等等這些行業領域是大模型應用“高發”場景,但打造出來的智能體或解決方案究竟如何,“如人飲水,冷暖自知”罷了。
To B的項目看效率。在快遞領域,目前通過大模型來幫助處理訂單,就可以做到了“一張圖、一句話寄快遞”,不再需要其他繁瑣的流程,時間從3分多鐘縮短到19秒。而且90%以上的售后問題,也都由大模型來解決。——這樣的效率提升,才稱得上是“超級能干”。
To C的場景看用戶。此前,在高峰期,百度的高考智能體每天要回答超過兩百萬個考生的問題。對于全國1000萬的考生來說,這一比例是相當高的。——這樣的用戶數量,也算得是“超級能干”。
今天,大模型應用覆蓋文本生成、數據處理、PPT制作、市場營銷、客服售后、醫療診斷等各類通用的和垂直的場景。實際上,市場并不缺場景,而是缺乏能干、有效的應用,“卷”應用須在場景中找用戶、找價值。
*本文圖片均來源于網絡
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。
•AI產業新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
文|智能相對論作者|陳泊丞蘋果終于公布了最新的AI進程。一個月前,正如此前預期的那樣,人工智能是今年WWDC發布會的焦點。全程105分鐘的主題演講,就有40多分鐘用于介紹蘋果的AI成果。蘋果似乎還有意玩了一把“諧音?!?,重新定義AI為“AppleIntelligence”。但不管怎么說,此次蘋果AI
北京時間6月25日凌晨,多個地區的OpenAI用戶收到了一封來自官方的郵件。郵件顯示:“您所使用的APl流量來自OpenAl目前不支持的地區。我們將從7月9日開始采取額外措施,阻止來自不在我們支持的國家和地區列表中的地區的APl接口?!彼^的API,就是應用程序編程接口。開發者通過使用OpenAI的
OpenAI一紙禁令,挑動了大模型行業的神經。但沒有什么阻礙,可以抵擋技術向上的決心。在不少大模型廠商開出優惠價格,試圖從OpenAI禁令中截流用戶的同時,國產大模型的代表企業科大訊飛,拿出了直面技術挑戰的勇氣。6月27日,科大訊飛在北京國家會議中心舉行訊飛星火4.0發布會。在“懂你的AI助手”這個
近日,谷歌母公司Alphabet在美股盤后公布了第二季度財報,其中,總營收847億美元,同比增長14%,高于分析師普遍預期的842億美元
商業化愿景下,AI應用元年已經到來。2024年以來,諸多已布局AI大模型技術的科技公司都開始加速推出AI應用產品。比如,今年7月16日,騰訊旗下大模型應用“騰訊元寶”推出“3D角色夢工廠”玩法,成為首個擁有打印級3D生成能力的通用大模型App。無獨有偶,百度也推出了一款名為“文小言”的AI數字人社交
文|智能相對論作者|葉遠風松弛感,是這屆奧運會開幕式給很多人留下的直觀感受。而讓用戶觀看奧運的過程也獲得松弛感,同樣是各路APP在奧運季努力的方向。從各種大型賽事報道來看,一般來說,APP們往往致力于整合信息、形成專題頁面,方便用戶一站式瀏覽,從容選擇、查看。但“智能相對論”觀察到,一些嘗試推動用戶
AIO是什么?AIO原意是指集成在一起的意思,但這里的AIO,不是AllInOne,是AI+O結合在一起的。AI,懂的人知道,不是愛,是ArtificialIntelligence(人工智能)的簡稱。而O,是英文Optimization(優化)的首字母。所以這里的AIO是指人工智能優化的意思。AIO
北京時間7月27日凌晨,巴黎奧運會即將開幕。今年,云上轉播將正式超越衛星轉播,成為奧運賽事走向全球數十億觀眾的主要轉播方式。巴黎奧運會預計11000小時的賽事直播畫面,將通過阿里云向全球分發。這將是1964年奧運會開始衛星電視轉播以來,又一次重大技術進步。據介紹,OBSLiveCloud將成為202
7月26日,巴黎奧運會開幕在即,國際奧委會主席巴赫在國際轉播中心舉行的活動中表示,2024巴黎奧運會展現了奧運轉播的未來,廣泛應用的阿里AI技術正在將巴黎奧運轉播帶到新的高度。(國際奧委會主席巴赫)在巴黎奧運會上,云計算將替代衛星成為奧運賽事直播的主要方式。超過三分之二奧運直播信號將通過阿里云支撐的
大模型落地呼聲越來越大,但是以什么方式落地依然有爭議。國內如此,國外亦然。不同的思想對應著不同的方法論。一部分AI企業忙著更新通用大模型打榜,做一些視頻生成工具之類的熱門產物,巨頭多數屬于此類。另一部分則在專注行業大模型或是平臺,例如國外的Glean和國內的第四范式,后者最近還發布了AI數字人視頻合
2023年是AI大語言模型爆發的一年,以OpenAI推出的GPT大模型為起始,整個行業開始從“推理式AI”向“生成式AI”邁進。據MarketDataForecast預測,全球AI市場規模將從2023年的1502億美元增長到2030年的13452億美元,年復合增長率高達36.8%。在此背景下,國內如
隨著AI產業化和產業AI化成為業界共識,大模型的“新賽季”來了。2024年是國產大模型全面商業化的元年,各地人工智能產業發展的政策密集出臺。同時,在2024世界人工智能大會(WAIC2024)上,各大AI廠商紛紛表示要讓大模型落地應用場景。不過,對于大模型商業化的路線,科技巨頭和大模型初創公司之間存
對所有大模型而言,其真正考驗如同科大訊飛創始人劉慶峰所說,在最后一公里的應用和商業化落地上。作者|Cindy編輯|楊銘恐怕誰也不會想到,百模大戰進入商業化下半場,圍繞大模型大規模、曠日持久的戰爭,竟是開源和閉源路線的交鋒。最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅、朱嘯虎、