OpenAI一紙禁令,挑動了大模型行業的神經。但沒有什么阻礙,可以抵擋技術向上的決心。在不少大模型廠商開出優惠價格,試圖從OpenAI禁令中截流用戶的同時,國產大模型的代表企業科大訊飛,拿出了直面技術挑戰的勇氣。
6月27日,科大訊飛在北京國家會議中心舉行訊飛星火4.0發布會。在“懂你的AI助手”這個主題下,訊飛星火大模型不但在8個國際主流測試集中排名第一,實現了對GPT-4 Turbo的全面對標,還對商業化落地、生產力探索做出了更全面的闡釋,前瞻了行業的“Next-level”。
這一次,星火大模型掀起了新的巨浪。
自力更生,星火大模型成國產力量代言人
在國內外總共覆蓋中英文的12項主流測試集,訊飛星火大模型V4.0在其中8項全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面這三位,正是目前英文世界大模型的戰力天花板選手。
換一個指標,去年,科大訊飛參與設計了國產通用認知智能大模型測評體系,包含由481個測試項組成的7個方面。而如今,星火大模型V4.0在其中的文本生成、語言理解、知識問答、邏輯推理、數學能力五個方面超越了GPT-4 Turbo,僅在代碼能力和多模態能力上仍有一定差距。
不過從數據來看,文本生成(80.2%)、語言理解(82.3%)、知識問答(85.7%)、邏輯推理(82.2%)、數學能力(86.5%)、代碼能力(81.2%)、多模態能力(78.4%)這組數據放在一起,星火大模型V4.0總體已然算是國產大模型的能力代表。
具體來看,GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0,重點都放在多維度信息組成的復雜指令、更考驗邏輯任務能力的空間推理等高階能力上。根據科大訊飛發布會現場的介紹,星火大模型V4.0不僅在長文本等通用能力上整體打平GPT-4 Turbo,而且更加擅長利用已有資料進行聯系推理——比如解讀幾張有聯系的圖片的關系,為其補全內容情節,并減少“幻覺”的出現。
有趣的地方在于,星火大模型V4.0其實在多模態能力方面,實現了對GPT4-Turbo的部分超越,比如科研、金融、醫療、司法和辦公等專業領域的圖文識別能力。這代表星火大模型V4.0的側重點明顯不同于普通的通用大模型。它更側重于某些垂直領域的應用潛力。
對此,科大訊飛董事長劉慶峰在演講中做了一些闡述:“大模型不僅可以寫詩、作畫,在改變工業、改變科研范式等方面已經實實在在發揮作用,包括我們和中國科學技術大學做的合成類的科學創新,比如說化學;還有與合肥綜合性國家科學中心能源研究院合作,在推進大模型賦能核聚變整個過程中更快地預測、更好地應對各種各樣的異常情況。”
應用,已經成為星火大模型V4.0的重頭戲。只有真正用起來,能力才會有價值。
以訊飛星火APP為例,自2023年9月全面開放以來,訊飛星火APP在安卓公開市場累計下載量達1.31億次?,F在,全新升級的訊飛星火APP,允許消費者用自己的知識庫打造“更懂你的AI助手”。換句話說,專屬于個體的智能體。
按照劉慶峰在演講中透露的信息,訊飛星火APP使用的高峰期是工作日的工作時間段,意味著它真的變成了不少用戶的剛需。這是對“AI只能用來玩玩”的刻板印象的有力回擊,也是星火大模型價值的體現。
但更讓人激動的應用,其實還在蓄力。個人能從星火大模型中找到助手,企業乃至社會,將從中汲取更大的力量。這就是整個大模型產業的“Next-level”,它的亮點就在落地的最后一公里,以及那些暫時還是暢想的形式。
真正的Next-level,藏在最后一公里
幾個簡單的問題,可以讓我們對星火大模型V4.0的未來進化更有數。
首先,智能體為什么值得期待?九合創投在近日召開的年會上發布了《不朽的計算:比特連接世界,詞元生成未來》報告。其中提到,“模型是能夠沉淀智慧的計算形態”。傳統算法是數學結果,一次使用不具備普及性。但模型可以持續進化,適應多維度的使用需求。而封裝為智能體之后的超級模型,已經是特定領域的智慧結晶。它具有不可估量的復用價值。
以星火企業智能體平臺為例,科大訊飛已經首批創建了32個企業智能體,可以深入業務流程,滿足企業的需求。而這個過程其實非常輕松,企業只需要提出需求就可以開始創建智能體,經過功能驗證后,就可以真實上馬,并可以和企業內部辦公平臺打通。
從市場價值來看,訊飛星火大模型從去年發布到現在,已經和國家能源集團、中國石油、中國移動、交通銀行、大眾汽車、海爾集團、美的集團等行業領軍企業建立合作,證明其使用價值得到一線認可。
其次,為什么是訊飛?因為企業智能的底層除了大模型技術,還有對企業業務的理解,對分門別類的場景的認知,這不是坐在辦公室里就能拍腦袋想出來的。訊飛建立這些認知,花費了數十年的時間和遍布各行各業的具體嘗試。所以,智能體是新物種,但在訊飛和星火大模型的共同支持下,它會很快和現有生態相融。
換句話說,訊飛的領先,是星火大模型的技術領先和自身To B和To G業務領先的復合結果。2024年6月,訊飛剛剛榮獲國家科學技術進步獎一等獎,獲獎項目名為“多語種智能語音關鍵技術及產業化”,技術和產業化的雙劍合璧,成為一塊勛章。上半場的技術較量,訊飛能和OpenAI掰手腕。下半場的應用較量,訊飛更懂中國市場。
最后,星火大模型V4.0背后的進化,對智能體概念的探索,遠期價值恐怕會遠超普通人的想象。目前,還只是這個概念的蓄力階段。
一個很關鍵的問題是,從GPT-4 Turbo到星火大模型V4.0,我們越來越關注大模型的多模態能力、空間和邏輯推理能力、對復雜指令的理解和執行能力等等。這種需求引導下發展的大模型和智能體,注定用于和現實世界融合交互。
現代機器人之父羅德尼·布魯克斯(Rodney Brooks)在1991年發表的《沒有表征的智能》論文中提出,傳統智能基于復雜算法和內部數據模型是錯誤和片面的,真正的智能行為要從自主機器與環境的物理交互中產生。這個想法更加適合今天大模型和智能體的發展,或者說“具身智能”的概念——能理解和推理物理世界,并且產生互動。
“AI教母”李飛飛選擇的創業方向就是與之類似的“空間智能”。她曾在TED的演講上舉過一個例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她說,人類大腦可以評估“這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關系”,所有推理都基于這些認知。
無疑,星火大模型V4.0也好,GPT-4 Turbo也罷,都是在朝著這種意義上的智能發展。
劉慶峰曾提出星火大模型的四條商業化路徑,其中一條就是基于“超腦2030計劃”推動機器人走進千家萬戶,重頭戲在于全棧機器人能力,而這又源于大模型的多模感知和多維表達。
對科大訊飛來說,好消息是它所掌握的應用經驗,很有可能讓星火大模型在向空間智能、具身智能的發展過程中步步領先。比如現在,星火個人智能體和企業智能體的落地,其實已經在調動現實要素對大模型和智能體進行完善。只不過,目前的應用停留在數字空間,還沒有深入現實進行交互。
但我們相信,這一天會比想象的更早到來。畢竟,從去年的星火大模型1.0版本到如今的4.0版本,科大訊飛從無到有,創造出世界一流的大模型能力和應用,已然是一個奇跡。
而在當下這個世界中,地緣層面的割裂已經影響到大模型世界的完整性。當OpenAI發出斷供宣言,有星火大模型這樣的一線玩家能夠頂上,不得不說是中國大模型產業的幸運。在這一年,中國人工智能領域的實力,正在這些領先者身上,閃耀著新的光芒。
來源:松果財經
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
每一輪技術浪潮出現時,沖在最前面的都是朝氣蓬勃的年輕人。當大模型代表的人工智能浪潮席卷全球,作為移動互聯網“原住民”的年輕開發者,可以說是最活躍的群體。他們的臉龐還有些稚嫩,但在技術和方向上有著自己的想法,在火熱的AI賽道里加速狂奔,努力打下一片新天地。面壁智能CTO曾國洋就是其中的佼佼者,26歲的
如果說2023年是大模型的資格賽,融資額度決定了能否晉級,2024年已然快進到了淘汰賽的階段。字節跳動、阿里云、百度智能云、騰訊云等先后在5月中下旬加入“價格戰”,輕量級模型直接免費,主力模型的API價格普遍下調了90%以上。曾經以“燒錢”著稱的大模型,迅速進入到“白菜價”時代。當時就有人提出這樣的
明知產能嚴重過剩的新能源企業卻還在重金擴產,多半因為他們花的不是自己的錢;明知極度燒錢的AI大模型卻開始打價格戰,多半因為他們并不靠這東西掙錢。所有投資人必備的一項技能,就是中觀行業景氣度及商業模式對比。很明顯,AI有很多的商業邏輯與其他行業非常相似。就比如:有實力的才能卷、免費的往往才是最貴的。打
近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發熱潮。今年3月,被業內稱作“英偉達親兒子”的AI基礎設施企業CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創公司,上市不到3個月市值飆升359%,達881億美元。CoreWeave的“身價暴漲”吸引了無數視線。對此,不少
一場人工智能領域的革新風暴正從華為開發者大會現場席卷全球產業界。2025年6月20日,在東莞舉行的華為開發者大會HDC2025上,華為常務董事、華為云計算CEO張平安揭開了盤古大模型5.5的神秘面紗。這一全新版本在自然語言處理、計算機視覺、多模態、預測和科學計算五大基礎模型上實現全面突破,標志著中國
一行代碼未寫,企業已獲完整客服系統——這將是AI代理普及的新起點?!敖裉鞓酥局鳤I代理技術從實驗室走向產業的轉折點?!監penAI產品負責人OlivierGodement在項目發布聲明中如此評價。就在今日,這家AI巨頭通過HuggingFace平臺開源了一套完整的客戶服務代理框架,采用寬松的MIT許
6月17日,阿里巴巴旗下智能信息平臺夸克App正式推出全新學習產品“夸克老師”——一款集講題、批作業、出題、找試卷于一體的AI家教。該功能依托通義千問大模型,通過指令微調、強化學習等前沿技術,首次實現“因材施教”的個性化輔導,標志著AI在教育領域的應用邁入新階段。技術突破:AI模擬真人教學,推理能力
2025年6月17日,字節跳動旗下智能助手豆包正式在電腦版及網頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網頁鏈接,即可一鍵生成由兩位AI主播演繹的對話式播客節目。這一創新功能憑借高度擬人化的語音效果和秒級轉化效率,迅速引發內容創作者、學生群體及職場人士的關注。技術突破:真人級語音交互,秒
我不是危言聳聽,現在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態控制權,誰就是AI圈的老大。你們有沒有發現,MCP在2025年初開始特別火爆,互聯網技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預置MCP服務。不過大都只面向阿里系產品。(2)騰
2025國際人工智能程序設計精英挑戰賽(IAEPC)在香港中文大學成功舉辦。作為主辦方之一,歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普