落地為王階段,在算力、平臺、模型、應用、生態等方面,都有持續深入的企業,對產業來說有更強的吸引力。
作者|劉珊珊
編輯|楊 銘
轟轟烈烈大模型,走到市場化大規模落地前夜。
8月15日,《生成式人工智能服務管理暫行辦法》施行。這是我國第一部AIGC管理辦法,明確行業健康、安全、規范同時,進一步促進生成式人工智能應用的加速落地。
這被解讀為,在國內已經打響半年,熱度空前的“千模大戰”迎來關鍵戰場節點,正式進入應用PK、“落地為王”階段。
硝煙背后,業界與大眾普遍關心話題是:當大模型逐漸變成一種基礎能力,如何進行技術上的迭代升級?又如何與更多行業結合,提速規?;?、商業化進程,在競賽長跑中占據領先地位?
這考驗著入局者的智慧,亦決定入局者未來命運走勢。
“通用人工智能絕不僅僅是單個企業、單個科研院所的使命,而是整個社會的機會,大模型賦能個體和行業的大未來正在到來。”8月15日,長達140多分鐘的訊飛星火認知大模型V2.0升級發布會上,身著傳統黑西褲、白襯衫的科大訊飛董事長劉慶峰說。
這是科大訊飛大模型又一次重要亮相——自5月6日對外正式展示至今,訊飛星火認知大模型剛好100天,期間經歷了V1.5的迭代。
當前V2.0 升級,是在提升通用能力基礎上,重點突破代碼能力和多模態能力。根據劉慶峰的說法,代碼能力是支撐認知大模型智慧的關鍵維度,多模態能力則是實現通用人工智能的必經之路。
這些能力,已同步在iFlyCode1.0(編程助手)、訊飛智作2.0(視頻創作平臺)、星火語伴2.0(練習口語)等應用和產品上,成為科大訊飛大模型落地應用和商業化上的重要一步。
從技術能力來看,訊飛星火V1.5Python語言效果只有41分,V2.0已有61分,接近ChatGPT。根據計劃,到今年10月24日,訊飛星火各個代碼緯度能力將比ChatGPT,實現中文超越、英文相當的水平,到明年上半年對標GPT-4。
這意味著,伴隨大模型進入“落地為王”的中場戰事階段,中國大模型也將迎來自己的領先時刻。
01大模型落地,從產業開始
命運齒輪,轉動于5月6日。彼時科大訊飛躬身入局,發布星火認知大模型1.0版本。
短短幾個月,大模型已在國內掀起一場場“肉搏戰”。通用、行業、垂直、開源和閉源等不同類型大模型,基于GPT,就像樹干上的枝丫一樣,瘋狂開枝散葉?;ヂ摼W、人工智能巨頭、創業公司、各類型中小企業、研究機構入局者數不勝數,幾乎每天都有不同類型大模型推出。
比如,10億級參數規模大模型——參數量被默認為通用大模型、垂直和行業模型區別重要因素。規模參數越高,對算力、數據、資源、技術要求就更高,但在國內,10億級參數以上多模態大模型卻超80個。
這并不意味著賽道的真正崛起。在國內,投資者逐漸趨冷,部分入局者黯然離場;在國外,ChatGPT誕生9個月花費近2億美元,高昂成本讓OpenAI有“破產風險”。
盲目燒錢不可持續,大模型成本、商業化落地兩大難題,讓大眾開始重新審視,大模型的經濟和社會價值。
各界“到底需要什么大模型”探討中,深耕行業,與生態結合,讓大模型在不同行業、不同類型企業發揮生產力作用,成為解決大模型難題,真正產生價值行業共識。
“誰能在具備社會剛需的應用場景落地,誰就能最先形成自我造血的良性循環。”劉慶峰明確斷言。在他看來,對科大訊飛這樣體量的公司,不做通用大模型就不可能在國際舞臺上未來爭得一席之地,連上桌機會都沒有。
通用還是垂直選擇題上,每家企業都有自己理由和抉擇。多模態通用大模型,被業界視為“綜合大學學生”,可能在某些垂類領域沉淀數據有所不足,卻是各個行業通向智能化、通用化必由之路,也是業界公認事實。
事實上,應用落地才是衡量一切大模型價值最高標準。最大難題是,如何搞懂行業、每個客戶需求,以及應用安全、易用,具備產業價值。
行業場景分為政府及大型企業(ToB、ToG)、個人(ToC)、中小企業(ToSME)等不同類型。不同行業與大模型結合本質邏輯不同,如ToB、ToG,往往要求邏輯復雜定制化場景中,必須做到可控、可追溯、可修正。ToSME同樣有定制化需求,但降本增效,給企業帶來增長價值,卻是衡量關鍵。
多位觀察人士認為,深入行業Know-how基礎上,和大模型能力融合,是大模型產業化最有效路徑。
劉慶峰認為,其前提是,要在國產算力安全和數據安全下,回歸場景驅動。“場景給客戶帶來的價值是什么,新增效益,還是節約成本、提高質量,同時能夠讓用戶快速地、低技術門檻訓練,才能夠使它賦能千行百業。”
這是科大訊飛在8月15日推出星火一體機重要原因——其與華為昇騰AI聯合研發,意在為每一家企業提供專屬的大模型,適合有數據安全需求的大型客戶。
“開箱即使用,提供從底層算力、AI 框架、訓練算法、推理能力、應用成效等全棧 AI 能力。”劉慶峰稱。
對科大訊飛來說,TOB端探索出的大模型賦能路徑是,在研、產、供、銷、服、管等各維度賦能。例如,大模型掌握行業基本能力、通用知識后,結合企業專屬知識庫,讓新員工也能迅速掌握經驗和知識,大幅提升工作效率。
不止科大訊飛,百度、騰訊、阿里、360都試圖通過為企業提供專屬大模型,加快產業融合、落地速度。“落地為王階段后,淘汰賽就會一觸即發。”多位觀察人士判斷。
必須意識到,受制于數據、算力、場景等限制,真正能跑通大模型商業化的入局者,數量將不會太多。其一,大模型仍會像互聯網、人工智能、云計算一樣,以互聯網、科技大廠為主導;其二,大廠不會局限于泛通用行業,而是“大模型+業務”深入垂類,走通用+垂類“并行”路徑。
比如科大訊飛,星火是多模態通用大模型,卻早已開枝散葉,應用在教育、醫療、辦公、數字員工、汽車、金融、工業等多垂類場景。
02千模大戰,訊飛星火憑啥第一?
當前,賽道各大玩家紛紛結合自身已有業務場景,試圖在大模型釋放更大價值前,搶占戰場制高點。
但客觀來看,科大訊飛目前是脫穎而出,走得最快的那個。
這從科大訊飛最新財報,大模型加持后的商業化增長,得到印證。今年上半年,教育、開放平臺及消費者、智慧汽車、智慧醫療、智慧金融等業務收入分別為22.9億元、24.2億元、2.1億元、1.9億元、0.9億元,分別同比增長3.63%、21.6%、26.14%、37.13%和22.19%。
"可以看到,大模型正實實在在推動產業前進。" 劉慶峰稱。
這也讓外界頗為疑惑:ChatGPT都遭遇變現難題時,科大訊飛為何領先業界,先一步嘗到大模型的商業化甜頭?
有人工智能從業人士對“極點商業”稱,大模型應用落地,其實是一條技術—產品—場景—規?;难葑兟窂?。“就像一個木桶,不能存在短板,才有成功接受市場考驗可能。”
大模型并非短期內一蹴而就,而是長期技術沉淀下所推動。1999年成立的科大訊飛,24年來在劉慶峰博士帶領下,一直是人工智能領頭羊形象存在,在深度學習算法、行業大數據、知識圖譜、多模態感知、系統工程等技術方面有著深厚積累。
外界未曾關注到的是,其在認知大模型上也有近十年沉淀。2014年,科大訊飛啟動“訊飛超腦”計劃,實現機器從“能聽會說到能理解會思考”。到2022年,累計摘取16項國際人工智能大賽的冠軍,其中認知智能領域有13項冠軍。
這離不開研發的持續投入。2022年,科大訊飛總研發投入33.6億元,研發人員數量占公司總人數的比例為約60%。而根據最新財報,科大訊飛上半年研發支出16.6億元,同比去年同期16億元增加大約3.8%。這是星火認知大模型短時間內多次重要升級關鍵。
研發投入、技術領先帶來的,是在G/B/C端應用場景不斷拓展,占據更多用戶心智。根據IDC《中國人工智能軟件2022年市場份額》,在語音語義AI市場,科大訊飛位于榜首,持續領先百度智能云、阿里云。
長達20年多年的技術沉淀,讓科大訊飛在大模型的打造上,有了“所有技術平臺完全自主研發,每一階段技術都可控”的底氣。
比如,在大模型多個關鍵技術,多家權威評測就將訊飛火星排在了第一位。
根據新華社研究院中國企業發展研究中心發布《人工智能大模型體驗報告2.0》(以下簡稱《報告》),訊飛星火以總分1013分位列本次國產主流大模型測評榜首位,超過商湯商量、通義千問等大模型,在四大評測維度中的智商指數、工具提效指數兩個維度獲得第一。
IT之家評測中,在完善度、功能性、易用性等維度,訊飛星火同樣超過文心一言、通義千問、360智腦,排在第一。
《麻省理工科技評論》則將訊飛星火稱為“最聰明”的大模型。在8個一級大類的600道題目的測試和盲評中,訊飛星火認知大模型V2.0在編程能力、理科綜合、邏輯思維、數學專項、語言專項和綜合知識6個大類中得分率排名第一,超過文心一言、商湯商量、通義千問,獲得“最聰明”的國產大模型稱號。
商業化探索上,有別大多數大模型,科大訊飛采取的是“技術能力+落地應用”并行策略。
一個細節是,科大訊飛在5月6日推出訊飛星火時,盡管發布時間并不領先,卻在現場明確了教育、醫療、金融、辦公、汽車、工業六個行業的應用場景。
此后兩次升級,也有明確加速上述行業探索邊界,推進其規?;瘧寐涞睾彤a業生態的構建——值得一提的是,科大訊飛是第一個在發布時,即明確階段性升級時間,并同步生態應用規劃的企業。
另外,LUMIE 10系列、智能辦公本X3等與訊飛星火結合的硬件產品,在展示技術能力時,也同步落地上市。
“不僅要做基礎通用大模型,還要同步做落地教育、醫療、辦公場景的產品應用。”今年4月,科大訊飛副總裁、研究院執行院長劉聰曾透露,為進一步提高大模型細分行業的實用性,科大訊飛實行了“1+N”攻關體系。其中,“1”是通用認知智能大模型算法研發及高效訓練底座平臺,“N”則是應用于教育、醫療、人機交互、辦公等多個行業領域的專用大模型版本。
“‘1’ 的能力融入到 ‘N’ 的產品應用中,‘N’ 的數據和場景更新到 ‘1’ 里迭代能力,構建一個循環的系統性工程。”劉聰說,訊飛大模型的技術、產品與服務,一直是圍繞產業應用場景來展開。
因此,外界也得以在短短三個月內,就清晰看到了科大訊飛大模型,在C端和B/G端的齊頭并進。
C端,科大訊飛消費者產品覆蓋AI辦公、AI學習、AI健康三大賽道,是國內AI應用產品最豐富的企業。
其中在AI學習賽道,僅僅是5-6月,科大訊飛AI學習機GMV就分別同比增長136%和217%;訊飛AI硬件在今年6.18獲得京東和天貓雙平臺7類銷售冠軍。
當前AI學習機為代表的智能學習硬件市場強敵林立、同質化嚴重,是各路巨頭都看上的市場,包括小度、步步高、猿輔導、作業幫、讀書郎等新老玩家齊聚??拼笥嶏w利用AI大模型能力,是其差異化突圍關鍵。
B/G端,作為AI“國家隊”,科大訊飛已在政務、電力、醫療、工業、司法、金融等行業深耕多年。
金融領域,訊飛和人??萍嫉冗_成合作,推進大模型技術在金融垂直領域的應用;工業領域,星火大模型搭載在羚羊工業互聯網平臺,智能匹配方案、服務商、專家等資源,實現供需匹配;醫療領域,訊飛診后康復管理平臺基于大模型技術進行了升級,與北京協和醫院、四川華西醫院等多所醫院進行合作,覆蓋20多個科室的主要病種。
在8月15日的發布會上,劉慶峰強調說,訊飛星火已完成金融、政務、汽車等領域9個專屬大模型數據顯示,在場景任務優化、私域知識增強等方面增效20%。
03競賽馬拉松,科大訊飛如何走更遠
大模型競賽是一場馬拉松,當下大模型仍然處于一個技術不斷迭代、培育市場、搶占用戶心智階段。
這意味著,眼前領跑之外,更重要的是未來如何走得更遠。
對于未來,科大訊飛從未掩飾它的“野心”,在5月推出訊飛星火時,就成為國內首家明確公布時間表的企業:今年10月24日,訊飛星火代碼各維度能力將超越ChatGPT,明年上半年對標GPT-4。
此前,因為種種原因,幾乎所有國內大模型都被外界認為,在技術、算法、可應用性上和ChatGPT存在差距。顯然,在算力、算法等底層能力上保持迭代優化,并和產業應用緊密結合,是科大訊飛能否實現上述目標的保障。
“對代碼能力的邏輯、算法、方法、體系、數據準備已經全部就緒,所需要的就是時間和算力。”劉慶峰稱。
技術永無止境。多次迭代后,訊飛星火大模型核心能力、應用和產品正不斷擴容。比如此次訊飛星火2.0,科大訊飛就對代碼能力進行5個維度的升級,包括:代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成。
圖像描述、圖像問答、識圖創作、文圖生成、虛擬人合成等多模態能力方面,訊飛星火大模型也全面升級。在代碼能力和多模態能力迭代基礎上,科大訊飛推出了能夠進行視頻創作的訊飛智作2.0、“智能編程助手iFlyCode2.0”、一鍵生成課件星火教師助手等,作為AIGC內容的生產工具。
代碼能力和多模態能力升級,意味著幫助專業程序員提升效率,創造更大價值。
從演示來看,借助iFlyCode1.0工具,簡單幾步Prompt完iFlyCode界面后,一行代碼都不用寫,就可以馬上實現“凌空手寫”功能。以前,經驗豐富的工程師要半天到1天才能完成,現在只需要幾分鐘。
過去一個月,iFlyCode在訊飛內部有2000多名員工實現試點應用,代碼采樣率超過30%,編碼效率提升30%以上,綜合工作效率提升15%,能明顯感受到大模型帶來的效率提升。
此外,哪怕不是編程高手的普通人,只要發揮想象力、基于對應用場景的認知,也可以“零門檻”進入代碼世界。
例如,使用Python畫紅色的心形線、用代碼生成“貪吃蛇”等小游戲、利用小視頻做表情包等需求,訊飛星火都能迅速完成。
此前,科大訊飛已將星火大模型的能力,包裝為中英文類人批改、英語類人口語對話等諸多應用場景,置入進T20、LUMIE 10、T10等AI學習機產品。有經銷商表示,用戶對搭載星火大模型的旗艦產品,熱情度非常高。
升級后的星火大模型,圍繞教育落地多款產品和功能。星火教師助手應用在訊飛教育數字基座上,零編程基礎的老師也能使用,并滿足學校管理數字化轉型中的個性需求和定制開發。AI 智能編程助手和 AI 創意繪畫伙伴的推出,標志著大模型對AI學習機賦能,更全面貼近新課標的要求。
代碼和多模態能力的升級,也是大模型降低門檻,解放生產力,釋放想象力的關鍵。目前,結合原有應用數據和場景描述,集成訊飛星火的代碼能力和語言理解能力,大大提升學校開發效率:原有開發應用周期從17天縮短至1天,投資成本由15萬降低至1.5萬元。根據科大訊飛透露,該教育數字基座已經在上海、湖北、安徽的一些學校試點落地。
產業生態上,為行業、政務提供業界領先、自主可控的私有化代碼能力平臺——比如星火一體機。另外,開發者生態也是大模型產業良性循環關鍵。
5月6日星火大模型發布后兩個月內,訊飛人工智能開放平臺開發者數量增加了85萬家。6月9日以來,已有4000余個助手開發者團隊加入進來,開發出了7800多個助手。
隨著生態集中,大模型不僅與產業應用更緊密,加快賦能千行百業進程,也能通過正向反饋,促進基礎研究和關鍵技術的自主迭代,更大程度解放生產力,釋放想象力。
科大訊飛就表示,當前多模態能力已廣泛應用在教育、醫療、工業、汽車、機器人等領域。真實世界獲得的數據,將提升產品終端的學習、訓練,從而推出更自主的工業機器人、更好的自動駕駛、走入家庭的陪伴機器人等等。
“這會是一個長期過程。在算力、平臺、模型、應用、生態等方面,都有持續深入的企業,對產業來說有更強的吸引力。”一位人工智能分析人士說。
寫在最后:
大模型落地道阻且長??傮w而言,當前大模型尚未完全離開“喧囂”,各行各業大多處于賦能階段,想收獲大規模產業價值,還有很長的路要探索。
如同比爾·蓋茨在《人工智能時代已經開啟》中所描述,自1980年圖形用戶界面出現以來,大模型是所見過最具革命性的技術進步。一場事關所有產業的商業變革,已經拉開了大幕。
通過技術、產品、應用深耕,訊飛星火大模型“長坡厚雪”,正率先走向產業深處。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!