文 | 智能相對論
作者 | 沈浪
全球人工智能產業正被限制在了名為“算力”的瓶頸中,一側是供不應求的高端芯片,另一側則是激戰正酣的“百模大戰”,市場的供求兩端已然失衡。
然而,大多數人的關注點仍舊還是在以英偉達為主導的高端芯片領域。
半導體的創新固然關鍵,但是從現實處境來講,芯片從造出來到用起來,是一個龐大的系統工程,市場更需要一條能暫時繞開半導體創新的系統創新的技術路徑,來同步釋放算力,以滿足現階段爆發性的算力需求以及后期可持續的常態發展。
遵循著這一思路,就不難發現,以浪潮信息為代表的本土廠商已經開始了另一條釋放算力的創新路徑,即對服務器等硬件的基礎架構進行創新,在硬件層面“拓荒”,“壓榨”更多的硬件性能,打破算力桎梏。
只是這樣的路徑,似乎沒有想象中的那么簡單、輕松。
01 向底層“拓荒”,激活“牛鞭效應”
以服務器為例,一臺服務器有超過10000個零部件,同時還涉及30多個技術領域,包括材料學、熱力學、電池技術、流體力學、化學等一系列學科。此外,一臺服務器里還會應用超過100種傳輸協議。其制造過程更是需要經歷30多道流程,使用100多種加工和制造工藝等等。
若要對這樣的高精密硬件的基礎架構進行創新,絕非易事。
在四五年前,一些大規模數據中心用戶幾乎都遇到過一個相似的問題:風扇轉速越快,硬盤越有可能出現性能波動,嚴重時還會直接掉線,非常影響硬盤的讀寫性能。
浪潮信息的工程師團隊做了大量實驗,最終鎖定原因:風扇產生的噪音一旦達到120分貝,就非常容易造成硬盤磁頭偏移、讀寫效率下降,進而導致扇區失效乃至硬盤報廢、服務器宕機。
盡管這樣的問題看起來很小,卻對服務器的性能有著嚴重制約。如何解決服務器內部的風噪問題,成為了一個業內共同探索的議題。國際開放計算社區OCP組織成員包括FaceBook(現為Meta公司)、微軟、浪潮信息、戴爾等企業,共同發起Storage Vibration(存儲設備振動)項目,旨在解決相關的問題。
最終,浪潮信息的工程師們基于大量機理性研究和測試,發現了硬盤性能損失與聲壓強度間的數學規律,并構建出業界首個硬盤敏感度模型,量化出不同硬盤受到各類噪聲影響后的性能表現。
以此為依據,浪潮信息也得以對最新G7服務器系統進行了全方位的優化設計,譬如通過CFD流體動力學仿真改進·不同機箱布局下的風扇的葉片形態,抑制扇葉表面因渦流脫落形成的高頻噪音,提升硬盤讀寫效率50%;或是在機箱內通過設計40多種歌院式的消音結構,消除特定的高頻噪聲等等。
這些“繡花針”功夫是創新底層架構的關鍵,而看似很微小的基礎改良,卻是提升服務器性能、保障硬件平穩運行的重要因素。 在經濟學領域,有一個專業術語叫作“牛鞭效應”,指一端微小的擺動被不斷放大,到了另一端將演變為大幅擺動的趨勢。
從硬件的應用來看,基礎部件的改良也將激活“牛鞭效應”——從一張硬盤到一個服務器,再到一個數據中心,隨著硬件不斷疊加應用,底層的改良價值將被逐步放大,向上層傳遞,成為服務器安全運作、釋放算力、促進人工智能產業發展的重要保障。
類似的,現階段備受關注的芯片互聯技術,也是支撐大模型大規模算力場景的關鍵技術,尤其是單個服務器內部芯片高速直連,是實現大規模算力集群高效協同工作的基礎。作為全球領先的服務器廠商,浪潮信息在高速互連領域定義了業界第一個符合OAM(開放加速模塊)規范的8卡互連硬件系統,解決了高速信號的速率提升和信號失真問題,實現開放加速規范下芯片互連的最高速率,助力著人工智能產業的持續突破。
02 一場對性能的極限“壓榨”
在人工智能行業,算力的巨大需求和供給緊張已然是擺上臺面的事實。為什么業內廠商想要不斷地改進傳統的硬件架構去釋放算力,哪怕只是一點細微的聲噪優化,都不遺余力地花上四五年的時間去研究、探索和創新。
細究來說,算力的供應大抵可以歸結為兩條路徑,一是“增量拓展”,比如接入更多的服務器、建更多的數據中心,通過“堆量”的方式來提供更多的算力。二是“存量優化”,對原有架構、原有機器進行優化升級,通過“提質”的方式來把性能和效率提升起來。
其中,在這兩條路徑之下,“存量優化”又是必然的一條。無關乎未來算力是否緊張或寬裕,如何對現有的機器和架構進行升級優化,是行業發展的一個重要階段,只是時間早晚的問題。
值得一提的是,現階段,服務器行業已經有著充分的理由去推進“存量優化”這一路徑。
一方面,算力領域正在面臨著高端芯片緊張的問題,“增量拓展”被限制,那么業內廠商就不得不考慮“存量優化”的事情。
另一方面,源于服務器的特殊性,在服務器概念上的簡單的“堆量”只能堆出各種形態和規格的服務器,但對數據中心計算能力的提升并沒有什么實質性的幫助。
對此,在2014年,浪潮信息提出了“融合架構”的技術理念,旨在創造一種新的體系架構,將硬件設備中的同類資源整合成一個資源池,即便是不同的設備也能夠任意地整合,再通過軟件動態感知業務的資源需求,從而利用硬件重組的能力來滿足各類應用的性能需求。
這種“融合架構”看似是“增量拓展”,但核心則是“存量優化”。直到融合架構3.0的發布,就可以清晰地看到,這一技術理念打破了現有服務器的邏輯架構和應用模式,實現了整機柜級別的計算、內存、存儲與互聯等各種IT資源的池化,形成了以系統設計為中心的新架構模式,對構建高速高性能的互聯網絡起到了重要作用。
簡單來說,基于“池化”的概念,融合架構3.0將服務器內的計算資源、存儲資源、內存資源、異構加速資源等核心IT資源重新細化,并做了“重組”,從而能使其發揮出更高的性能和應用價值。
這相當于對現有的服務器性能做了一次極限地“壓榨”。 眾所周知,傳統服務器的性能利用率是無法達到100%,兩臺服務器相連得到大多是1+1<2結果,而基于融合架構3.0的支持,就有可能實現1+1>2的情況。
當然,這只是一個便于理解的理想化公式,現實大抵是達不到這個效果的。但是,其中的進步也是看得見的,特別是隨著服務器的增加,當我們再來估算1+1+1+...+N的效果時,在融合架構3.0下的服務器便能發揮出遠超傳統架構的性能和價值。
這是融合架構3.0的價值展望,同時也是“存量優化”這一路徑在服務器行業的價值呈現。正如上文提及的“牛鞭效應”,當底層細微的創新不斷被放大到一個硬件、一個計算集群、一個產業生態,那么其發揮出來的作用將遠超過往。
03 在算力之外
當前,在服務器行業,就能看到類似的信號。
繼續以融合架構3.0為例,其打破了以往“以CPU為中心”的設計理念,從整體出發,以系統為中心,通過硬件解耦將異構計算、內存、存儲等資源轉變為可獨立擴展的資源池。
在這個過程中,不僅實現了亞微秒級遠端內存訪問,并且還構建出了一種邏輯上可遠端共享的內存資源池,讓多臺主機訪問同一個內存池,從而大大提高了數據交換的效率,讓Spark、Hadoop和機器學習等使用分布式數據框架的應用,能夠更順暢地實現框架內各節點間的數據交換與協作。
也就是說,融合架構3.0解決的不僅僅是服務器性能、算力釋放等問題,實際上還繼續向上層拓展,解決了系統應用的問題——服務器的架構創新在算力之外,帶來了全新的價值呈現。
類似的,放眼全球市場,微軟與英偉達合作推出的虛擬機Azure ND H100 v5 VM系列,正基于強大的硬件能力支持結合Quantum-2InfiniBand網絡互連,從而幫助企業更好、更高效地處理生成式AI任務。
現階段,大多數硬件升級并非單線的,而是考慮到上層的應用需求,如大模型訓練、生成式AI任務等,結合軟件系統、網絡服務等進行融合創新,從而為應用場景服務。
縱觀當前人工智能產業在算力層面的困頓處境,以算力牽動整個人工智能產業的發展是必然的趨勢。而業內廠商在解決算力供給問題的過程,也將同步帶動其他模塊的升級。換句話說,解決算力問題就不能局限在高端芯片領域,更要從其他的路徑尋求多元化的發展。
在這個階段,以英偉達為主導的高端芯片領域和以浪潮信息為代表的服務器硬件升級,都將站在市場的聚光燈下。今天的市場,需要更多元、更勇敢、更執著的探索者、創新者。
*本文圖片均來源于網絡
#智能相對論 Focusing on智能新產業新服務,這是智能的服務NO.247 深度解讀
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。
•AI產業新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
擁抱AI,賦能白糖產業創新發展隨著新一輪科技革命和產業變革深入發展,行業數字化轉型進入深水區,人工智能產業規??焖僭鲩L。大模型的出現,將躍升人工智能供給能力,更好應對行業數智化升級面臨的挑戰,帶來新發展機遇。2023年,隨著OpenAI公司大模型ChatGPT4.0的發布,今年科技領域乃至各行各業的
根據北京市經信局公布的數據,截止到2023年10月初,國內公開的AI大模型數量已經達到238個。盡管學術界對大模型的參數量并沒有明確的標準,許多10億級參數的模型并不能和GPT4相提并論,國內大模型的爆發式增長,無疑揭示了一個既定事實:和每一次風口出現時一樣,總有人一窩蜂地涌入,試圖在新一輪的創業潮
Manus撕開一道真相
文/八真來源/節點財經具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創立的智元機器人。近期,從事新材料研發與生產的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機器人及相關主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內團隊也將大幅裁撤——原有120人規模團隊除40余
四個月前邀請碼炒至10萬元,如今官網變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業出海潮涌。7月11日,打開Manus官網的用戶發現一則突兀提示:“Manus在你所在的地區不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發中”的樂觀聲明。同時,Manus官方微博和小紅書
文/十界來源/節點財經一場圍繞算力自主的競賽,正在科創板上演。近日,國產全功能GPU廠商摩爾線程遞交科創板招股書,擬募資約80億人民幣,成為今年上半年科創板擬募資規模最大的沖刺者,也打響了“國產英偉達”上市的第一槍。據招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發與銷售,以自主
“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創辦的AI公司。昨天就爆出新聞,百川智能的聯合創始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關鍵:(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術聯合創始人謝劍將離職。他是百川只能的
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術為核心,徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現對同一文檔內任意混合語言文本的精準識別,為全球化企業、跨境業務及多元文化場
“宇樹已形成硬件、算法、場景聯動的業務飛輪,自研率超95%的技術壁壘讓其成為全球機器人賽道不可忽視的中國力量?!笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日,據每日經濟新聞從宇樹科技投資方處獲悉,國內人形機器人領軍企業宇樹科技(UnitreeRobotics)已明確計劃于科創板IPO,預計
推理與多模態的終極融合,將徹底終結用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產品將整合現有的多個強大模型,特別是融合專注推理能力的“O系列”與具備多模態功能的“GPT系列”,為用戶提供前所未有的統一體驗。OpenAI開發者體驗負