<bdo id="vljxk"><rt id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt><rt id="vljxk"></rt><noframes id="vljxk"><rt id="vljxk"><delect id="vljxk"></delect></rt><noframes id="vljxk"><rt id="vljxk"></rt><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt>

首頁

營銷

財富

IDC

IT資訊

創業項目加盟: 招商合作; VIP特權; 最新創業項目; 創業項目排行榜

網站服務: SEO診斷; SEO顧問

營銷推廣服務: A5全媒體平臺; 品牌營銷; 企業會員; 小紅書推廣; 快手信息流開戶; 云主機優惠

當前位置：首頁 > IDC > 云計算 > 正文

品牌
標簽
企業會員

通義千問重磅開源Qwen2.5，性能超越Llama

2024-09-19 15:15 來源：互聯網我來投稿撤稿糾錯

　阿里云優惠券先領券再下單

9月19日云棲大會，阿里云CTO周靖人發布通義千問新一代開源模型Qwen2.5，旗艦模型Qwen2.5-72B性能超越Llama 405B，再登全球開源大模型王座。Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型，每個尺寸都有基礎版本、指令跟隨版本、量化版本，總計上架100多個模型，刷新業界紀錄。

Qwen2.5全系列模型都在18T tokens數據上進行預訓練，相比Qwen2，整體性能提升18%以上，擁有更多的知識、更強的編程和數學能力。Qwen2.5-72B模型在MMLU-rudex基準（考察通用知識）、MBPP 基準（考察代碼能力）和MATH基準（考察數學能力）的得分高達86.8、88.2、83.1。

Qwen2.5支持高達128K的上下文長度，可生成最多8K內容。模型擁有強大的多語言能力，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語言。模型能夠絲滑響應多樣化的系統提示，實現角色扮演和聊天機器人等任務。在指令跟隨、理解結構化數據（如表格）、生成結構化輸出（尤其是JSON）等方面Qwen2.5都進步明顯。

語言模型方面，Qwen2.5開源了7個尺寸，0.5B、1.5B、3B、7B、14B、32B、72B，它們在同等參數賽道都創造了業界最佳成績，型號設定充分考慮下游場景的不同需求，3B是適配手機等端側設備的黃金尺寸；32B是最受開發者期待的“性價比之王”，可在性能和功耗之間獲得最佳平衡，Qwen2.5-32B的整體表現超越了Qwen2-72B。

在MMLU-redux等十多個基準測評中，Qwen2.5-72B表現超越Llama3.1-405B

72B是Qwen2.5系列的旗艦模型，其指令跟隨版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等權威測評中表現出色，在多個核心任務上，以不到1/5的參數超越了擁有4050億巨量參數的Llama3.1-405B，繼續穩居“全球最強開源大模型”的位置。

專項模型方面，用于編程的 Qwen2.5-Coder 和用于數學的 Qwen2.5-Math都比前代有了實質性進步。Qwen2.5-Coder 在多達5.5T tokens 的編程相關數據上作了訓練，當天開源1.5B和7B版本，未來還將開源32B版本；Qwen2.5-Math支持使用思維鏈和工具集成推理（TIR）解決中英雙語的數學題，是迄今為止最先進的開源數學模型系列，本次開源了1.5B、7B、72B三個尺寸和一款數學獎勵模型Qwen2.5-Math-RM。

多模態模型方面，廣受期待的視覺語言模型Qwen2-VL-72B正式開源，Qwen2-VL能識別不同分辨率和長寬比的圖片，理解20分鐘以上長視頻，具備自主操作手機和機器人的視覺智能體能力。日前權威測評LMSYS Chatbot Arena Leaderboard發布最新一期的視覺模型性能測評結果,Qwen2-VL-72B成為全球得分最高的開源模型。

Qwen2-VL-72B在權威測評LMSYS Chatbot Arena Leaderboard成為成為全球得分最高的開源視覺理解模型

自從2023年8月開源以來，通義在全球開源大模型領域后來居上，成為開發者尤其是中國開發者的首選模型。性能上，通義大模型日拱一卒，逐步趕超美國最強開源模型Llama，多次登頂Hugging Face全球大模型榜單；生態上，通義從零起步、開疆拓土，與海內外的開源社區、生態伙伴、開發者共建生態網絡，截至2024年9月中旬，通義千問開源模型下載量突破4000萬，Qwen系列衍生模型總數超過5萬個，成為僅次于Llama的世界級模型群。

HuggingFace數據顯示，截至9月中旬Qwen系列原生模型和衍生模型總數超過5萬個

申請創業報道，分享創業好點子。點擊此處，共同探討創業新機遇！

相關標簽: 通義千問

相關文章

通義千問三款主力模型再降價最高降幅85%

9月19日，繼5月首次大幅降價后，阿里云百煉平臺上的三款通義千問主力模型再次降價。Qwen-Turbo價格直降85%，低至百萬tokens0.3元，Qwen-Plus和Qwen-Max分別再降價80%和50%。其中，Qwen-Plus推理能力追平GPT4，可應用于復雜任務，是效果、速度及成本均衡的最

標簽：

通義千問
通義千問升級旗艦模型Qwen-Max,性能接近GPT-4o

9月19日云棲大會，阿里云CTO周靖人宣布，通義旗艦模型Qwen-Max全方位升級，性能接近GPT-4o。通義官網和通義APP的后臺模型均已切換為Qwen-Max，繼續免費為所有用戶提供服務。用戶也可通過阿里云百煉平臺調用Qwen-Max的API。相比上一代模型，Qwen-Max在訓練中使用了更多的

標簽：

通義千問
通義靈碼AI編程能力再進化，說幾句話就能開發網頁

9月19日，在2024杭州云棲大會上，隨著通義大模型能力的全面提升，阿里云通義靈碼迎來重磅升級，從一年前只能完成基礎的輔助編程任務，進化到幾句話就能完成需求理解、任務拆解、代碼編寫、修改BUG、測試等開發任務，最快幾分鐘可從0到1完成應用開發，提升數十倍開發效率。自去年首次亮相以來，通義靈碼已入職中

標簽：

通義千問
通義萬相發布視頻生成模型,可一鍵創作影視級高清視頻

9月19日，在杭州云棲大會上，阿里云CTO周靖人宣布通義萬相全面升級，并發布全新視頻生成模型，可生成影視級高清視頻，可應用于影視創作、動畫設計、廣告設計等領域。即日起，所有用戶可通過通義APP及通義萬相官網免費體驗。據介紹，通義萬相首批上線文生視頻、圖生視頻功能，在文生視頻功能中，用戶輸入任意文字提

標簽：

通義千問
通義靈碼推出企業版，底座模型CodeQwen1.5登頂權威榜單

5月9日阿里云AI峰會，通義靈碼宣布推出企業版，滿足企業用戶的定制化需求，幫助企業提升研發效率。通義靈碼是國內用戶規模第一的智能編碼助手，基于SOTA水準的通義千問代碼模型CodeQwen1.5研發，插件下載量已超350萬。通義靈碼熟練掌握Java、Python、Go、JavaScript、Type

標簽：

通義千問

加載更多

熱門排行

信息推薦

熱門標簽