<bdo id="vljxk"><rt id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt><rt id="vljxk"></rt><noframes id="vljxk"><rt id="vljxk"><delect id="vljxk"></delect></rt><noframes id="vljxk"><rt id="vljxk"></rt><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt>

當前位置:首頁 >  科技 >  IT業界 >  正文

英特爾oneAPI 2023工具包正式上線,幫助開發者利用英特爾硬件的先進功能

 2022-12-20 17:28  來源: 互聯網   我來投稿 撤稿糾錯

  阿里云優惠券 先領券再下單

為進一步幫助開發者利用英特爾硬件的先進功能,近日,英特爾宣布英特爾® oneAPI工具包的2023年版本已在英特爾®開發者云平臺(Intel® Developer Cloud)上線,并正在通過現有的渠道推送。

新的oneAPI 2023工具包支持即將推出的第四代英特爾®至強®可擴展處理器、英特爾®至強® CPU Max 系列和英特爾®數據中心GPU,包括Flex系列和新的Max系列。這些工具可提升性能和生產力,并增加了對新的Codeplay1插件的支持,使開發者能更容易地為那些非英特爾的GPU架構編寫SYCL代碼。這些基于標準的工具提供了硬件方面的選擇,也讓在跨架構系統上運行的高性能應用的開發變得更加輕松。

英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫、分析和移植工具,以及優化后的AI和機器學習框架,讓開發者能為oneAPI支持的CPU、GPU和FPGA構建高性能、跨架構的應用。開發者可使用這些工具快速實現性能目標,并通過單個代碼庫節省時間,從而將更多時間用于創新。

新版本的oneAPI工具包可幫助開發者利用英特爾硬件的先進功能:

· 第4代英特爾至強可擴展處理器和至強CPU Max系列,內置英特爾®高級矩陣擴展(英特爾® AMX)、Quick Assist 技術(QAT)、英特爾®AVX-512、bfloat16 及更多。

· 英特爾®數據中心GPU,包括內置基于硬件的AV1編碼器的Flex系列,以及Max系列。Max系列提供靈活數據類型的支持,內置英特爾® Xe矩陣擴展(英特爾®XMX)、矢量化引擎(vector engine)、英特爾®Xe-Link互聯擴展和其它功能。

oneAPI 2023工具包具有先進的軟件性能:

· 英特爾® Fortran編譯器(Intel® Fortran Compiler)提供了完整的 Fortran 語言直至 Fortran 2018標準的支持,并擴展了對 OpenMP GPU 分流的支持,加快了符合標準的應用程序的開發。

· 英特爾® oneAPI數學內核庫(oneMKL)包含OpenMP 分流能力的擴展,提高了可移植性。

· 英特爾® oneAPI 深度神經網絡庫(oneDNN) 支持第四代英特爾至強處理器和Max系列CPU處理器的高級深度學習功能,包括英特爾®AMX、英特爾®AVX-512、VNNI 和 bfloat16。

通過豐富的SYCL支持,以及代碼遷移和分析工具的強化,讓面向多架構系統的代碼開發變得更輕松,進而提高開發者的生產力。

· 英特爾®oneAPI DPC++C++編譯器增加了Codeplay為英偉達和AMD GPU開發的新插件的支持,以簡化SYCL代碼的編寫,并提高代碼面向這些處理器架構的可移植性。這提供了一個統一的構建環境,并整合了工具,以提高跨平臺生產力。作為該解決方案的一部分,英特爾和Codeplay將為英偉達GPU的oneAPI插件開始提供商業化的優先支持(priority support)。

· 基于開源 SYCLomatic的英特爾® DPC++ 兼容性工具增加了100多個新的CUDA APIs支持,讓從CUDA到SYCL的代碼遷移變得更容易。

· 用戶可以使用英特爾®VTune™ Profiler識別大規模MPI應用中的不均衡問題。

· 英特爾® Advisor為英特爾數據中心GPU Max系列添加了自動化roofline分析,以識別內存、緩存或計算瓶頸,確認其原因并進行優先處理,同時提供可操作的建議,以優化從CPU到GPU 的工作負載分流中的重復數據傳輸成本。

48%4的開發者面向使用多種處理器的異構系統進行開發,因此需要更高效的跨架構編程來應對現實工作負載日益擴大的范圍和規模。結合使用oneAPI 的開放、統一的編程模型與英特爾基于標準的多架構工具,開發者能夠在CPU和加速器的硬件、性能、生產力和代碼可移植性方面自由地進行選擇。相反,為專有編程模型(如 CUDA)編寫的代碼,缺乏面向其它硬件的可移植性,讓開發實踐變得孤立,將企業困于一個封閉的生態系統中。

此外, 開放生態系統也在繼續擴大對oneAPI的使用,新的oneAPI卓越中心正在陸續成立。劍橋大學Open Zettascale 實驗室正致力于將重要的百萬兆級的備選代碼(candidate codes)移植到oneAPI上,包括CASTEP、FEniCS和AREPO。該中心還提供課程和研討會,由專家講授oneAPI使用方法和工具,用于編譯和移植代碼以及優化性能。目前,在全球總共已經建立了30個oneAPI卓越中心。

*可前往英特爾新聞發布室了解更多產品性能具體細節

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關標簽
英特爾

相關文章

  • 首次部署英特爾Max系列GPU,極光超算將推動人工智能實現突破性進展

    阿貢國家實驗室和英特爾于近日宣布,Aurora超級計算機的10,624個刀片的安裝已經完成,該系統將于2023年晚些時候上線。該機器使用數萬個XeonMax“SapphireRapids”處理器,配備HBM2E內存以及數以萬計的數據中心GPUMax“PonteVecchio”計算GPU可實現超過2F

    標簽:
    英特爾
  • 英特爾研究院發布全新AI擴散模型,可根據文本提示生成360度全景圖

    英特爾研究院宣布與BlockadeLabs合作發布LDM3D(LatentDiffusionModelfor3D)模型,這一全新的擴散模型使用生成式AI創建3D視覺內容。LDM3D是業界領先的利用擴散過程(diffusionprocess)生成深度圖(depthmap)的模型,進而生成逼真的、沉浸式

    標簽:
    英特爾
  • 英特爾銳炫:驅動持續進步,盡展硬件潛力

    發布之初,英特爾銳炫A770和A750顯卡就已展現出不錯的實力。幾個月過去,它們已然成長為同價位最好的顯卡之一。AMD和英偉達微弱的代際改進,再加上較高的價格,讓用戶很難在1500至2500元左右價位找到一款滿意的顯卡,不過英特爾銳炫顯卡悄悄地填補了這一空白。雖然銳炫A770和A750沒有主打旗艦級

    標簽:
    英特爾
  • 英特爾銳炫Pro圖形顯卡發布新品,集豐富的內容創作功能于一身

    英特爾推出兩款全新英特爾銳炫Pro圖形顯卡;搭載英特爾銳炫ProA40圖形顯卡的系統現已出貨。全新發布:英特爾今日宣布英特爾銳炫?ProA系列專業級圖形顯卡新增兩款產品——英特爾銳炫?ProA60和ProA60M。上述兩款產品的性能在現有英特爾銳炫Pro系列的基礎上更進一步,為專業級工作站用戶精心設

    標簽:
    英特爾
  • 英特爾發布全新量子芯片Tunnel Falls,硅自選量子比特有望更快實現量產

    今天,英特爾發布包含12個硅自旋量子比特(siliconspinqubit)的全新量子芯片TunnelFalls,繼續探索量子實用性,以解決重大難題。TunnelFalls是英特爾迄今為止研發的最先進的硅自旋量子比特芯片,利用了英特爾數十年來積累的晶體管設計和制造能力。在英特爾的晶圓廠里,Tunne

    標簽:
    英特爾

熱門排行

信息推薦