新聞中心

EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 全新英特爾(R)至強融核(TM)處理器發(fā)布

全新英特爾(R)至強融核(TM)處理器發(fā)布

作者: 時間:2016-06-28 來源:美通社 收藏

  ®發(fā)布了其全新一代至強融核™。隨著數(shù)據(jù)量繼續(xù)激增且日益復雜,業(yè)界需要新的硬件、軟件和架構(gòu)來推動更深刻的洞察的獲取,進而加速新的發(fā)現(xiàn)和促進業(yè)務創(chuàng)新,以及推動機器學習和人工智能領(lǐng)域數(shù)據(jù)分析的下一輪演進。

本文引用地址:http://www.butianyuan.cn/article/201606/293199.htm

  

全新英特爾高性能計算和高級分析技術(shù)加速獲取更深刻的洞察

 

  全新高性能計算和高級分析技術(shù)加速獲取更深刻的洞察

  發(fā)布了其全新一代至強融核。作為英特爾可擴展系統(tǒng)框架的基本要素,英特爾至強融核產(chǎn)品家族旨在為易于部署的高性能集群整體解決方案帶來關(guān)鍵的計算引擎。全新一代英特爾®至強融核™正是獲取更深刻洞察的關(guān)鍵。作為英特爾® 可擴展系統(tǒng)框架(英特爾®SSF)的基本要素,英特爾®至強融核™產(chǎn)品家族旨在為易于部署的高性能集群整體解決方案帶來關(guān)鍵的計算引擎。

  借助英特爾® 至強融核™ 處理器家族1更快速地解決最大挑戰(zhàn)

  英特爾至強融核處理器是英特爾首款專門針對高度并行工作負載而設(shè)計的可獨立自啟動的主處理器,且首次實現(xiàn)了內(nèi)存與高速互聯(lián)技術(shù)的集成。作為可獨立自啟動的 x86 CPU,英特爾至強融核處理器可實現(xiàn)高效擴展,而不會像 GPU 加速器等受到 PCIe 總線的限制。通過消除對 PCIe 總線的依賴性,英特爾至強融核處理器與加速器產(chǎn)品相比,可提供更高的可擴展性,能應對更廣泛的工作負載和配置。

  集成 16GB 高帶寬內(nèi)存,可為內(nèi)存訪問密集型的工作負載2提供高達 500 GB/秒的可持續(xù)高內(nèi)存帶寬,此外,雙端口英特爾® Omni-Path 架構(gòu)(英特爾® OPA)還進一步降低了解決方案成本、能耗和空間占用率。英特爾至強融核處理器是基于開放標準構(gòu)建的通用 CPU,可有效保障用戶未來的軟件投資。

  在廣泛的應用和環(huán)境中,從機器學習到高性能計算(HPC),英特爾至強融核產(chǎn)品家族助企業(yè)更快速地解決最具挑戰(zhàn)性的計算問題,同時提供更高的效率和可擴展性3。該產(chǎn)品家族還能幫助企業(yè)借助高性能建模以及仿真、可視化和數(shù)據(jù)分析取得新突破。

  英特爾至強融核處理器的特性和優(yōu)勢還包括:

  高性能:具有多達 72 個強大的高效內(nèi)核,以及超寬的矢量寬度(英特爾® 高級矢量擴展或 AVX-512),從而提高了高度并行計算性能的標準。

  高可擴展性:提供數(shù)據(jù)中心級 CPU 可擴展性和可靠性,以運行高性能工作負載,例如機器學習中的復雜神經(jīng)網(wǎng)絡(luò)的快速訓練,可擴展性及其效率對其至關(guān)重要。

  可編程性:提供與英特爾®至強®處理器相同的二進制代碼兼容性,從而可支持運行任意 x86 工作負載。這使數(shù)據(jù)中心的資產(chǎn)利用率達到最佳,而通用編程模型可借助共享的開發(fā)者社區(qū)群體和代碼復用提高工作效率。

  投資保護:基于通用 x86 CPU 架構(gòu)和開放標準構(gòu)建,支持由各種合作伙伴、編程語言和可用工具組成的廣泛生態(tài)系統(tǒng),從而可實現(xiàn)卓越的靈活性、軟件可移植性和可復用性。

  現(xiàn)在公開發(fā)布的配有英特爾至強融核處理器家族的系統(tǒng),有望在今年9月推出更多選擇。迄今為止,英特爾已發(fā)運了數(shù)萬臺設(shè)備,英特爾預計今年能總共售出100,000臺以上。該產(chǎn)品家族的廣泛生態(tài)系統(tǒng)支持包括 50 多家原始設(shè)備制造商(OEM)、ISV 和中間件合作伙伴。更多信息敬請登錄:www.intel.com/xeonphi/partners。

  

全新英特爾高性能計算和高級分析技術(shù)加速獲取更深刻的洞察

 

  全新英特爾高性能計算和高級分析技術(shù)加速獲取更深刻的洞察

  英特爾® 至強融核™ 處理器讓機器學習更深入

  機器學習需要強大的計算能力來運行復雜的數(shù)學算法并處理海量數(shù)據(jù)。面對這些挑戰(zhàn),英特爾通過發(fā)布全新一代英特爾®至強融核™處理器家族拓展了機器學習的技術(shù)范疇。該英特爾®至強融核™處理器 可為機器學習訓練模型(training)提供強勁性能,且借助可獨立啟動主處理器的靈活性,它可運行多種分析工作負載?;谟⑻貭?reg;可擴展系統(tǒng)框架的集群采用了英特爾至強融核處理器和集成英特爾® Omni-Path 高速互聯(lián),可幫助數(shù)據(jù)科學家大幅降低復雜的神經(jīng)網(wǎng)絡(luò)的訓練時間。在32 節(jié)點的基礎(chǔ)設(shè)施中,英特爾至強融核家族的擴展性比 GPU 好1.38倍;在128節(jié)點的基礎(chǔ)設(shè)施中,英特爾至強融核家族將構(gòu)建訓練模型的速度加快了50倍。

  英特爾至強融核家族是對英特爾®至強™處理器 E5 家族的有力補充,后者則是機器學習領(lǐng)域4部署最廣泛的基礎(chǔ)設(shè)施。英特爾至強處理器 E5 v4 產(chǎn)品家族極其適用于機器學習評分模型(scoring),且可為廣泛數(shù)據(jù)中心工作負載提供強大性能和重要價值。同時,該英特爾至強處理器家族還可為開發(fā)人員提供一致的用于訓練和評分的編程模型,以及可用于高性能計算、數(shù)據(jù)分析和機器學習工作負載的通用架構(gòu)。

  全新英特爾® 可擴展系統(tǒng)框架參考架構(gòu)

  英特爾® SSF 覆蓋從小型集群到全球最大的超級計算機的工作負載,可為計算密集型應用、數(shù)據(jù)密集型應用、機器學習和可視化提供可擴展性和平衡性能。英特爾已發(fā)布了其首款英特爾® SSF 參考架構(gòu),它為經(jīng)過優(yōu)化的 HPC 系統(tǒng)提供推薦的基準硬件和軟件配置。英特爾 SSF 參考架構(gòu)由兩種參考設(shè)計提供支持,這兩種設(shè)計記錄了 HPC 系統(tǒng)的特殊要求,包括硬件和軟件元素以及安裝和配置說明。該全新的參考架構(gòu)和設(shè)計可幫助系統(tǒng)構(gòu)建人員簡化設(shè)計和驗證流程,還可為最終用戶提供購買指南以便更加全面地獲取英特爾® SSF 的價值,保護廣泛的軟件應用可移植性。該全新參考架構(gòu)和設(shè)計的更多信息,敬請登錄:www.intel.com/SSF.

  借助英特爾® HPC Orchestrator 簡化軟件部署

  英特爾® HPC Orchestrator 是一種全新的支持產(chǎn)品家族,可通過減少需要的集成、測試和驗證工作來簡化高性能系統(tǒng)軟件堆棧的實施和后續(xù)的持續(xù)維護。英特爾 HPC Orchestrator 產(chǎn)品預定于2016年第四季度上市,基于 OpenHPC 社區(qū)軟件,并可提供專業(yè)服務和技術(shù)支持。作為首款產(chǎn)品,英特爾®HPC Orchestrator - Advanced 是一種模塊化軟件堆棧,可提供定制特性、出色性能、可擴展性以及易用性。有關(guān)英特爾® HPC Orchestrator 特性和優(yōu)勢的更多信息請訪問:www.intel.com/hpcorchestrator。

  行業(yè)快速采用英特爾 Omni-Path 架構(gòu)

  英特爾 Omni-Path 架構(gòu)(英特爾® OPA)是一款全新的端到端高速互聯(lián)解決方案,可針對入門級和大規(guī)模高性能集群經(jīng)濟高效地提升高性能計算應用的性能。英特爾® OPA 的市場采用率正迅速激增,目前市場上已有超過 80,000 個節(jié)點,且眾多系統(tǒng)制造商正大規(guī)模發(fā)運基于英特爾 OPA 的交換機和服務器平臺,包括:戴爾*、富士通*、日立*、惠普*、浪潮*、聯(lián)想*、NEC*、Oracle*、Quanta*、SGI*、美超微*、Colfax* 等。

  英特爾 OPA 部署的主要成功案例,包括:

  美國能源部 CTS-1系統(tǒng)將部署14,500 個節(jié)點的英特爾®OPA (該系統(tǒng)由三個國家級實驗室——勞倫斯利弗莫爾國家實驗室、圣地亞國家實驗室、洛斯阿拉莫斯國家實驗室三方聯(lián)合實施)

  意大利Cineca超算中心將部署超過 6,000+ 個節(jié)點的英特爾®OPA

  其他客戶包括美國國家核安全局的 Tri Labs、德州高級計算中心、英國赫爾大學、劍橋大學、德國Alfred Wegener 研究所和科羅拉多大學。

  更多材料和多媒體信息請訪問:http://www.intel.com/newsroom/isc。

  *其他的名稱和品牌可能是其他所有者的資產(chǎn)。

  1 英特爾® 至強融核™ 處理器可提供超過 3 Teraflop(每秒萬億次浮點運算)的雙精度性能,遠快于英特爾® 至強融核™ 處理器 x100 家族的 1 Teraflop 以上雙精度性能。

  2資料來源:英特爾使用 STREAM Triad 性能指標評測測量了英特爾® 至強融核™ 處理器 7250 的性能(以 GB/秒計),截至 2016 年 3 月。

  3 相比單節(jié)點,128 節(jié)點實現(xiàn)了 50 倍的訓練速度提升,基于 AlexNet* 拓撲工作負載(批量大小 = 1024),在運行單節(jié)點英特爾至強融核處理器 7250(16 GB MCDRAM,1.4 GHz,68 核)的英特爾® 服務器系統(tǒng) LADMP2312KXXX41 中使用大型圖像數(shù)據(jù)庫,96GB DDR4-2400 MHz,四集群模式,MCDRAM 平面內(nèi)存模式,Red Hat Enterprise Linux* 6.7 (Santiago),1.0 TB SATA 硬盤 WD1003FZEX-00MK2A0 系統(tǒng)磁盤,運行英特爾® Optimized DNN Framework。有關(guān)如何獲取二進制的更多信息,請聯(lián)系您的英特爾代表。節(jié)點數(shù)量為 32 時擴展效率提升多達 38%,基于 GoogLeNet 深度學習圖像分類訓練拓撲,使用大型圖像數(shù)據(jù)庫,將使用上述配置、英特爾® Optimized DNN Framework(87% 的能效)的單節(jié)點英特爾至強融核處理器 7250(16 GB MCDRAM,1.4 GHz,68 核)與各自運行 32 節(jié)點的 NVIDIA Tesla* K20 GPU(62% 的能效)的未知主機進行了比較。http://arxiv.org/pdf/1511.00175v2.pdf)

  4 英特爾估計基于英特爾至強 E5 處理器內(nèi)部銷售數(shù)據(jù)和客戶反饋

  在性能檢測過程中涉及的軟件及其性能只有在英特爾微處理器的架構(gòu)下方能得到優(yōu)化。諸如 SYSmark 和 MobileMark 等測試均系基于特定計算機系統(tǒng)、硬件、軟件、操作系統(tǒng)及功能,上述任何要素的變動都有可能導致測試結(jié)果的變化。請參考其它信息及性能測試(包括結(jié)合其它產(chǎn)品使用時的運行性能)以對目標產(chǎn)品進行全面評估。更多信息敬請登錄http://www.intel.com/performance。

  英特爾處理器標號不是性能的指標。處理器標號僅用于區(qū)分同屬一個家族的處理器的特性,而不能夠用于區(qū)分不同家族的處理器。如欲了解更多信息,請訪問 http://www.intel.com/performance 。

  英特爾技術(shù)的特性和優(yōu)勢取決于系統(tǒng)配置,并需要兼容的硬件、軟件或需要激活服務。實際性能會因您使用的具體系統(tǒng)配置的不同而有所差異。沒有一項計算機系統(tǒng)可以提供所有運行環(huán)境下的絕對安全。描述的成本降低方案旨在作為舉例,說明指定的英特爾架構(gòu)產(chǎn)品在特定環(huán)境和配置下,可能如何影響未來的成本和提供成本節(jié)省。環(huán)境將有所不同。英特爾不保證任何成本或成本降低。

  所有日期和產(chǎn)品僅用于規(guī)劃目的,可隨時更改,恕不另行通知。

  各性能指標評測的相對性能計算規(guī)則為:將第一個被測試平臺的實際性能指標評測結(jié)果賦值為 1.0,作為計算基礎(chǔ),之后將其它性能指標評測結(jié)果與其進行比較。其余被測平臺的相對性能的計算規(guī)則為:用基準平臺的實際性能指標評測結(jié)果去除其它各平臺的具體性能指標評測結(jié)果,并賦予它們一個與所報告的性能改進相關(guān)的相對性能值。



關(guān)鍵詞: 英特爾 處理器

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉