您的位置: 首頁 >科技 >

英特爾第三代至強可擴展CPU提供16位FPU處理

2020-06-29 11:38:47 編輯: 來源:
導讀 英特爾今天宣布了其第三代至強可擴展處理器(分別是金牌和白金牌)處理器以及新一代的Optane持久存儲器(閱讀:極低延遲,高耐久性SSD)和Strat

英特爾今天宣布了其第三代至強可擴展處理器(分別是金牌和白金牌)處理器以及新一代的Optane持久存儲器(閱讀:極低延遲,高耐久性SSD)和Stratix AI FPGA產品。

除了硬件加速的AI 之外,AMD目前幾乎在所有可能的性能指標上都擊敗了英特爾 ,這并不是新聞。對于英特爾而言,這顯然也不是什么新聞,因為該公司對至強可擴展處理器的性能與競爭對手的Epyc Rome處理器沒有任何要求。更有趣的是,英特爾根本沒有提到通用計算工作負載。

要找到所示的唯一非AI代代改進的解釋,需要跳過多個腳注。有了足夠的決心,我們最終發(fā)現(xiàn)概述幻燈片中提到的“ 1.9倍平均性能提升”是指“估計的或模擬的” SPECrate 2017基準,將四路鉑金8380H系統(tǒng)與已有五年歷史的四路鉑金系統(tǒng)進行了比較E7-8890 v3。

公平地說,英特爾似乎確實在AI領域引入了一些非同尋常的令人印象深刻的創(chuàng)新。以前只是為AVX-512指令集打上商標的“深度學習增強”現(xiàn)在也包含了全新的16位浮點數(shù)據(jù)類型。

借助較早的Xeon可擴展級處理器,英特爾率先并大力推動使用8位INT8整數(shù)(通過其OpenVINO庫進行推理處理)。對于推理工作負載,英特爾認為,INT8在大多數(shù)情況下,較低的精度是可以接受的,同時可以極大地加速推理流程。但是,對于培訓而言,大多數(shù)應用程序仍需要更高的FP3232位浮點處理精度。

新一代增加了16位浮點處理器支持,英特爾稱之為bfloat16。將FP32 模型的位寬減半可加快處理速度,但更重要的是,將模型保留在內存中所需的RAM減少了一半。對于程序員和使用FP32 模型的代碼庫,利用新數(shù)據(jù)類型也比轉換為整數(shù)更簡單。

英特爾還深思熟慮地提供了一個 圍繞BF16數(shù)據(jù)類型的效率的游戲。我們不建議將它作為游戲或教育工具使用。

Optane儲存加速

英特爾還宣布了新一代的Optane“持久內存” SSD,速度提高了25%,可用于大大加速AI和其他存儲管道。Optane SSD使用3D Xpoint技術而不是 典型的SSD進行NAND閃存操作。3D Xpoint具有比NAND更高的寫入耐久性和更低的延遲。較低的延遲和更大的寫入耐力使其成為一種快速緩存技術,尤其具有吸引力,該技術甚至可以加速所有固態(tài)陣列。

此處最大的收獲是,Optane極低的延遲可通過提供對大型而無法完全存儲在RAM中的模型的快速訪問來加速AI管道(這常常是存儲的瓶頸)的加速。對于涉及快速大量寫入的管線,Optane高速緩存層還可以通過減少實際必須執(zhí)行的寫入總數(shù)來顯著提高其下的NAND主存儲的預期壽命。

延遲與IOPS,讀/寫工作負載為70/30。 橙色和綠色線是數(shù)據(jù)中心級的傳統(tǒng)NAND SSD。 藍線是Optane。

放大 /延遲與IOPS的對比,讀/寫工


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

2016-2022 All Rights Reserved.平安財經網.復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網 版權歸原作者所有。