更多精彩 >

算力存力Buff都疊滿,至強(qiáng)6最強(qiáng)形態(tài)現(xiàn)身!

2024-11-18 16:45:55   來源:中國商報網(wǎng)   作者: 

摘要:2024年是至強(qiáng)的大年。

2024年是至強(qiáng)的大年。

先于6月正式發(fā)布的至強(qiáng)? 6700E系列開啟了全新的、更為簡潔命名方式:至強(qiáng)? 6能效核。144核的規(guī)格也意味著英特爾在最近幾年當(dāng)中首次在核心數(shù)量方面實現(xiàn)了領(lǐng)先。而且,這還并不是至強(qiáng)6的最強(qiáng)形態(tài),畢竟大家都知道還有個6900P系列嘛。

9月26日,至強(qiáng)6這個“最強(qiáng)形態(tài)”終于正式發(fā)布,主要規(guī)格非常震撼。即使面對今年內(nèi)晚于自己發(fā)布的其他廠商同級別CPU,至強(qiáng)? 6900P的已有規(guī)格也戰(zhàn)力十足。

最強(qiáng)至強(qiáng)能有多強(qiáng)?

英特爾代號Birch Stream的新一代服務(wù)器平臺所采用的至強(qiáng)6處理器是分批次發(fā)布的。6月發(fā)布的是代號Sierra Forest的能效核處理器6700E系列(E后綴即Efficiency Core,能效核的標(biāo)記),目前發(fā)布的是代號Granite Rapids的性能核6900P系列。今年底和明年初還會陸續(xù)發(fā)布6900E、6700P,以及6500/6300等。未來的Intel 18A制造工藝的處理器,如Clearwater Forest,也會繼續(xù)用于Birch Stream平臺。

至強(qiáng)6900P是英特爾專為計算密集型工作負(fù)載設(shè)計的處理器,也是Granite Rapids的“完全體”。后綴的“P”意味其采用的是Performance Core,即性能核,規(guī)模大、性能強(qiáng);6900的數(shù)字型號則說明其核心配置拉滿——提供了72到128核的多種規(guī)格,TDP有400W和500W兩種,組合成已公開5種型號,顯得比較簡潔。當(dāng)然,依照慣例,云廠商等大客戶還會有若干定制型號的。單就內(nèi)核數(shù)量而言,6900P系列相對前兩代“Rapids”產(chǎn)品線頂配的56/60(Sapphire Rapids)或64核(Emerald Rapids)直接翻倍!如此巨大的迭代幅度非常罕見,也難怪英特爾要改命名方式了,由表及里都透著一個意思:厚積薄發(fā)、脫胎換骨!

尤為值得一提的是:至強(qiáng)6900P也是業(yè)內(nèi)首款性能核數(shù)量正式“破百”的產(chǎn)品,其他同級產(chǎn)品,不論是x86架構(gòu)還是Arm架構(gòu)都只達(dá)到了96核的水平。它們的性能核數(shù)量要追平英特爾,起碼得等到下個季度。

隨著內(nèi)核規(guī)模增加,至強(qiáng)6900P的L3緩存達(dá)到了504MB。為了配合倍增的核數(shù)和顯著提升的算力,至強(qiáng)6900系列的存力也大為增強(qiáng),內(nèi)存帶寬方面不僅支持12通道DDR5 6400;并引入了新型內(nèi)存MR DIMM,把數(shù)據(jù)率大幅提升至8800MT/s,基本內(nèi)存帶寬可以達(dá)到第五代至強(qiáng)可擴(kuò)展處理器的2.3倍。另外,至強(qiáng)6還支持CXL 2.0,尤其是包括Type 3設(shè)備(也就是CXL內(nèi)存),可以進(jìn)一步擴(kuò)展內(nèi)存容量和帶寬。

至強(qiáng)6900P的UPI2.0鏈路也有很大改進(jìn),速率提升到24GT/s,數(shù)量增加至6條,使得雙路互聯(lián)效率進(jìn)一步提升。結(jié)合內(nèi)核數(shù)量、內(nèi)存帶寬等方面的全面提升,至強(qiáng)6900P可以被視作高算力+高存力平臺的最強(qiáng)機(jī)頭,不論是科學(xué)計算,還是AI集群。根據(jù)已透露的測試,至強(qiáng)6900P平臺的數(shù)據(jù)庫、科學(xué)計算等關(guān)鍵應(yīng)用負(fù)載的表現(xiàn)是上一代產(chǎn)品的2.31倍-2.5倍,AI應(yīng)用性能是其1.83倍-2.4倍不等。

至強(qiáng)6的擴(kuò)展能力也有不小的提升。其中6900系列單插座不論是性能核還是能效核均可提供96通道PCIe 5.0,雙路即可提供192通道PCIe 5.0。未來上市的6700系列單路型號可以提供136通道PCIe 5.0,雙/多路型號單插槽也可以提供88通道。相較而言,第四、五代至強(qiáng)可擴(kuò)展處理器的PCIe 5.0通道數(shù)量為80。CXL支持能力方面,至強(qiáng)6 6900、6700系列都支持64通道CXL 2.0。

更多的內(nèi)核、更多的內(nèi)存通道、更多的PCIe通道需要更大規(guī)模的插座接口支持。 至強(qiáng)6帶來了兩種接口:LGA 4710和LGA 7529。至強(qiáng)6900系列使用面積較大的LGA 7529插座,提供最強(qiáng)大的內(nèi)存帶寬和擴(kuò)展能力,是未來高性能、高密度服務(wù)器的基礎(chǔ)。至強(qiáng)6700以及未來的6500/6300系列使用LGA 4710,尺寸與第四、五代至強(qiáng)的LGA 4677相仿,內(nèi)存、PCIe的通道數(shù)相同或相近,有利于主流服務(wù)器內(nèi)部布局習(xí)慣的延續(xù)性。

改進(jìn)的EUV:Intel 3

核心規(guī)模的飆升首先得益于至強(qiáng)產(chǎn)品線終于獲得EUV光刻機(jī)的加持。在2023年發(fā)布的酷睿Ultra已經(jīng)率先使用了引入EUV的Intel 4制造工藝。而2024年發(fā)布的至強(qiáng)6則使用了進(jìn)一步改良的Intel 3制造工藝。

2021年7月,英特爾CEO帕特·基爾辛格公布了“四年五個制程節(jié)點”(5N4Y)的工藝路線圖。Intel 3的量產(chǎn)時間節(jié)點位于2023年底,節(jié)奏基本符合計劃。從基于Intel 4制造工藝的酷睿Ultra的市場表現(xiàn)看,EUV的加持確實明顯提升了英特爾處理器的競爭力。至強(qiáng)6所采用的Intel 3制造工藝相對Intel 4可以規(guī)劃更多的金屬層、擁有更多細(xì)分版本。

Intel 3在更多的步驟中應(yīng)用EUV光刻,可以提供更密集的設(shè)計庫、更高的晶體管驅(qū)動電流。Intel 3還有三種變體,包括3-T、3-E和3-PT。Intel 3、3-T是基本工藝,主要用于CPU;3-E是功能擴(kuò)展;三者都支持TSV;Intel 3的這三種變體與Intel 4相比可以提升18%的性能功耗比。而3-PT進(jìn)一步增加混合鍵合的支持能力,帶來了更高的性能并且易于使用。Intel 3所有四種節(jié)點變體都支持240 nm高性能和210 nm高密度庫,而Intel 4只支持240 nm高性能庫。

對于性能取向,Intel 3針對高性能運算進(jìn)行優(yōu)化,可以支持低電壓(<0.65V)和高壓(>1.3V)運行,且在各電壓下的頻率均高于Intel 4。

微架構(gòu)大迭代

至強(qiáng)6900P采用的性能核微架構(gòu)代號Redwood Cove。Redwood Cove也是近年來英特爾最重要的微架構(gòu)迭代,不但給服務(wù)器產(chǎn)品線帶來了新名字,在消費類產(chǎn)品線同樣開啟了新的命名序列酷睿Ultra。

我們先快速回顧一下Redwood Cove的上一代Golden Cove/ Raptor Cove。Golden Cove其實也是非常重要的迭代,在消費類開啟了大小核時代(第12代酷睿處理器),在服務(wù)器上就是第四代至強(qiáng)可擴(kuò)展處理器。Golden Cove相對其前代的微架構(gòu)大幅度提升了前端:

  • 指令TLB翻倍,從128條增加到256條;

  • 指令提取帶寬從每周期16字節(jié)翻倍到32字節(jié);

  • 解碼器從4路擴(kuò)展到6路;

  • 微操作緩存從2304條增加到4096條;

  • 其他L1 BTB、L2 BTB等也有所提升。

Golden Cove的后端當(dāng)然也有提升,譬如重排序緩沖區(qū)、分支目標(biāo)緩沖區(qū)也有大概30%左右的提升,只是相對前端幅度不那么大。

Raptor Cove的微架構(gòu)與Golden Cove差異不大,表現(xiàn)在實際產(chǎn)品上主要是緩存的提升,如基于Raptor Coved的第13代酷睿(Raptor Lake)的每核心L2緩存從12代(Alder Lake)的1.25MB提升到2MB;第五代至強(qiáng)可擴(kuò)展處理器(Emerald Rapids)和第四代(Sapphire Rapids)每個核心的L2緩存都是2MB,但前者每個網(wǎng)格的末級緩存(Last Level Cache,也可繼續(xù)俗稱為L3緩存)從后者的1.875MB猛增到5MB。

Redwood Cove相對Golden Cove/ Raptor Cove的最重要變化是:

  • 指令緩存從32KB增加到了16路、64KB;

  • 微操作隊列從144個條目增加到192個條目;

  • 指令執(zhí)行延遲降低;

  • 更智能的預(yù)取和改進(jìn)的BPU;

  • L2緩存的帶寬有所提升;

  • AMX增加FP16支持。

當(dāng)然,Redwood Cove還有一個重大的優(yōu)勢就是“命好”,也就是前面提到的EUV制造工藝。但即使有革命性的制造工藝加持,至強(qiáng)6性能核也沒過分?jǐn)U張每個內(nèi)核的規(guī)模。就至強(qiáng)6性能核的內(nèi)核而言,每個網(wǎng)格節(jié)點是一個P核,每個P核配置私有的2MB L2緩存,以及共享的4MB 末級緩存。雖然平均到每個核的緩存容量并不比上一代至強(qiáng)(Emerald Rapids)多,但勝在總核數(shù)翻倍后。至強(qiáng)6性能核每個處理器可共享的末級緩存總?cè)萘恳琅f達(dá)到504MB,遠(yuǎn)超第五代的320MB和第四代的112.5MB。

在此也順便提一下至強(qiáng)6能效核的微架構(gòu)Crestmont。這個微架構(gòu)同樣出現(xiàn)在了酷睿Ultra的能效核當(dāng)中。Crestmont是2或4個內(nèi)核為一組共享L2緩存。在至強(qiáng)6能效核當(dāng)中,每2或4個內(nèi)核與4MB的L2緩存(在酷睿Ultra中則為2MB)構(gòu)成一個模塊,這幾個內(nèi)核共享頻率和電壓域。這個模塊對應(yīng)的網(wǎng)格還擁有可整個處理器全部內(nèi)核共享的3MB的末級緩存。換句話說,雖然至強(qiáng)6能效核的核數(shù)更多,但實際上網(wǎng)格規(guī)模比至強(qiáng)6性能核小。

能效核的指令緩存與性能核都是64KB,但數(shù)據(jù)緩存分別是32KB和48KB。前端的指令解碼器寬度也有差異,分別為6和8寬。指令亂序執(zhí)行引擎差異較大,能效核是256條而性能核是512條。能效核不支持性能核所支持的AVX-512和AMX,這也可以明顯減小矢量運算單元的晶體管占用,但代價是每周期的單精度浮點運算次數(shù)有了數(shù)量級的差異。但能效核也改進(jìn)了AVX2,增加了VNNI的INT8和BF16/FP16快速轉(zhuǎn)換,這樣在處理AI應(yīng)用的時候表現(xiàn)也還有所改善。另外,其256位加密和1024/2048密鑰也獲得了能效核的支持,確保至強(qiáng)6平臺的安全水平基本一致。

緩存規(guī)模、前端寬度以及矢量單元的差異,使得至強(qiáng)6性能核和能效核有不同的定位。早先發(fā)布的至強(qiáng)6能效核更適合微服務(wù)等運算強(qiáng)度相對較輕,可在高核心數(shù)量和規(guī)模擴(kuò)展方面收益的任務(wù),以追求更高的能效、更高的機(jī)架利用率。而現(xiàn)在發(fā)布的至強(qiáng)6性能核更適合大數(shù)據(jù)、建模仿真等計算密集型和人工智能任務(wù),為高性能優(yōu)化,單顆處理器的功耗直飚500W——當(dāng)然,跟同期發(fā)布的Gaudi AI加速器的新品或類似的加速器產(chǎn)品相比,能耗是應(yīng)有的代價,有能力提升性能上限才是正經(jīng)事。

內(nèi)存性能大躍進(jìn)

內(nèi)存(DRAM)的數(shù)據(jù)存儲依賴電容,這個特點使其微縮和提速的難度大于晶體管。因此內(nèi)存并沒有沾摩爾定律的光,帶寬和密度的增長落后于CPU、GPU的發(fā)展。內(nèi)存帶寬滯后于CPU內(nèi)核數(shù)量的增長導(dǎo)致一個長期問題:平均每個內(nèi)核的內(nèi)存帶寬增長乏力,甚至出現(xiàn)倒退。譬如第三代至強(qiáng)可擴(kuò)展處理器內(nèi)核數(shù)28,內(nèi)存是八通道DDR4 3200,理論上的內(nèi)存總帶寬為205GB/s,平均每核7.3GB/s;四代是56或60核,內(nèi)存八通道DDR5 4800,總帶寬307GB/s,平均每核5.5GB/s;五代提升到DDR5 5600,內(nèi)核再增加到64,平均帶寬改進(jìn)甚微。第四、五代至強(qiáng)可擴(kuò)展處理器雖然引入了新一代的DDR5內(nèi)存,但由于內(nèi)核數(shù)量相對三代翻倍,內(nèi)存帶寬的增長幅度還是跟不上。同時期其他廠商的CPU核數(shù)在屢屢躍進(jìn)的過程當(dāng)中也存在同樣的問題。為了彌補(bǔ)內(nèi)存帶寬增長較慢的問題,第四代至強(qiáng)可擴(kuò)展處理器給部分用于科學(xué)計算的型號引入了HBM,五代則大幅度增加了末級緩存的容量,并支持CXL 2.0內(nèi)存擴(kuò)展。

在至強(qiáng)6900P上,內(nèi)存問題終于得到了比較好的解決。這涉及三個角度:

1.大容量末級緩存。前面提到過,6900P每個網(wǎng)格提供4MB L3,總?cè)萘窟_(dá)到了504MB,分別是四代的4.5倍、五代的1.6倍。而且,至強(qiáng)的全網(wǎng)格架構(gòu)使得任意內(nèi)核訪問末級緩存的延遲相比其他廠商的一些產(chǎn)品有更優(yōu)的表現(xiàn),例如不需要跨計算單元而造成延遲劇增。這種架構(gòu)效率更高的優(yōu)勢也是至強(qiáng)在核數(shù)曾落后的情況下還能打的有來有往的關(guān)鍵原因。

2.DDR5內(nèi)存雙管齊下提升帶寬。至強(qiáng)6900系列支持12通道DDR5 6400,總帶寬可以達(dá)到614GB/s,平均每核的帶寬大致還有5GB/s的水平。6900P還支持新型內(nèi)存MRDIMM,頻率提升至8800MT/s,總帶寬達(dá)到了845GB/s,平均每核6.6GB/s,也明顯超過了前兩代產(chǎn)品,大幅度逆轉(zhuǎn)了內(nèi)核數(shù)量增加、平均內(nèi)存帶寬不升反降的問題。

MR(Multiplexed Rank)DIMM打開了DDR內(nèi)存性能提升的新方向。DRAM通常由1到2個Rank組成,每個Rank的位寬為64位,如果考慮ECC,那就會有72或80位,但有效的數(shù)據(jù)是64位。消費類內(nèi)存(UDIMM)可能只有1個Rank(顆粒數(shù)量較少的情況下),但追求大容量的服務(wù)器內(nèi)存(RDIMM)基本上都至少有2個Rank。在以往的內(nèi)存模式當(dāng)中,一次只讀取一個Rank的數(shù)據(jù),另一個Rank暫時閑置時可以做刷新操作,以保持?jǐn)?shù)據(jù)——這種輪流讀取、刷新Rank的特點延續(xù)了多年。MRDIMM設(shè)計了一個數(shù)據(jù)緩沖區(qū),通過將兩個內(nèi)存Rank分別讀入這個緩沖區(qū),再從緩沖區(qū)一次性傳輸?shù)紺PU的內(nèi)存控制器,由此實現(xiàn)了帶寬翻倍。第一代DDR5 MRDIMM的目標(biāo)速率為8800 MT/s,其實每個Rank只相當(dāng)于4400MT/s?,F(xiàn)在DDR5 6400已經(jīng)開始普及,因此MR DIMM的第二階段目標(biāo)是達(dá)到12800 MT/s,預(yù)計在2030年代的三代會提升至17600 MT/s。

3.CXL 內(nèi)存擴(kuò)展。第四代至強(qiáng)可擴(kuò)展處理器開始引入CXL支持,當(dāng)時是1.1版本,暫時也沒有公開支持Type 3設(shè)備(也就是CXL內(nèi)存)。從第五代開始正式引入了CXL 2.0,包括Type 3,可以幫助擴(kuò)展內(nèi)存容量和帶寬。在至強(qiáng)6上,CXL設(shè)備的應(yīng)用將更為普及,關(guān)鍵的CXL2.0標(biāo)準(zhǔn)設(shè)備,以及后向兼容的CXL1.1設(shè)備,預(yù)計都會陸續(xù)涌現(xiàn)。

這里重點說一下CXL內(nèi)存的優(yōu)勢。CXL2.0支持鏈路分叉,使一個主機(jī)端口可以對接多個設(shè)備,而且提供更強(qiáng)的CXL內(nèi)存分層支持,可實現(xiàn)容量和帶寬擴(kuò)展。至強(qiáng)6支持3種CXL內(nèi)存擴(kuò)展模式:CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

在CXL Numa Node模式下,系統(tǒng)的標(biāo)準(zhǔn)內(nèi)存和CXL擴(kuò)展內(nèi)存被視為兩個獨立的Numa節(jié)點進(jìn)行控制。每個Numa節(jié)點都有自己的內(nèi)存地址空間,系統(tǒng)軟件或應(yīng)用程序可以將任務(wù)分配到不同的Numa節(jié)點,從而優(yōu)化內(nèi)存的使用。CXL Numa Node模式適用于需要精細(xì)內(nèi)存管理的應(yīng)用,可以通過操作系統(tǒng)、虛擬機(jī)管理程序(Hypervisor)或應(yīng)用程序本身來輔助分層管理內(nèi)存。

Hetero Interleaved(異構(gòu)交織)模式通過將系統(tǒng)的標(biāo)準(zhǔn)內(nèi)存和CXL內(nèi)存混合在一起,形成一個統(tǒng)一的Numa節(jié)點。每個內(nèi)存地址空間中的數(shù)據(jù)可以交替存儲在DRAM和CXL內(nèi)存中,從而均衡內(nèi)存帶寬,減少延遲。異構(gòu)交織模式適用于對內(nèi)存帶寬有高需求的應(yīng)用,特別是當(dāng)需要將DRAM和CXL內(nèi)存結(jié)合使用時。此模式只有在配備性能核的至強(qiáng)6700P、6900P上才支持。假設(shè)將每顆至強(qiáng)6900P的64通道CXL用滿,可以額外增加256GB/s的內(nèi)存帶寬,單處理器就可以實現(xiàn)TB級的內(nèi)存帶寬,還是相當(dāng)可觀的。

Flat Memory(平面內(nèi)存)模式下,CXL內(nèi)存和標(biāo)準(zhǔn)內(nèi)存被視為單一的內(nèi)存層,操作系統(tǒng)可以直接訪問統(tǒng)一的內(nèi)存地址空間。硬件輔助的分層管理可以確保常用數(shù)據(jù)優(yōu)先存儲在標(biāo)準(zhǔn)內(nèi)存中,次要數(shù)據(jù)存儲在CXL內(nèi)存中,從而最大限度地提升內(nèi)存使用效率。平面內(nèi)存模式最大的價值在于無需修改軟件即可利用CXL內(nèi)存擴(kuò)展,而且這種模式適用于所有的至強(qiáng)6處理器。但平面內(nèi)存模式要求標(biāo)準(zhǔn)內(nèi)存和CXL內(nèi)存是1:1配置,這略為限制了硬件采辦、升級的靈活性。整體而言,平面內(nèi)存模式是至強(qiáng)6時期最易用、收效最直觀的模式,有望成為CXL內(nèi)存擴(kuò)展的主要模式。

踏上Chiplet異構(gòu)之路

至強(qiáng)6是至強(qiáng)家族首次將計算和IO芯片獨立,再通過Chiplet形式封裝在一起,總算是把高級封裝的優(yōu)勢真正發(fā)揮出來了。

第四代至強(qiáng)可擴(kuò)展處理器是英特爾的首個Chiplet設(shè)計的至強(qiáng)處理器。其XCC版本內(nèi)部是4顆芯片通過10組EMIB對等連接,每顆芯片提供15個內(nèi)核、2通道內(nèi)存控制器、1組加速單元,以及UPI、PCIe PHY若干。另外,還可以通過EMIB封裝4顆HBM。

第五代至強(qiáng)可擴(kuò)展處理器使用2顆芯片封裝而成,所使用的EMIB數(shù)量明顯減少,相應(yīng)地也節(jié)約了芯片面積。雖然內(nèi)核數(shù)量略有增加,但也損失了UPI、PCIe的數(shù)量,也不再能夠搭配HBM。

隨著制造工藝演進(jìn),偏重計算性能和晶體管密度的處理器內(nèi)核,與偏重高速信號互聯(lián)的IO控制器對制造工藝的要求產(chǎn)生了差異,因此,典型的Chiplet設(shè)計將計算和IO分離,分別應(yīng)用不同的制造工藝。英特爾在14代酷睿上便采用了這種方式,分為Compute Tile、SoC Tile、IO Tile、Graphic Tile。代號Ponte Vecchio的英特爾Data Center GPU Max利用Foveros和EMIB技術(shù),將47個小芯片封裝在一起,包括Compute Die、Base Die、Rambo、IO Die等。

至強(qiáng)6終于也拆分成計算單元(Compute Tile)和IO單元(IO Tile),分別由Intel 3和Intel 7工藝制造。

計算單元

根據(jù)收集到的信息,對于能效核,目前只出現(xiàn)了一種計算單元的設(shè)計,每個單元最多提供144個內(nèi)核、4組內(nèi)存控制器共八通道;對于性能核,則是有三種計算單元的設(shè)計,可分別用于組合高核數(shù)、中等核數(shù)、低核數(shù)的規(guī)格。

至強(qiáng)6900P使用了三個計算單元,每個單元43個內(nèi)核、兩個內(nèi)存控制器,總共構(gòu)成129個內(nèi)核(只使用128個)和12個內(nèi)存通道。這種計算單元姑且稱之為單元A,三個單元A構(gòu)成的處理器被稱為UCC。

未來發(fā)布的6700P核數(shù)跨度會很大,其中單路型號規(guī)劃為16~80核,多路型號為8~86核。單元A有4個內(nèi)存通道,兩個單元A組合可以提供最高86核,下限應(yīng)該不低于48核(否則屏蔽的內(nèi)核數(shù)量就實在太多,也太浪費EMIB成本),這種規(guī)模的處理器被稱為XCC。48核以下的中等核數(shù)被稱為HCC,使用一種專門開發(fā)的單元B,每個單元提供48個內(nèi)核和4個內(nèi)存控制器。HCC核數(shù)的下限預(yù)計在24核左右。8和16核的6700P被稱為LCC,需要使用第三種單元C,16個內(nèi)核和4個內(nèi)存控制器。

通過使用3種計算單元進(jìn)行組合,至強(qiáng)6性能核可以構(gòu)建跨度從8~128核的、非常綿密的規(guī)格。也許會有人認(rèn)為,相比其他廠商只用一種規(guī)格計算單元實現(xiàn)擴(kuò)展的設(shè)計,英特爾需要設(shè)計三顆不同的芯片的成本會更高。但我認(rèn)為,這是英特爾優(yōu)先考慮性能的結(jié)果。首先,至強(qiáng)6將內(nèi)存控制器安排在計算單元中,離內(nèi)核更近,延遲更低,即使因此犧牲了單元組合使用的靈活性也是值得的。其次,至強(qiáng)6性能核給不同規(guī)模的內(nèi)核數(shù)量規(guī)劃不同的網(wǎng)格規(guī)模,有利于降低核間的延遲,甚至,有可能LCC會針對較低的核數(shù)改用環(huán)形總線。綜上,預(yù)計至強(qiáng)6性能核相對同等規(guī)模的其他廠商的產(chǎn)品依舊可能會擁有內(nèi)存延遲低、緩存延遲低的優(yōu)勢。

IO單元

IO單元方面,至強(qiáng)6900、6700系列都使用2顆相同的IO芯片。每個IO芯片由2個IO模塊、4個UIO模塊、2個加速器模塊,以及IO網(wǎng)絡(luò)接口構(gòu)成。每個IO模塊提供x16 PCIe或CXL連接;每個UIO模塊提供x24 UPI2.0,或復(fù)用為x16的PCIe或CXL;每個加速器模塊提供DSA、IAA、QAT、DLB加速器各一個。

以這次發(fā)布的至強(qiáng)6900P為例,兩個IO單元總共提供8個UIO和4個IO模塊。其中6組UIO負(fù)責(zé)提供6個UPI2.0互連,剩余的2個UIO和4個IO模塊正好提供6×16=96通道的PCIe 5.0。雙路至強(qiáng)6900P的UPI不但速率高(24GT/s,高于五代的20GT/s和四代的16GT/s),連接數(shù)量也提升了50%。

對于還未發(fā)布、也是主力產(chǎn)品的至強(qiáng)6700系列,估計由于要使用規(guī)模較小的插座,只提供最多4組UPI用于多路的互聯(lián),PCIe通道也有所縮減。但即使如此,至強(qiáng)6700系列的單路型號在將所有UIO配置為PCIe之后,單插槽就可以提供多達(dá)136個PCIe通道,或64通道CXL。如果用單路至強(qiáng)6700配合半寬主板構(gòu)建雙節(jié)點服務(wù)器,那一個機(jī)箱內(nèi)的PCIe/CXL擴(kuò)展能力(272 /128)遠(yuǎn)遠(yuǎn)超過已知的任何雙路服務(wù)器。這種機(jī)箱可能會成為新的池化形態(tài),可以更高的密度提供NVMe存儲、CXL內(nèi)存、加速器等。

結(jié) 語

由于英特爾在14nm到10nm制造工藝的迭代過程遇到了一些問題,以致此前幾代至強(qiáng)平臺在“核戰(zhàn)”(比拼核數(shù))中略顯被動,但這個局面在至強(qiáng)6上有望完全逆轉(zhuǎn)。改良后的EUV制造工藝看來沒有束縛至強(qiáng)6的實力,核心數(shù)量、緩存容量、內(nèi)存帶寬等關(guān)鍵指標(biāo)全都進(jìn)入領(lǐng)先行列,一句話總結(jié)就是算力和存力的表現(xiàn)全部拉滿。至強(qiáng)6900P系列在各種項目的測試當(dāng)中,其代際性能提升就都是以倍數(shù)計,而非百分之十幾、幾十的進(jìn)步。這種形勢也使得英特爾得以全面競爭科學(xué)計算、大數(shù)據(jù)、AI等領(lǐng)域的性能王座。

此外,至強(qiáng)6終于實現(xiàn)計算與IO的解耦,也讓至強(qiáng)6及未來的產(chǎn)品線走上了正確、靈活的道路,得以充分發(fā)揮Chiplet的優(yōu)勢。將Chiplet視作降低成本、提高良率的手段是狹隘的。Chiplet的價值在于靈活、復(fù)用、重構(gòu)。英特爾長期以來很注重細(xì)分市場的耕耘,產(chǎn)品線非常復(fù)雜,正確利用Chiplet可以達(dá)到事半功倍的效果。我們非常期待至強(qiáng)6后續(xù)產(chǎn)品的陸續(xù)發(fā)布能夠給業(yè)界帶來什么樣的想象力。


猜你喜歡

華大北斗芯片級產(chǎn)品矩陣亮相第三屆北斗規(guī)模應(yīng)用 國際峰會

芯片華大北

10月24日-25日,第三屆北斗規(guī)模應(yīng)用國際峰會在湖南株洲盛大開幕,此次峰會由國家發(fā)展和改革委員會、...

2024-10-28

原創(chuàng)

英特爾突爆大消息!

蘋果英特爾芯片英偉達(dá)

全球芯片巨頭,要“賣身”了?

2024-09-25

國內(nèi)首款!賽思語音芯片(SLIC芯片)重磅發(fā)布,引爆1300億+FTTR改造市場需求!

芯片賽思

國內(nèi)知名數(shù)?;旌闲酒瑥S商賽思電子,近日宣布推出國內(nèi)首款針對通信基建、VOIP網(wǎng)關(guān)等應(yīng)用的新一代語音芯...

2024-08-30

原創(chuàng)

IOTE 2024深圳站 | 馳芯半導(dǎo)體引領(lǐng)UWB技術(shù)新篇章

芯片馳芯半導(dǎo)體

“IOTE 2024 第二十二屆國際物聯(lián)網(wǎng)展·深圳站”于 2024 年 8 月28 日 - 30 日...

2024-08-28

艾維嵐搭建中歐醫(yī)美學(xué)術(shù)交流平臺,首屆PLLA國際學(xué)術(shù)研討會于英國皇家醫(yī)學(xué)會隆重舉行

艾維嵐

艾維嵐遠(yuǎn)渡重洋,將“活性再生”的前沿學(xué)術(shù)理念帶到歐洲,與全球的行業(yè)內(nèi)精英碰撞思想,分享經(jīng)驗,共同探尋...

2024-06-05

是“美容”還是“毀容” ? 大排燈美容儀頻閃危害莫跳坑

大排燈

伴隨著大排燈為代表的家用化光療美容儀器的普及,越來越多的消費者選擇并使用這類美容儀,但記者也通過走訪...

2024-06-05

ASCO2024|榮昌生物公布MSLN靶向 ADC藥物RC88 I/II期臨床研究數(shù)據(jù)

榮昌生物

6月3日,在芝加哥舉行的美國臨床腫瘤學(xué)會(ASCO2024)年會上,榮昌生物首次公布了其自主研發(fā)的A...

2024-06-05

原創(chuàng)

Cleer大師音質(zhì)王牌電競官一諾,攜Cleer ARC 3音弧送寵粉福利

Cleer

近日,在KPL職業(yè)聯(lián)賽夢之隊投票中,一諾(徐必成)以總投票第一的成績?nèi)脒x,再次證明了一諾的頂級實力和...

2024-06-05

同盾科技創(chuàng)始人蔣韜談數(shù)字金融安全與風(fēng)險防控

同盾科技

隨著數(shù)字金融的蓬勃發(fā)展,金融安全問題日益凸顯,對行業(yè)提出了新的嚴(yán)峻挑戰(zhàn)。

2024-06-05

生數(shù)科技完成數(shù)億元Pre-A輪融資,華興資本擔(dān)任獨家財務(wù)顧問

生數(shù)科技

近日,生數(shù)科技完成數(shù)億元Pre-A輪融資,該輪融資由北京市人工智能產(chǎn)業(yè)投資基金、百度聯(lián)合領(lǐng)投,中關(guān)村...

2024-06-05

CPT Markets市場分析:AI換機(jī)潮迎來新一波投資機(jī)遇! 探索智能手機(jī)領(lǐng)域之變革潛力!

CPT Markets

CPT Markets??分析師發(fā)現(xiàn),近年來在智能手機(jī)領(lǐng)域里,人工智能(AI)技術(shù)的快速發(fā)展已成為行...

2024-06-05

《光·遇》深耕公益環(huán)保,海洋節(jié)活動震撼啟動,助力河流保護(hù)

海洋節(jié)

《光·遇》海洋節(jié)公益活動歷年的成功舉辦,讓我們看到了游戲與公益的完美結(jié)合。通過游戲的力量,我們可以喚...

2024-06-05

從種植到釀造,五糧液這樣實踐“和美”之道

五糧液

五糧液的“和美”之道根植全生命周期。

2024-06-05

投資家網(wǎng)(jubohaotong.com)是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫服務(wù)、會議服務(wù)及生態(tài)服務(wù)。長按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

沙特天空塔投資設(shè)立專項基金帶領(lǐng)中國氫能獨角獸扎根沙特

2016年注冊于北京的中氫新能技術(shù)有限公司,下設(shè)位于大興的裝備制造公司、位于海淀區(qū)的技術(shù)研究院、材料...

挑戰(zhàn)奔馳的明星車企,突然“翻車”了

一度無比高光的理想汽車,猝不及防遭遇重挫。

深圳天使母基金姚小雄:將來股權(quán)投資行業(yè)競爭是服務(wù)能力的競爭

2024年1月10日,由投資家網(wǎng)主辦,財經(jīng)銳眼、有時間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...

避免卡脖子,硬科技如何“逆境”突圍?

2024年1月10日,由投資家網(wǎng)主辦,財經(jīng)銳眼、有時間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...

VC/PE眼中的“專精特新”

2024年1月10日,由投資家網(wǎng)主辦,財經(jīng)銳眼、有時間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...

雕刻耐心|第18屆中國投資年會·有限合伙人峰會即將啟幕

雕刻耐心|第18屆中國投資年會·有限合伙人峰會即將啟幕

2024年的一級市場,“耐心”是最高命題,也引發(fā)了持續(xù)全年的討論。

不響不輟|第18屆中國投資年會·年度峰會在滬召開

不響不輟|第18屆中國投資年會·年度峰會在滬召開

5月8-10日,由投中信息、投中網(wǎng)主辦的“第18屆中國投資年會·年度峰會”在上海外灘W酒店盛大召開。

2024汽車科技創(chuàng)新與成果轉(zhuǎn)化大會在常州成功召開

2024汽車科技創(chuàng)新與成果轉(zhuǎn)化大會在常州成功召開

4月12日,2024汽車科技創(chuàng)新與成果轉(zhuǎn)化大會在常州經(jīng)開區(qū)成功召開。

不響不輟 | 第18屆中國投資年會·年度峰會即將啟幕

不響不輟 | 第18屆中國投資年會·年度峰會即將啟幕

2024年5月8-10日,由投中信息、投中網(wǎng)主辦,以“不響不輟”為主題的第18屆中國投資年會·年度峰...

投資家網(wǎng)協(xié)辦:首屆深圳灣資本市場年會隆重舉行

投資家網(wǎng)協(xié)辦:首屆深圳灣資本市場年會隆重舉行

12月20日,由南山區(qū)資本市場協(xié)會主辦,投資家網(wǎng)、桐鵬匯財金高管俱樂部協(xié)辦的資本巿場年會隨即舉行。