Az AMD két éve jelezte a Naples kódnevű, első EPYC generáció megszületésével, hogy újra betámadják a szerverpiacot, ahol az Opteron sorozattal az előző évtized első felében jól teljesítettek, de az Intel idővel elhúzott a Xeonnal. Az EPYC viszont első körben jól teljesített, a cég háromszorosára növelte vele az érintett szegmensben a részesedését, illetve a paraméterek szempontjából is tudott újat mutatni, és leginkább akkor tudott kiemelkedő képességeket biztosítani, ha az adott megrendelőnek számított az átlagosnál nagyobb biztonság, illetve az egy tokozás szintjén mért teljesítmény és fogyasztás.



[+]

A Naples platform azonban nem volt alkalmas arra, hogy mindenhol kimagaslóan jól teljesítsen, viszont a figyelmet felhívta magára, tehát mindenképpen hasznos fejlesztésről volt szó. Az AMD ugyanakkor már az előző évben elmondta, hogy az igazán ütős szerverplatformjuk a Rome lesz, amelynek az egyedi felépítését még múlt novemberben mutatták meg. A vállalat megtartotta a Socket SP3r2-vel való kompatibilitás, noha a legtöbbet fogyasztó processzorok nem biztos, hogy minden eddig megjelent szerverben működni fognak, de a 180 wattos, vagy ez alatti TDP-vel rendelkezők igen. Ez már eleve egy nagyon jó fejlesztési lépcső az érintettek számára, de ami ennél is fontosabb, hogy az eredeti négylapkás felépítést leváltotta egy sokkal modernebb chiplet dizájn. Ilyen formában a Rome platformhoz való processzorok tokozásának közepén lesz egy 14 nm-es node-on készülő I/O lapka, amely lényegében tartalmazza a memória- és PCI Express vezérlőt, a déli vezérlőhidat, illetve a különféle egyéb interfészeket, és ehhez kapcsolódnak a 7 nm-es node-on készülő CPU chipletek, amelyek Zen 2 magokat használnak, és maximum nyolc használható belőlük. A teljes magszám így elérheti a 64-et, ami 128 szálat jelent tokozásonként, míg a megosztott L3 gyorsítótár maximális kapacitás 256 MB. Természetesen a nyolccsatornás DDR4-es memóriavezérlő megmarad, de már kezelni fogja a 3200 MHz-es effektív órajelű modulokat is, illetve nagyon fontos, hogy a rendszermemória maximálisan megengedett kapacitása 2 TB-ról 4 TB-ra nőtt.



[+]

A fenti átalakítással egy működésre vonatkozó változás is érkezik. Az első generációs, EPYC 7001-as sorozat három NUMA csoportra volt osztva összesen nyolc domainnel, ami a szerverpiac tipikusan NUMA-aware munkafolyamatait tekintve nem jelentet eget rengető problémát, viszont lapkák és a tokozások közötti késleltetés az optimálisnál magasabb lehetett. Az új, EPYC 7002-as sorozat már két NUMA csoportra oszlik, ráadásul összesen két domainnel, amivel az AMD szerint a késleltetési értékeket 15-19%-kal tudták mérsékelni.

Sokat módosult még a PCI Express kezelése is. Egyrészt az új EPYC CPU-k már PCI Express 4.0-s vezérlővel rendelkeznek, és csak olyan sávot kínálnak, amely megfelel ennek a szabványnak. A modernizálásnak több előnye is van. Egyrészt sávonként kétszeres az adatátviteli teljesítmény, ami a szerverpiacon tényleg egy hasznos dolog, mivel itt azért tipikusan vannak olyan munkafolyamatok, amelyeket ma a PCI Express 3.0 limitál. Másrészt az első EPYC generáció alapját adó Naples platform tokozásonként 128 darab PCI Express 3.0-s csatornát kínált, de ugye kétutas konfigurációban 64 csatorna a processzorok összeköttetéséért felelt, tehát az AMD az egyutas és a kétutas kiépítésnél is 128 felhasználható sávot kínált. A két tokozás összeköttetésére ráadásul ajánlott a nagy tempó, így muszáj volt elhasználni ennyi csatornát, viszont a Rome szerverplatformnál már lehet trükközni.

Az AMD alapértelmezetten most is 64 csatornát ajánl, de elképzelhető, hogy ebből a kétutas kiépítés az adott környezetben nem igazán profitál, viszont pont szükség lenne 128-nál több szabadon felhasználható sávra. Ilyenkor opcionális lehetőség a szervergyártók számára, hogy a tokozások összeköttetésére 48 sávot használjanak, ami PCI Express 4.0-nak köszönhetően még mindig nagyobb sávszélességek kínál az első generációs EPYC-nál, a maradék 160 csatornát pedig használható a különböző gyorsítókhoz, vagy éppen SSD-khez. Bónuszként a érkezik még a WAFL névre keresztelt szolgáltatás, amely lényegében egy-egy extra PCI Express sávot takar tokozásonként, amiket a gyártók felhasználhatnak a BMC-hez (Baseboard Management Controller, amely bizonyos alapfunkciókat végezhet el az adott rendszeren belül), méghozzá anélkül, hogy a szabadon felhasználható csatornákhoz kellene nyúlni.



[+]

Javul a biztonság is, ugyanis az AMD külön kiemelte, hogy a szerverpiacon nem elég gyorsnak és energiatakarékosnak lenni, az is számít, hogy a processzor kellően biztonságos legyen, és eszerint tervezik a dizájnjaikat. A cég az első generációs Zennél vezetett be erre alapvető fontosságú szolgáltatásokat SEV és SME jelzéssel, amelyeket az alábbi hírben taglaltunk. Az új generációs EPYC ezeket viszi tovább, illetve kiterjeszti a képességeket, így mostantól már a PCI Express eszközök hozzáférhetnek a titkosított lapokhoz, valamint a friss processzor 509 titkosított memóriakulcsot tárolhat, szemben az előző generáció 15-jével. Utóbbi egy lényeges változás, mert így sokkal több virtuális gép kezelhető.

A fentiek mellett az AMD pár új utasítással is kiegészítette a második generációs EPYC-et, de ezek egy része megtalálható az asztali Zen 2-es processzorokban is. Ami viszont érdekes, hogy a vállalat ugyan a SIMD motor teljesítményét megkétszerezte, de az AVX-512 beépítésével már nem foglalkozott. A céget megkérdeztük ezzel kapcsolatban, és azzal magyarázták a lépésüket, hogy arra szeretnének fókuszálni, amit a piac valóban használ, és nem prioritás azoknak a képességeknek a beépítése, amiket majd egyszer valamikor támogatni fognak a szoftverek. A cég szerint ezekkel az a probléma, hogy bizonyos újítások sok tranzisztort igényelnek, miközben megfelelő szoftvertámogatás nélkül használhatatlanok. A tranzisztorokat azonban el lehetne költeni úgy is, hogy a piac által jellemzően futtatott szoftvereknél hozzanak gyorsulást. Egy példával élve, természetesen kivitelezhető lenne az AVX-512 támogatása, akár 512 bites SIMD motorokkal is, de ehhez kompromisszumokat kellene kötni többek között a gyorsítótára kapacitása szempontjából. Márpedig előbbi képességet a futtatott programok jelentős része nem is használja, míg utóbbi előnye gyakorlatilag mindenhol kijön, ezért is van összesen majdnem 300 MB-nyi cache az új EPYC csúcskonfigurációjában.

A vállalat természetesen az érkező modellek specifikációit is elárulta, amelyeket az alábbi táblázat részletez:

AMD EPYC 7002-es sorozatú szerverprocesszorok Típus Alap/Turbó órajel Szálak száma L3 cache Támogatott konfiguráció Fogyasztás (cTDP) Listaár (dollár)

EPYC 7742 (64 mag) 2,25/3,4 GHz

128 256 MB

kétutas 225/240 W 6950 EPYC 7702P (64 mag) 2/3,35 GHz 128 256 MB egyutas 165/200 W 4425 EPYC 7702 (64 mag) 2/3,35 GHz 128 256 MB kétutas 165/200 W 6450 EPYC 7642 (48 mag) 2,3/3,3 GHz 96

256 MB kétutas 225/240 W 4775

EPYC 7552 (48 mag) 2,2/3,3 GHz 96

192 MB kétutas 165/200 W 4025 EPYC 7542 (32 mag) 2,9/3,4 GHz 64

128 MB kétutas 225/240 W 3400

EPYC 7502P (32 mag) 2,5/3,35 GHz 64 128 MB egyutas 165/180/200 W 2300 EPYC 7502 (32 mag) 2,5/3,35 GHz 64 128 MB kétutas 165/180/200 W 2600 EPYC 7452 (32 mag) 2,35/3,35 GHz 64 128 MB kétutas 155/180 W 2025

EPYC 7402P (24 mag) 2,8/3,35 GHz 48

128 MB egyutas 165/180/200 W 1250 EPYC 7402 (24 mag) 2,8/3,35 GHz 48

128 MB kétutas 165/180/200 W 1783

EPYC 7352 (24 mag) 2,3/3,2 GHz 48

128 MB kétutas 155/180 W 1350

EPYC 7302P (16 mag) 3/3,3 GHz 32

128 MB egyutas 155/180 W 825 EPYC 7302 (16 mag) 3/3,3 GHz 32

128 MB kétutas 155/180 W 978

EPYC 7282 (16 mag) 2,8/3,2 GHz 32

64 MB kétutas 120/150 W 650 EPYC 7272 (12 mag) 2,9/3,2 GHz 24

64 MB kétutas 120/150 W 625

EPYC 7262 (8 mag) 3,2/3,4 GHz 16

128 MB kétutas 155/180 W 575 EPYC 7252 (8 mag) 3,1/3,2 GHz 16

64 MB kétutas 120/150 W 475

EPYC 7232P (8 mag) 3,1/3,2 GHz 16

32 MB egyutas 120/150 W

450



A táblázatból látható, hogy az egyes modellek többféle TDP-vel rendelkeznek. Ez tulajdonképpen azért van, hogy az adott szervergyártó a célterülethez tudja szabni a rendszert, tehát lényegében a két-három paraméterből kiválaszthatják, hogy melyik konfigurációban járatják a processzorokat. Az AMD egyébként egyetlen terméket sem limitál, tehát bármelyiket is választja a potenciális megrendelő, mindegyik ugyanazokat a képességeket biztosítja, így még a legolcsóbb fejlesztéssel is elérhetők a biztonsági szolgáltatások, a 128+1 darab PCI Express 4.0-s sáv, a nyolccsatornás DDR4-es memóriavezérlő, illetve a 4 TB-os maximálisan kiépíthető memóriakapacitás.

A vállalat a Rome platformmal abszolút a piacszerzésre megy rá, amire jó esélyük van, mert az Intel aktuális, hasonló kategóriába sorolt Xeonjainál, 1,8-2-szer gyorsabbak az új EPYC-ek. A legtöbb feladatnál elmondható, hogy az egyutas konfigurációjú Rome platform a kétutas konfigurációjú Cascade Lake-SP fejlesztésekkel versenyez, a kétutas EPYC pedig a négyutas Xeonokkal. Értelemszerűen kevesebb tokozás mellett sokkal kisebb az üzemeltetési költség, tehát nemcsak olcsóbb magát az EPYC-re épülő szervert megépíteni, hanem még a használat, illetve bizonyos szoftverlicencek tekintetében is spórolni lehet vele. Még az EPYC számára nagyon kedvezőtlen környezetben, vagyis az AVX-512-es alkalmazásoknál is hasonló teljesítményre képes az AMD leggyorsabb, EPYC 7742-es processzora, az Intel Xeon Platinum 8280-hoz viszonyítva, ráadásul utóbbi másfélszer drágább, miközben a legtöbb alkalmazásban egy EPYC 7742 majdnem tartja a lépést két Xeon Platinum 8280-nal is.

Az AMD azt is bejelentette, hogy a friss fejlesztésük megdöntött 80 világrekordot a teljesítmény és a hatékonyság tekintetében, tehát kijelenthető, hogy a trónfosztás történt.

A Rome platformra hamarosan érkeznek a szerverek, illetve a Google is elérhetővé teszi Cloud Engine-ben a rendszert. Az AMD pedig már a Zen 3-at babusgatja, amelyről elárulták, hogy elkészült, így Milan platform mintáit hamarosan elkezdik szállítani, vagyis jövőre meg is jelenhet az utód, a tervezőcsapat pedig már a Zen 4-re fókuszál.