Namai Pirmyn mąstymas „Oracle“, „nvidia“, rankomis pažvelgs į karštus lustus

„Oracle“, „nvidia“, rankomis pažvelgs į karštus lustus

Video: Night (Lapkritis 2024)

Video: Night (Lapkritis 2024)
Anonim

Nors praėjusią savaitę daugiausiai lustų jaudulį sukėlė „Intel“ Broadwell pranešimas, buvo ir keletas kitų lustų, kurie buvo išsamiai aptarti metinėje „Hot Chips“ konferencijoje, kurioje daugiausia dėmesio buvo skiriama lustams, skirtiems serveriams ir duomenų centrams.

Paroda žinoma dėl aukščiausios klasės lustų, „Intel“, „Oracle“ ir IBM aptaria naujausius įrašus, tačiau tik „Oracle“ „Sparc M7“ buvo tikrai naujas. Vietoj to, didžioji dalis laidos buvo sutelkta į ARM pagrįstus produktus, įskaitant pirmąją informaciją apie būsimą „Nvidia“ 64 bitų „Tever K1“ procesoriaus „Denver“ versiją

„Oracle“, „Intel“ ir IBM siekia aukšto serverio lusto

Iš aukščiausios klasės lustų įspūdingiausios naujienos pasirodė iš „Oracle“, kuri aptarė naujos kartos savo SPARC procesorių, žinomą kaip M7. Ši mikroschema turės 32 S4 SPARC branduolius (kiekviename yra iki aštuonių dinaminių gijų), 64 MB L3 talpyklos, aštuonis DDR4 atminties valdiklius (iki 2TB vienam procesoriui ir 160 GBps atminties pralaidumą naudojant DDR4-2133) ir aštuonis duomenų analizės greitintuvus. lusto tinkle.

Lustas yra suskirstytas į aštuonias grupes su keturiomis šerdimis, kurių kiekviena turi bendrą L2 talpyklą ir padalintą 8 MB L3 talpyklą, turinčią daugiau kaip 192 GBps spartos pralaidumą tarp branduolio grupių ir vietinės L3 talpyklos. Palyginti su M6 (28 nm lustas su 12 3, 6 GHz „SPARC S3“ branduoliais), M7 užtikrina 3–3, 5 karto geresnį našumą naudojant atminties pralaidumą, sveikąjį skaičių, OLTP, „Java“, ERP sistemas ir slankiojo kablelio pralaidumą. „Oracle“ vyresnysis „SPARC Architecture“ direktorius Stephenas Phillipsas teigė, kad tikslas buvo laipsniškas našumo padidinimas, o ne prieaugis.

M7 gali pritaikyti iki 8 lizdų be klijų (iki 256 branduolių, 2 000 gijų ir 16 TB atminties) ir su ASIC jungikliu srautui valdyti SMP konfigūracijoje, iki 32 procesorių, taigi galėtumėte baigti su sistema su 1024 branduoliais, 8192 gijomis ir iki 64 TB atminties. Gana įspūdingai. „Oracle“ teigė, kad, palyginti su praėjusių metų „SPARC M6“, ji siūlo nuo 3 iki 3, 5 kartų geresnį našumą. Bendrovė teigė, kad tai bus optimizuota atsižvelgiant į paties „Oracle“ programinės įrangos paketą, pagamintą 20 nm proceso metu ir prieinamą sistemose kitais metais.

IBM taip pat pateikė daugiau informacijos apie savo „Power8“ liniją, apie kurią ji paskelbė praėjusių metų parodoje. Ta lusto versija turėjo 12 branduolių, kiekviename iš jų buvo iki aštuonių gijų, turinčių 512 KB SRAM 2 lygio talpyklos viename branduolyje (6 MB viso L2) ir 96 MB bendrų įterptųjų DRAM, kaip 3 lygio talpyklą. Šis didžiulis lustas, kurio matmenys yra 650 kvadratinių milimetrų su 4, 2 milijardo tranzistorių, yra pagamintas naudojant IBM 22 nm SOI procesą ir, remiantis IBM duomenimis, pradėtas gabenti birželį.

Prieš keletą mėnesių IBM paskelbė versiją su šešiais branduoliais, kurios matmenys yra 362 mm 2. Šių metų pokalbis buvo apie tai, kaip IBM gali sujungti dvi iš šešių branduolių versijų į vieną paketą su 48 „PCIe Gen 3“ juostomis. IBM teigė, kad dviejų lizdų versija, kurioje iš viso yra 24 branduoliai ir 192 gijos, pralenks dviejų procesorių procesą. „Xeon Ivy Bridge“ serveris su 24 branduoliais (su 48 gijomis). IBM parduoda „Power“ daugiausia didelio našumo ir specializuotose prekyvietėse, todėl dauguma žmonių nepalygins šių dviejų prekių, tačiau tai yra įdomu. Siekdama, kad „Power“ architektūra būtų labiau integruota, „IBM“ praėjusiais metais paskelbė „Open Power Consortium“, o šiais metais kompanija teigė turinti visą platformos atvirojo kodo programinės įrangos paketą. Tačiau iki šiol niekas kitas, išskyrus IBM, nepaskelbė apie serverį, pagrįstą platforma.

„Intel“ kalbėjo apie „Ivytown“, „Ivy Bridge“ serverio versiją, į kurią įeina prieš metus pristatytos „Xeon E5“, o vasario mėnesį pristatytos „Xeon E7“. Šių metų pokalbis buvo sutelktas į tai, kaip „Intel“ iš esmės turi vieną architektūrą, galinčią apimti abi rinkas, su mikroschemomis, kurios leidžia iki 15 branduolių, dviem DDR3 atminties valdikliais, trimis QPI saitais ir 40 „PCI Gen 3“ juostų, išdėstytų modulinėse grindyse. planą, kurį galima paversti į tris skirtingus štampus, kurių kiekvienas skirtas skirtingiems lizdams, iš viso daugiau nei 75 variantai. Tai galima naudoti dviejų, keturių ir aštuonių lizdų serveriuose be specialių jungčių.

Šios mikroschemos, be abejo, šiais laikais sudaro didžiąją dalį serverių pirkimo, nes „Intel“ sudaro didžiąją serverių vienetų dalį. Tačiau nemaža informacijos dalis anksčiau buvo pateikta ISSCC, ir tikimasi, kad „Intel“ netrukus pristatys kitą E5 šeimos versiją (E5-1600v3 ir E5-2600 v3), pagrįstą atnaujinta versija, kurioje naudojamas variantas. Haswello architektūra vadinama Haswell-EP. (Praėjusią savaitę „Dell“ paskelbė apie naujas darbo vietas, pagrįstas šiais naujais lustais.)

„Intel“ taip pat aptarė savo „Atom C2000“, žinomą kaip „Avoton“, kuris buvo pradėtas gaminti 2013 m. Pabaigoje. Ši mikroschema ir „Ivy Bridge“ bei „Haswell“ lustai yra pagrįsti „Intel“ 22 nm procesu.

„Nvidia“, AMD, „ARM“ taikytasis mikroįmonė naujosiose rinkose

Didžiausias pasirodymo netikėtumas greičiausiai buvo susitelkimas į ARM pagrįstą technologiją, įskaitant ARM garsiakalbių pagrindinius pranešimus ir „Nvidia“ išsamią informaciją apie būsimą savo „Tegra K1“ procesoriaus „Denver“ versiją.

Pagrindiniame pranešime ARM CTO Mike'as Mulleris aptarė galios apribojimus visose srityse nuo jutiklių iki serverių ir susitelkė ties tuo, kaip ARM bandė plėstis į įmonę. Mulleris taip pat iškėlė ARM jutiklių mikroschemų naudojimo daiktų internete idėją, kuri taip pat buvo paminėta „Qualcomm“ Rob Chandhok pranešime. Tačiau nė viena įmonė nepaskelbė naujų branduolių ar procesorių.

Vietoj to didžiosios naujienos šiame fronte atkeliavo iš „Nvidia“, kuri pateikė daug daugiau informacijos apie naująją „K1“ procesoriaus versiją. Kai pirmą kartą buvo paskelbtas bendrovės Denverio projektas, atrodė, kad ši mikroschema bus skirta didelio našumo skaičiavimo rinkai, tačiau dabar panašu, kad bendrovė daugiau dėmesio skyrė tokiems dalykams kaip planšetiniai kompiuteriai ir automobilių rinka. „Tegra K1“ bus dviejų versijų. Pirmasis, kuris buvo paskelbtas anksčiau šiais metais ir dabar pristatomas bendrovės „Skydas“ planšetiniame kompiuteryje, turi keturis 32 bitų „ARM Cortex-A15“ branduolius ir mažos galios „papildomą branduolį“ 4 + 1 konfigūracijoje, kurį „Nvidia“ pastūmėjo į vidų. jos „Tegra“ linija kelerius metus.

„Denver“ versija yra visiškai kitokia, turinti du naujus patentuotus „64 bitų“ branduolius, kuriuos suprojektavo „Nvidia“, ir kompanija tikrai vertina pasiekiamą našumą. Šerdis yra septynių krypčių superscalar (reiškia, kad ji vienu metu gali vykdyti iki septynių mikro-ops), ir turi 128KB keturių krypčių L1 komandų talpyklą ir 64KB keturių krypčių L1 duomenų talpyklą. Lustas sujungia du iš šių branduolių kartu su 2 MB 2 lygio talpykla, kuri tarnauja abiems šerdims, kaip 192 „CUDA branduoliai“ (grafikos branduoliai), kuriuos jis dalijasi su 32 bitų K1. Tai reiškia didelį nukrypimą nuo 4 + 1 architektūros.

Vienas didelis pakeitimas apima tai, ką „Nvidia“ vadina „dinaminiu kodo optimizavimu“, kuris yra skirtas paimti dažnai naudojamą ARM kodą ir konvertuoti jį į mikro kodą, specialiai optimizuotą procesoriui. Tai saugoma 128 MB talpyklos atmintyje (ištraukta iš tradicinės sistemos pagrindinės atminties). Tikslas yra suteikti jam vykdant užsakymą, nereikalaujant tiek energijos, kiek paprastai naudojama ši technika. Koncepcija nėra nauja - „Transmeta“ ją išbandė prieš metus su savo „Crusoe“ lustu - tačiau „Nvidia“ sako, kad dabar tai veikia žymiai geriau.

„Nvidia“ parodė keletą etalonų, kuriuose jis teigė, kad naujas lustas gali pasiekti žymiai didesnį našumą nei esami keturių ar aštuonių branduolių mobilieji CPU - konkrečiai cituodami „Qualcomm“ „Snapdragon 800“ (MSM8974), „Apple A7“ (kartais vadinamą „Cyclone“), naudojamą „iPhone“. 5s - ir net kai kurie pagrindiniai kompiuterio procesoriai. „Nvidia“ teigė, kad jis pralenkė „Atom“ („Bay Trail“) procesorių ir buvo panašus į „Intel“ 1, 4 GHz dviejų branduolių „Celeron“ (Haswell) procesorių. Aišku, aš linkęs pardavėjų pasirodymų numerius vertinti su druska: ne tik tai, kad pardavėjai pasirenka etalonus, nėra visiškai aišku, kad mes kalbame apie tą patį laikrodžio greitį ar tą patį energijos sunaudojimą.

Tuo tarpu mikroschemose, skirtose labiau serveriams, AMD plačiau papasakojo apie savo „Opteron A1100“, žinomą kaip „Sietlas“, su kompanija sakydama, kad šiuo metu imasi pavyzdžių ir serveriuose turėtų būti prieinama maždaug šių metų pabaigoje. Šis lustas turi aštuonias 64 bitų „Cortex A57“ procesoriaus šerdes; 4 MB L2 talpyklos ir 8 MB L3 talpyklos; du atminties kanalai, skirti iki 128GB DDR3 arba DDR4 atminties su klaidų taisymu; daug integruotų I / O (8 juostos kiekviena iš PCIe Gen3 ir 6 Gbps SATA ir du 10 Gbps Ethernet prievadai); „Cortex A5“ „sistemos valdymo procesorius“ saugiam įkrovimui; ir greitintuvą, skirtą pagreitinti šifravimą ir iššifravimą. Jis gaminamas „GlobalFoundries“ 28 nm procese. AMD dar nepateikė informacijos apie lusto dažnį, galią ar našumą, tačiau parodė pagrindinę lusto schemą. (aukščiau)

„Applied Micro“ jau seniai tvirtina, kad turi pirmąjį ARM serverio lustą rinkoje, turintį „X-Gene 1“ (žinomą kaip „Storm“), turintį 8 2, 4 GHz patentuotus ARMv8 branduolius, keturis DDR3 atminties valdiklius, PCIe Gen3 ir 6 Gbps SATA bei 10 Gbps Ethernet.. Šiuo metu tai gaminama naudojant TSMC 40 nm procesą, sako bendrovė.

„Hot Chips“ metu „Applied Micro“ pastūmėjo savo „X-Gene 2“ („Shadowcat“) dizainą, kurį bus galima įsigyti su aštuoniais arba 16 „patobulintų“ branduolių, veikiančių nuo 2, 4 iki 2, 8 GHz greičiu, ir prideda „RoCE“ (RDMA per konverguotą Ethernet) pagrindinį kompiuterį. Kanalo adapteris kaip jungtis, sukurta siekiant sudaryti galimybes per mažą delsą jungtis tarp mikroserverių grupių. Tai skirta naudoti klasteriuose su vienu serverio stovu, palaikančiu iki 6480 gijų ir 50TB atminties, visi dalijasi vienu saugojimo telkiniu. Bendrovė sako, kad „X-Gene 2“ pasiūlys apie 60 procentų geresnį skaičių, dvigubai didesnį nei „Memcache“ ir apie 25 procentus geresnį „Apache Web“ aptarnavimą. Jis gaminamas 28 nm proceso metu ir šiuo metu imamas mėginys.

„Applied Micro“ teigia, kad „X-Gene 2“ užpildo spragą tarp konkuruojančių mikro serverių („Cavium ThunderX“, „Intel Atom C2000“ „Avoton“ ir „AMD Opteron A1100“ „Seattle“) ir pilno dydžio „Xeon“ serverių. Jame buvo pateikta išsami informacija apie naujos kartos „X-Gene 3“ („Skylark“), kurios paleidimas imamas kitais metais. Šis lustas turės 16 ARMv8 branduolių, veikiančių iki 3 GHz dažniu, ir bus gaminamas naudojant 16 nm „FinFet“ technologiją.

„Oracle“, „nvidia“, rankomis pažvelgs į karštus lustus