Video: ISSCC2020: Plenary - Future Scaling: Where Systems and Technology Meet (Lapkritis 2024)
Nors lustų pardavėjai kasmetinėje tarptautinėje kietojo kūno grandinių konferencijoje (ISSCC) nepristato naujų lustų, jie dažnai pateikia daugiau informacijos apie jau paskelbtų produktų vidinį veikimą. Štai keletas dalykų, kurie man pasirodė įdomūs šios savaitės laidoje.
„Intel“ „Ivytown“ serverio architektūra
"Intel" aptarė naujausią versiją savo "Xeon E7 šeimos procesorių, lustas su iki 15 branduolių ir 30 siūlų, vadinamų Ivytown. Jis paremtas „Ivy Bridge EP“ architektūra, naudojama „Xeon E5 2600 V2“. Procesorius pagamintas naudojant „Intel“ 22 nm procesų technologiją su „Tri-Gate“ tranzistoriais (briaunos yra 34 nm aukščio ir 8 nm pločio) ir pakeis dabartinį „Westmere EX“ sukurtą „Xeon E7“. Palyginimui, dabartinis „Xeon E7“, gaminamas 32 nm plokštuminiame HKMG procesoriuje, turi 10 branduolių ir 20 gijų ir turi 30 MB L3 talpyklą, palyginti su 37, 5 MB „Ivytown“ versijoje.
Vienas iš labiausiai įdomių funkcijų šios naujos šeimos procesorių yra jos modulinė architektūra. Pagrindų planą sudaro trys stulpeliai iš penkių branduolių, kiekvienas su savo L3 talpyklos pjūviu, įdėta žiedinė magistralė ir speciali IO stulpelių viršuje ir apačioje (QPI saitai viršuje ir atminties valdiklis apačioje). "Intel" planuoja sukurti 10-core versiją, pašalinant dešiniajame stulpelyje; ir sukurti 6-core versija procesą šalinant dvi eiles.
15 branduolių versija turi 4.31 mlrd tranzistoriai-kuris "Intel" sako pats už bet mikroprocesoriais ir priemonės 541 kvadratinių milimetrų. 10 branduolių versijoje yra 2, 89 milijardo tranzistorių ir jos matmenys yra 341 kvadratinis milimetras. 6 branduolių variantas turi 1, 86 milijardo tranzistorių ir matuoja 257 kvadratinius milimetrus. Veikimo dažniai svyruoja nuo 1.4GHz iki 3.8GHz su TDPs nuo 40W iki 150W.
Kitas įdomus aspektas Ivytown yra jo atminties buferio architektūra. Tas pats štampas palaiko standartinę keturių kanalų DDR3 atmintį, veikiančią iki 1867MT / s, ir naują keturių kanalų „Voltage-Mode Single-Ended“ (VMSE) sąsają su atminties plėtiniu, veikiančiu 2667 MT / s. Iš viso jis gali palaikyti iki 12TB atminties į 8-socket serverio-tris kartus atminties talpa Westmere EX. 15 branduolių versiją bus galima įsigyti dviem skirtingais paketais: vieną, kuris suderinamas su esama „Romley“ platforma („Socket-R“), kad būtų galima lengvai atnaujinti, ir kitą, kuris įgalina naują platformą naudojant atminties kaupiklius.
Daugiau „Haswell“ detalių
„Intel“ taip pat pateikė daugybę detalių apie „Haswell“ architektūrą, naudojamą dabartinėje „Core“ šeimoje. Tam naudojami ir 22 nm tri-vartų tranzistoriai. „Intel“ teigė, kad Haswellas integruoja keletą naujų technologijų, įskaitant visiškai integruotą įtampos reguliatorių arba FIVR (konsoliduojančią platformą nuo penkių įtampos reguliatorių iki vienos), įdėtą DRAM talpyklą geresniam grafikos veikimui, mažesnės galios būsenas, optimizuotas IO, AVX2 instrukcijas ir platesnis SIMD sveikasis skaičius.
Yra trys pagrindiniai „Haswell“ variantai: Pirma, yra keturių branduolių jungtis su atskiru PCH (platformos valdiklio centru) su greitesne grafika (nuo dviejų iki keturių branduolių). Antra, yra Ultrabook platforma, kuri sujungia dviejų branduolių Haswell su PCH į vieną, multi-chip paketą. Procesorius palaiko mažesnės galios būsenas, PCH yra modifikuotas mažesnei galiai, o abu bendrauja mažos galios magistralėje - visa tai sumažina budėjimo būseną 95 procentais. Galiausiai tame pačiame pakete yra versija su „Iris Pro“ grafika ir 128 MB eDRAM talpyklos. Kelių lustų paketai naudoja paketo IO, užtikrinantį didelį pralaidumą mažu energijos kiekiu tarp procesoriaus ir PCH bei eDRAM.
Priklausomai nuo procesoriaus branduolių skaičiaus ir grafikos (GT2 ar GT3), Hasvelas turi nuo 960 milijonų iki 1, 7 milijardo tranzistorių, o štampo ilgis yra nuo 130 iki 260 kvadratinių milimetrų. Jis skirtas veikti nuo 0, 7 iki 1, 1 volto, esant plačiam dažnių diapazonui nuo 1, 1 iki 3, 8 GHz.
128GB eDram mirti matuoja 77 kvadratinių milimetrų, ir suteikia didžiausią pralaidumą 102GBps. „Intel“ teigė, kad palyginti su ta pačia sistema be eDRAM, papildoma talpykla padidina našumą iki 75 procentų, nors bendras našumas padidėja nuo 30 iki 40 procentų.
AMD „Steamroller Powers Kaveri“
AMD, linkusi įdėti daugiau grafikos į tai, ką ji vadina pagreitėjusiais procesoriais (APU arba procesoriais, kurie sujungia procesorius ir grafiką), sutelkė dėmesį į savo naująjį CPU branduolį, žinomą kaip Steamroller, kuris naudojamas įmonės naujosiose „Kaveri“ procesorių serijose. „Steamroller“ šerdis, gaminama 28 nm tūrio CMOS procese, turi 236 milijonus tranzistorių, kurių plotas 29, 47 kvadratiniai milimetrai. Tai apima du sveikųjų skaičių branduolius, du komandų dekodavimo vienetus ir keletą bendrų elementų, įskaitant komandų iškėlimą, slankiojo kablelio vienetą ir 2 MB L2 talpyklos. AMD paprastai naudoja vieną iš šių Steamroller modulių jos "dviejų branduolių" granulių (atspindinčių 2 sveikasis skaičius šerdys); ir du jo „keturių branduolių“ lustuose.
Palyginti su ankstesne „Piledriver“ šerdimi, kuri buvo gaminama naudojant 32 nm SOI procesą, „Steamroller“ prideda antrą instrukcijų dekodavimo įrenginį, didesnę 96 KB bendrąją instrukcijų talpyklą ir kitus patobulinimus. AMD teigė, kad tai paskatino iki 14, 5 proc. Daugiau instrukcijų per ciklą, o tai reiškia, kad 9 proc. Geresnis našumas naudojant vieną giją turinčias programas ir 18 proc. Geresnis našumas dvigubomis srieginėmis programomis. Jis taip pat gali paleisti 500MHz didesniu dažniu tuo pačiu galia, arba pristatyti apie tą patį našumą su 38 procentų energijos mažinimo. „Steamroller“ šerdis sukurta veikti nuo 0, 7 iki 1, 45 volto diapazone.
Mobilūs procesoriai iš MediaTek, Renesas ir Qualcomm
Daugelis kompanijų skaičius skaitė savo ARM pagrindu procesorių.
„MediaTek“ papasakojo apie savo 28 nm heterogeninį kelių branduolių procesorių (HMP) su keturių branduolių procesoriumi ir dvigubu GPU. „MediaTek“ lustas turi du „Cortex A15“ branduolius, veikiančius 1, 8 GHz dažniu, ir du „Cortex A7“ branduolius, veikiančius 1, 4 GHz dažniu, kartu su „Imagination G6200 400MHz“ dviejų branduolių GPU. Jis taip pat turi „Full HD“ vaizdo įrašų kodeką ir 13 megapikselių vaizdo jutiklio procesorių.
MediaTek taip pat kalbėjo apie PTP (Performance, šilumos ir galios) technologija, kuri stebi lustas ir kontroliuoja valdžią. Šiuo atveju bendrovė sako PTP leidžia arba 23 procentų padidinti taktinį dažnį arba iki 41 proc galios santaupų.
Ši mikroschema naudoja tikrąjį ARM HMP apdorojimą, o tai reiškia, kad priklausomai nuo darbo krūvio, gali veikti bet koks didelių ir mažų branduolių nuo vieno iki keturių derinys. „MediaTek“ teigė, kad naudojant tikrąjį HMP, lustas gali pasiekti 33–51 proc. Geresnį našumą esant dideliam darbo krūviui arba 2–5 kartus geresnį energijos vartojimo efektyvumą esant nedidelėms apkrovoms, tuo tarpu adaptyvus šilumos valdymas suteikia dar 10 proc.
Renesas pristatė "siūlomą" 28nm HPM aštuonių branduolių nevienalytė procesorius skirtas mobiliųjų įrenginių ir automobilių pramoginių sistemų. Lustas naudoja keturis 2GHz Cortex A15 branduolių ir keturių 1GHz Cortex A7 branduolių. Jis yra pajėgus vienu metu valdyti visus 8 branduolius, kad būtų užtikrintas didžiausias našumas, tačiau jis taip pat naudoja nevienalytę architektūrą ir galios valdymo metodus, kad optimizuotų tam tikrų darbo krūvių ar maitinimo paketų našumą.
"Qualcomm aprašyti savo Hexagon skaitmeninis signalo procesorius, kuris yra naudojamas savo mobiliųjų OSK už daugialypės terpės ir modemo programų įvairovė. Dabartinė versija pagaminta 28mm HKMG urmu CMOS procesą. Ši konstrukcija skirta aukštos instrukcijas per parą, palyginti su didelėmis darbo dažnius.
ARM serverio pusėje „Applied Micro“ kalbėjo apie bendrovės pirmosios kartos 64 bitų ARMv8 procesorių, pirmą kartą paskelbtą per neseniai vykusį „Open Compute“ viršūnių susitikimą. Tai grindžiama "Potenza" procesoriaus modulio (PMD), kuri apima du branduolius dalintis 256kb L2 cache. „Potenza“ yra pagaminta iš 40 nm tūrio CMOS, kiekviename PMD yra 84 milijonai tranzistorių, o jo štampo plotas yra 14, 8 kvadratiniai milimetrai. Jis gali veikti iki 3GHz dažnio, esant 0, 9 voltui, tačiau esant vidutiniam darbo krūviui, jis vidutiniškai dirba 4, 5 W. „X-Gene 3“ serverio platformą sudaro keturi PMD (aštuoni branduoliai), bendroji 8 MB talpa L3 talpyklą ir keturi DRAM atminties kanalai aplink centrinį jungiklį. Jis taip pat sujungia 10GB Ethernet, SATA 2/3, PCIe Pr 3, ir USB 3.0.
Naujos kartos mikroschemų proceso technika
Taip pat buvo keletas pristatymų apie naujos kartos mikroschemų proceso technologijas, nes beveik visi pagrindiniai lustų gamintojai planuoja pereiti prie 3D ar „FinFET“ gamybos 14 arba 16 nm mazge (po „Intel“, kuri jau tiekia 22 nm lustus). su tokia technologija).
"Samsung" kalbėjo apie savo būsimą 14nm FinFET procese, rodo 128Mb 6T SRAM masyvo ir išbandyti lustą. „Samsung“ teigė, kad „FinFET“ yra geras sprendimas mažos galios mobiliesiems SoC, nes jie suteikia gerą mastelį, didelę srovę ir mažą nuotėkį bei turi gerą trumpo kanalo valdymą.
Tai taip pat kelia tam tikrų sunkumų SRAM, nes SRAM maitinimo įtampa nebuvo mažinama. SRAM dabar užima 20-30 proc die plotas yra SoC, bet ji naudoja apie 40-50 proc galios. Spręsti šias problemas, "Samsung" pasiūlė keletą naujų metodų veikti SRAM per FinFET tranzistorių mažesne maitinimo įtampa.
TSMC sprendė panašias problemas, parodydamas savo 16 nm 128Mb SRAM lustą. TSMC teigė, kad „FinFET“ tapo pagrindine gamybos technologija, viršijančia 20 nm, tačiau kanalo pločio ir ilgio, naudojant „FinFET“, dydis yra iššūkis didinant įprastą 6T-SRAM ir maitinimo įtampą. Šioms problemoms įveikti TSMC pasiūlė du pagalbos rašymo būdus.
Tai yra gana techniniai klausimai, bet sprendžiant problemas yra labai svarbus, jei norime gauti didesnio tankio, daugiau galios efektyvus žetonų ateityje.