Namai Pirmyn mąstymas Didieji pokyčiai pagaliau yra superkompiuterių akiratyje

Didieji pokyčiai pagaliau yra superkompiuterių akiratyje

2024

Video: The Groucho Marx Show: American Television Quiz Show - Hand / Head / House Episodes (Lapkritis 2024)

Žvelgiant į šios savaitės superkompiuterių konferenciją ISC 17, atrodo, kad superkompiuterių pasaulis per kelerius ateinančius metus pastebės didelius patobulinimus, tačiau du kartus per metus atnaujinamų greičiausių pasaulyje superkompiuterių „Top 500“ sąrašas labai nesiskyrė nuo ankstesnė versija.

Greičiausi pasaulyje kompiuteriai ir toliau yra dvi masyvios kinų mašinos, kurios kelerius metus viršijo sąrašą: „Sunway TaihuLight“ kompiuteris iš Kinijos nacionalinio superkompiuterių centro Wuxi mieste, kurio „Linpack“ našumas yra didesnis nei 93 petaflopai (93 tūkst. Trilijonų slankiojo kablelio). operacijų per sekundę); ir „Tianhe-2“ kompiuteris iš Kinijos nacionalinio superkompiuterių centro Guangdžou, kurio nuolatinis veikimas siekia daugiau nei 33, 8 petaflopo. Šios mašinos greičiausiai išlieka greičiausia.

Naujas numeris trečias yra „Piz Daint“ sistema iš Šveicarijos nacionalinio superkompiuterių centro, „Cray“ sistema, naudojanti „Intel“ Ksenonai ir „Nvidia Tesla P100“, kurie neseniai buvo patobulinti, kad suteiktų „Linpack“ nuolatinį našumą - 19, 6 petaflopo, dvigubai daugiau nei ankstesnis. Tai iškėlė iš sąrašo aštuonių skaičių.

Tai sumažina aukščiausią JAV sistemą - „Titan“ sistemą Oak Ridžo nacionalinėje laboratorijoje - iki ketvirtos vietos ir tai yra pirmas kartas per dvidešimt metų, kai JAV sistemos nėra trejetuke. Likęs sąrašas lieka nepakitęs - JAV vis dar sudaro penkis iš 10 geriausių, o Japonija - du.

Net jei greičiausių kompiuterių sąrašas beveik nepasikeitė, kitur yra didelių pokyčių. Į „Green 500“ efektyviausiai energiją vartojančių sistemų sąrašą pakito devynios iš dešimties. Viršuje yra „Tsubame 3.0“ sistema, modifikuota Tokijo technologijos instituto „HPE ICE XA“ sistema, pagrįsta „Xeon E5-2680v4 14“ šerdimi, „Omni-Path“ jungtimi ir „Nvidia“ „Tesla P100“, leidžiančia 14, 1 gigaflopo už vatą. Tai didžiulis šuolis iš „Nvidia“ „DGX Saturn V“, remiantis įmonės DGX-1 platforma ir „P100“ mikroschemomis, kurios lapkričio mėn. Sąraše buvo pirmaujančios, bet šį kartą buvo dešimties, esant 9, 5 gigaflops / Watt. „P100“ yra devyniose iš dešimties geriausių „Green500“ sistemų.

Sulaužyti 10 gigablatų / vatą yra daug, nes tai reiškia, kad hipotetinė „exaflop“ sistema, sukurta naudojant šiuolaikines technologijas, sunaudotų mažiau nei 100 megavatų (MW). Tai vis dar per daug - tikslas yra 20–30 MW galios sistemai, kurią tyrėjai tikisi pamatyti per artimiausius penkerius metus, tačiau tai yra didžiulis žingsnis į priekį.

Kaip ir „Top 500“ sąraše, panašiuose sąrašuose su skirtingais etalonais, kaip antai „High Performance Conjugate Gradients“ (HPCG), kai mašinos paprastai mato tik 1–10 procentų savo didžiausio našumo, buvo padaryta tik nedidelių pakeitimų, o viršutiniai rodikliai buvo geriausi. sistema - šiuo atveju „Riken K“ aparatas - vis tiek pateikia mažiau nei 1 petaflopą. Į šį sąrašą pateko ir „TaihuLight“, ir „Piz Daint“ sistemos. Kai tyrinėtojai kalba apie „exaflop“ aparatą, jie paprastai turi omenyje „Linpack“ etaloną, tačiau HPCG gali būti realesnis, kalbant apie realaus pasaulio veikimą.

GPU skaičiavimo, kaip greitintuvo, atsiradimas - beveik visada naudojant „Nvidia“ GPU procesorius, tokius kaip P100 - buvo akivaizdžiausias pokytis šiuose sąrašuose per pastaruosius metus, po kurio buvo pristatytas nuosavas „Intel“ greitintuvas, daugialypis „Xeon Phi“ (įskaitant naujausia „Knights Landing“ versija). Dabartiniame „Top 500“ sąraše yra 91 sistema, naudojanti greitintuvus ar koprocesorius, įskaitant 74 su „Nvidia“ GPU ir 17 su „Xeon Phi“ (dar trys naudoja abi); vienas su „AMD Radeon GPU“ kaip greitintuvas, o du, kuriuose naudojamas daugelio branduolių procesorius iš Japonijos tiekėjo „PEZY Computing“. Dabar papildomos 13 sistemų kaip pagrindinį duomenų apdorojimo įrenginį naudoja „Xeon Phi“ („Knights Landing“).

Tačiau daugelis didesnių superkompiuterių pakeitimų vis dar yra horizonte, nes pradedame matyti didesnes sistemas, sukurtas atsižvelgiant į šias sąvokas. Vienas iš pavyzdžių yra naujasis „MareNostrum 4“ Barselonos superkompiuterių centre, kuris pateko į „Top 500“ sąrašą 13 numeriu. Kaip iki šiol įdiegta, tai yra „Lenovo“ sistema, pagrįsta būsima „Xeon“ „Skylake-SP“ versija (oficialiai „Xeon Platinum 8160 24“). pagrindinis procesorius). Įdomu tai, kad per ateinančius kelerius metus planuojamos trys naujos „besiformuojančios technologijos“ grupės, įskaitant vieną klasterį su „IBM Power 9“ procesoriais ir „Nvidia“ GPU, skirtus maksimaliai apdoroti daugiau kaip 1, 5 Petaflopo; antra, paremta „Knights Hill“ Xeon Phi versija; ir trečiasis pagrįstas 64 bitų ARMv8 procesoriais, suprojektuotais „Fujitsu“.

Šios sąvokos yra naudojamos daugelyje kitų svarbių superkompiuterių projektų, ypač kai kuriuos remia JAV energetikos departamentas vykdydamas savo CORAL bendradarbiavimą Oak Ridge, Argonne ir Lawrence Livermore National Labs. Pirmiausia turėtų įvykti viršūnių susitikimas Oak Ridge, kuriame bus naudojami „IBM Power 9“ procesoriai ir „Nvidia Volta“ GPU, ir kuris bus pristatytas daugiau nei 150–300 didžiausių petaflopų; seka Sierra Lawrence'o Livermore'o kelyje, pateikdama daugiau kaip 100 piko petaflopų.

Tada turėtume pamatyti „Aurora“ superkompiuterį Argonne nacionalinėje laboratorijoje, pagrįstą „Knights Hill“ Xeon Phi versija ir pastatytą „Cray“. CORAL sistemos turėtų būti parengtos ir bėgimas kitais metais.

Tuo tarpu kinų ir japonų grupės taip pat planuoja atnaujinimus, daugiausia naudodamos unikalią architektūrą. Turėtų būti įdomu žiūrėti.

Atrodo, kad dar didesnis poslinkis bus šiek tiek toliau: perėjimas prie mašininio mokymosi, paprastai masiškai lygiagrečiuose procesoriuose pačiame procesoriuje. Nors „Linpack“ skaičius nurodo 64 bitų ar dvigubo tikslumo našumą, yra keletas programų klasių, įskaitant daugelį gilaus neuroninio tinklo pagrįstų programų, kurios geriau veikia atliekant vieno ar net pusės tikslumo skaičiavimus. Nauji procesoriai tuo pasinaudoja, pavyzdžiui, neseniai paskelbtame „Nvidia“ pranešime „Volta V100“ ir būsimoje „Knights Mill“ versijoje „Xeon Phi“. Parodoje „Intel“ teigė, kad versija, kuri turėtų būti gaminama ketvirtą ketvirtį, turėtų naujus instrukcijų rinkinius „mažo tikslumo skaičiavimui“, vadinamus Quad Fused Multiply Add (QFMA) ir Quad Virtual Neural Network Instrukcijomis (QVNNI)..

Manau, kad šios sąvokos galėtų būti pritaikytos ir kitoms architektūroms, tokioms kaip „Google“ TPU ar „Intel“ FPGA ir „Nervana“ lustai.

Net jei šiais metais nematome didelių pokyčių, kitais metais turėtume tikėtis sulaukti daugiau. Egzistuojančio (1000 teraflops) aparato koncepcija vis dar akivaizdi, nors tai greičiausiai apims dar daugiau didelių pakeitimų.