Namai Pirmyn mąstymas Superkompiuteris 15: didesni pokyčiai horizonte

Superkompiuteris 15: didesni pokyčiai horizonte

Video: Week 3, continued (Lapkritis 2024)

Video: Week 3, continued (Lapkritis 2024)
Anonim

Žvelgiant į praėjusio mėnesio „Supercomputing 15“ (SC15) konferencijos, vykstančios Austine, pranešimus ir renginius, atrodo, kad nors didelio našumo kompiuteriai gali šiek tiek užmigti, tai yra rinka, kurioje gali įvykti dideli pokyčiai per metus. ateiti.

Jei pažvelgsite į „top500“ sąrašo, du kartus per metus skelbiamų greičiausių pasaulio kompiuterių, lyderius, šeštą kartą iš eilės lyderis yra „Tianhe-2“ - superkompiuteris, kurį sukūrė Kinijos nacionalinis gynybos technologijos universitetas. Remiantis „top500“ sąrašu, šis aparatas užtikrina 33, 86 petaflop / s (kvadrilijonus skaičiavimų per sekundę) ilgalaikio našumo Linpack etalone ir 54, 9 petaflop / s teorinį aukščiausią našumą. Tai pagrįsta „Intel Xeon“ ir „Xeon Phi“ procesoriais.

Antroji vieta ir toliau atitenka „Titan“, „Cray XK7“ sistemai, pagrįstai AMD Opteron procesoriais ir „Nvidia K20x GPU“, įrengtomis DOE „Oak Ridge“ nacionalinėje laboratorijoje, esant 17.59 „Petaflop“ / s nuolatinio našumo Linpack etalone.

Dvi naujos mašinos nulaužė 10 geriausiųjų. Trejybės kompiuteris Lawrence Livermore nacionalinėje laboratorijoje (LLNL) yra šeštas su 8, 1 petaflop / s, tuo tarpu Hazel-Hen sistema Vokietijos Höchstleistungsrechenzentrum Stuttgart (HLRS) pateko į aštuntą su 5, 6 petaflop / s. Abi yra „Cray XC“ mašinos, kurių pagrindą sudaro „Intel Xeon“ procesoriai su „Avinu“.

Didesni pokyčiai vyksta žemiau esančiame sąraše, ypač padidėjus Kinijos sistemų skaičiui, išaugusiam iki 109, palyginti su tik 37 ankstesniame sąraše. Iš dalies tai atrodo iš daugiau Kinijos sistemų, vykdančių etalonus ir teikiančių sąrašo rezultatus. Dėl to JAV sistemų skaičius sumažėjo nuo 231 iki 200, tai yra mažiausias skaičius nuo sąrašo sudarymo 1993 m. o Europos sistemų skaičius sumažėjo nuo 141 iki 108.

Viena didžiausių tendencijų yra sistemų, naudojančių greitintuvus ar koprocesorius, skaičiaus padidėjimas, kuris išaugo iki 104 sistemų dabartiniame sąraše, palyginti su 90 liepos mėn. Daugumoje šių sistemų naudojami „Nvidia Tesla“ GPU, po jų seka „Intel“ „Xeon Phi“ koprocesoriai, keliose - kartu. „Nvidia“ nurodė, kad ji buvo 70 iš šių sistemų, įskaitant 23 iš 24 naujų sąraše esančių sistemų.

Parodoje „Nvidia“ akcentavo greitintuvų augimą, ypač taikomų programų skaičių, optimizuotą atsižvelgiant į įmonės CUDA architektūrą. Bendrovės teigimu, 90 procentų iš 10 geriausių didelio našumo skaičiavimo programų ir 70 procentų iš 50 geriausių programų yra pagreitinta. Vienas intriguojantis naudojimas yra sistemų, kuriose vykdomas orų modeliavimas, pagrindinė programa, skirta didelio našumo skaičiavimui, nes orų prognozes rengia visų rūšių vyriausybės. Cray anksčiau buvo atkreipęs dėmesį į tokių greitintuvų naudojimą Šveicarijos meteorologijos biure (MeteoSwiss) ir yra kalbėjęs apie tai, kaip bendradarbiauja su tyrėjais Šveicarijoje perrašant daugelį programų. „Nvidia“ dabar nurodo, kad Nacionalinė vandenynų ir atmosferos administracija (NOAA) taip pat naudoja akseleratorius kai kurioms savo orų prognozėms.

Tarp kitų programų, „Cray“ nurodytos naftos ir dujų programos, tokios kaip 3D geofizikos naudojimas rezervuaro modeliavimui, taip pat finansinės paslaugos, tokios kaip rizikos vertinimas. Tokios programos retai sudaro greičiausias sistemas pasaulyje, tačiau tai rodo, kad didelio našumo kompiuteriai vaidina vis didesnį vaidmenį įmonėse. Cray kalbėjo apie nuolatinį progresą prie didesnių ir išsamesnių modelių taikymo visose mokslo ir inžinerijos disciplinose bei tradicinio darbo krūvio derinimą su analitika.

Mane taip pat domino „Linux“ fondo pranešimas apie naujas pastangas, vadinamas OpenHPC, skirtą sukurti atviresnius standartus HPC pasaulyje. Tai įdomi idėja, ir panašu, kad ją pasirašo daug didžiųjų žaidėjų.

Kūriniuose yra nemažai naujų sistemų. IBM stato naują mašiną, pavadintą „Summit“ Oak Ridge nacionalinėse laboratorijose (ORNL), ir kitą, vadinamą „Sierra“ Lawrence Livermore nacionalinėje laboratorijoje (LLNL), kurios abi yra pagrįstos „IBM Power“ architektūros procesoriais, „Nvidia Tesla“ GPU ir „Mellanox“ sujungimais. Tikimasi, kad viršūnių susitikime bus 150–300 didžiausių petaflop / s, o Sierra - daugiau kaip 100 petaflop / s.

Be to, „Intel“ ir „Cray“ kuria naują aparatą, vadinamą „Aurora“, kurio pagrindą sudaro būsimi „Knights Hill“ „Intel Xeon Phi“ procesoriai, skirti „Argonne Leadership Computing Facility“ (dalis „Argonne National Labs“), kurio tikslas - 150 petaflopų 2018 m. yra Energetikos departamento programos, vadinamos Oak Ridge, Argonne ir Lawrence Livermore nacionalinėmis laboratorijomis (CORAL), dalis, kurios tikslas - paspartinti didelio našumo kompiuterių, ypač „FastForward 2“, plėtrą.

Vis dėlto dar turime nueiti ilgą kelią link „nepaprasto skaičiavimo“.

Tuo tarpu buvo keli procesoriaus pranešimai, kurie gali būti naudingi ateityje. „Nvidia“ ypač skatino superkompiuterių naudojimą hiperskalbės interneto programoms, ypač mašininiam mokymuisi. Ji paskelbė keletą šiek tiek žemesnės klasės produktų: „Tesla M40“ plokštę su 3072 CUDA šerdimis, kuri, jos teigimu, galėjo atlikti iki 7 vieno tikslumo teraflopų, kurie pirmiausia skirti „gilaus mokymosi“ mokymui, ir „M4“, žemesnės galios plokštė su 1024 šerdimis ir 2, 2 vieno tikslumo „teraflop“, kurią galima naudoti norint giliai įsitraukti į mokymąsi ir atlikti tokius veiksmus, kaip vaizdo ir vaizdo apdorojimas. Be to, bendrovė paskelbė naują „hiperskalbių rinkinį“ su programomis, skirtomis didžiausioms skaičiavimo svetainėms. Abu naujieji aparatūros gaminiai yra pagrįsti 28 nm procesų technologijomis ir bendrovės „Maxwell“ architektūra.

Bendrovė paskelbė apie dvi paskesnes architektūras, žinomas kaip „Pascal“, numatomas kitais metais, ir „Volta“, kurios bus laikomasi vėliau. „Intel“ sutelkė dėmesį į tai, kaip HPC daro įtaką mokslui, ir mane suintrigavo jo aprašymas, kaip jis naudoja savo superkompiuterį - šiuo metu užima 99 vietą 500 geriausiųjų sąraše - kad padėtų suprojektuoti savo procesorius. Visų pirma, bendrovė teigė, kad sunaudoja milijoną procesoriaus valandų vien tam, kad suprojektuotų fotokomplektus naujos kartos procesoriams.

Didžioji „Intel“ veiklos dalis buvo sutelkta į „Knights Landing“ - kitą „Xeon Phi“ lusto versiją, kuri gali būti naudojama kaip greitintuvas, bet taip pat ir įkrova; ir jo „Omni-Path“ audinys. Nors „Intel“ sako, kad bendras prieinamumas bus 2016 m. Pirmąjį pusmetį, nedaugelis klientų turi išankstinę prieigą prie „Knights Landing“. Šiuo metu „Cray“ testuoja didelę „Knights Landing“ sistemą, ruošdamasi pristatyti naują superkompiuterį pavadinimu „Cori“ Nacionaliniam energijos tyrimų mokslinio skaičiavimo centrui (NERSC), o kitais metais - „Los Alamos“ nacionalinei laboratorijai ir „Sandia“ nacionalinėms laboratorijoms. Prancūzijos sistemų integratoriaus „Atos“ padalinys „Bull“ taip pat gavo ankstyvas „Knights Landing“ versijas, kad galėtų pasiruošti „Tera 1000“ sistemai, kurią ji kuria Prancūzijos alternatyviosios energijos ir atominės energijos komisijai. „Argonne Leadership Computing Facility“ dirba prie sistemos, vadinamos „Theta“, kuri turėtų būti pristatyta kitais metais, o „Sandia“ nacionalinės laboratorijos bendradarbiauja su „Penguin Computing“ siekdamos atnaujinti keletą sistemų, kuriose naudojamos ankstesnės „Xeon Phi“ procesorių kartos.

„Intel“ anksčiau yra sakęs, kad bus trys skirtingos „Knights Landing“ versijos: bazinės linijos pagrindinis procesorius (galintis savarankiškai paleisti), pagrindinis procesorius su integruotu „Omni-Path“ audiniu ir „PCIe“ spartintuvo kortelė. Pačią mikroschemą sudarys 36 plytelės, kiekviena su dviem procesoriaus branduoliais (iš viso 72 branduoliai), keturiais vektorių apdorojimo elementais (po du kiekvienoje branduolyje), 1 MB bendros L2 talpyklos ir talpyklos agentu darnumui palaikyti; „Intel“ teigė, kad jis turėtų pasiekti maždaug tris kartus didesnį „Knights Corner“ procesoriaus efektyvumą su 3 teraflop / s dvigubu tikslumu ir 6 teraflop / s vienu tikslumu. Jis taip pat naudoja naują atminties sistemą, vadinamą MCDRAM, pakuotės atmintį, kurios pralaidumas didesnis nei 3 kartus, palyginti su išėjimu į DDR4, kuris, atrodo, yra hibridinės atminties kubo architektūros variantas, apie kurį „Intel“ ir „Micron“ kalbėjo. Parodoje „Cray“ turėjo prototipų sistemą su įkroviniu „Knights Landing“, o nemažai kitų pardavėjų demonstravo „Knights Landing“ sukurtas sistemas. Šią „Xeon Phi“ versiją planuoja sekti versija, vadinama „Knights Hill“, kuri bus sukurta būsimojo 10 nm proceso metu.

Be to, „Fujitsu“ šiek tiek plačiau papasakojo apie savo pavyzdinį projektą „Flagship 2020“, pagrįstą nauju lustu, žinomu kaip FX100 su 32 branduoliais. Tikimasi, kad tai maždaug keturis kartus padidins spartųjį tašką, palyginti su dabartiniu FX10, ir kaip „Knights Landing“, „Fujitsu“ FX100 taip pat naudos hibridinės atminties kubo architektūros versiją. Be to, NEC turi projekto kodinį pavadinimą „Aurora“ (nesusijusį su CORAL projektu), pagrįstą tolesniais SX-ACE mikroschemų pavyzdžiais, tačiau didesniu atminties pralaidumu. Tai skirta 2017 metams.

Superkompiuteris 15: didesni pokyčiai horizonte