Co je to ExAscale Computing? | Živá věda

ExAscale Computing je nejnovějším milníkem v Špičkové superpočítače -Vysoce výkonné systémy schopné zpracovat výpočty při rychlostech, které jsou v současné době nemožné pomocí jakékoli jiné metody.
Superpočítače ExAscale jsou počítače, které běží v měřítku exaflopu. Předpona „exa“ označuje 1 Quintillion, což je 1 x 1018 – nebo jeden s 18 nuly po tom. Flop znamená „Operace s pohyblivým bodem za sekundu“, typ výpočtu použitého k porovnávání počítačů pro účely srovnání.
To znamená, že počítač ExAscale může každou sekundu zpracovávat alespoň 1 Quintillion s pohyblivou bodu. Pro srovnání, většina domácích počítačů pracuje v rozsahu Teraflop (obvykle kolem 5 teraflopů), zpracovává pouze asi 5 bilionů (5 x 1012) Operace s pohyblivým bodem za sekundu.
„Exaflop je miliarda miliard operací za sekundu. Problémy můžete řešit v mnohem větším měřítku, jako je simulace celé planety, nebo to můžete udělat za mnohem vyšší granularitu,“ Gerald Kleyn, viceprezident pro řešení zákazníků HPC & AI HPEřekl živé vědě.
Čím více operací s pohyblivou čárkou může počítač zpracovat každou sekundu, tím silnější je, což umožňuje řešit více výpočtů mnohem rychleji. ExAscale Computing se obvykle používá pro provádění složitých simulací, jako je prognóza meteorologického počasí, modelování nových typů medicíny a virtuální testování návrhů motorů.
Kolik exascale je tam a na co se používají?
První počítač ExAscale, volal Hranicebyl spuštěn společností HPE v červnu 2022. Má zaznamenanou provozní rychlost 1,102 exaflopů. Tuto rychlost byla od té doby překonána Současný vůdce El Capitankterý v současné době běží na 1,742 exaflops. V současné době existují dva v době zveřejnění.
Exascale superpočítače byly použity během Covid-19 pandemický Shromažďovat, zpracovat a analyzovat obrovské množství dat. To vědcům umožnilo porozumět a modelovat genetické kódování viru, zatímco epidemiologové rozmístili výpočetní sílu strojů k predikci šíření nemoci po celé populaci. Tyto simulace byly prováděny v mnohem kratší době, než by bylo možné pomocí vysoce výkonného kancelářského počítače.
Rovněž stojí za zmínku Kvantové počítače nejsou stejné jako superpočítače. Místo reprezentace informací pomocí konvenčních bitů se kvantové počítače propojují do kvantových vlastností qubits Řešit problémy příliš složité pro jakýkoli klasický počítač.

Aby bylo možné pracovat, potřebuje ExAscale Computingové desítky tisíc pokročilých centrálních zpracovatelských jednotek (CPU) a grafických zpracovatelských jednotek (GPU), které mají být zabaleny do prostoru. Zůstaná blízkost CPU a GPU je nezbytná, protože to snižuje latenci (čas potřebné pro přenos dat mezi komponenty) v rámci systému. Zatímco latence je obvykle měřena v pikosekundách, když se současně zpracovávají miliardy výpočtů, tato malá zpoždění se mohou zkombinovat a zpomalit celkový systém.
„Interconnect (Network) spojuje výpočetní uzly (sestávající z CPU a GPU a paměti) dohromady,“ Pekka Manninen, ředitelka vědy a technologie CSCřekl živé vědě. „Softwarový zásobník pak umožňuje využití kloubního výpočetního síly uzlů do jediného výpočetního úlohy.“
Přestože jsou jejich komponenty napěchovány co nejpřísněji, počítače ExAscale jsou stále kolosální zařízení. Například hraniční superpočítač má 74 skříní, z nichž každý váží přibližně 3,5 tun a přebírá přes 7 300 čtverečních stop (680 metrů čtverečních) – přibližně poloviční velikost fotbalového pole.
Proč je výpočetní technika exascale tak náročné
Samozřejmě, zabalení tolik komponent pevně může způsobit problémy. Počítače obvykle vyžadují chlazení, aby se rozptýlily odpadní teplo, a miliardy výpočtů provozovaných exAscale počítači každou sekundu je mohou zahřát až do potenciálně poškozujících teplot.
„Spojení toho, že mnoho komponent dohromady bude fungovat jako jedna věc, je pravděpodobně nejobtížnější cesta, protože všechno musí fungovat dokonale,“ řekl Kleyn. „Jako lidé, všichni víme, že je dost obtížné, jen aby se vaše rodina spojila na večeři, natož aby 36 000 GPU spolupracovaly v synchronicitě.“
To znamená, že řízení tepla je zásadní pro vývoj superpočítačů ExAscale. Někteří používají studená prostředí, jako je v Arktidě, k udržení ideální teploty; Zatímco jiní používají chlazení kapaliny, stojany ventilátorů nebo nějakou kombinaci obou, aby udržovaly nízké teploty.
Systémy kontroly životního prostředí však také přidávají další komplikaci výzvě pro řízení energie. ExAscale Computing vyžaduje obrovské množství energie kvůli počtu procesorů, které je třeba napájet.
Ačkoli ExAscale Computing spotřebovává hodně energie, může z dlouhodobého hlediska poskytnout úsporu energie projektu. Například místo iterativního vývoje, vytváření a testování nových návrhů lze počítače použít k prakticky simulaci designu v poměrně krátkém čase.
ExAscale počítače jsou tak velmi náchylné k selhání
Dalším problémem, kterým čelí výpočetní technika, je spolehlivost. Čím více komponent je v systému, tím složitější se stává. Očekává se, že průměrný domácí počítač bude mít nějaký selhání do tří let, ale v exAscale výpočtu se míra selhání měří v hodinách.
Tato krátká míra selhání je způsobena výpočtem ExAscale vyžadující desítky tisíc procesorů a GPU – to vše pracuje s vysokou kapacitou. Vzhledem k vysokým požadavkům současně očekávaným od všech složek je pravděpodobné, že alespoň jedna složka selže během několika hodin.
Vzhledem k selhání míry výpočtu ExAscale používají aplikace v případě zpracování výpočtu v případě selhání systému kontrolu.
Aby se zmírnilo riziko selhání a zabránilo zbytečným prostojům, počítače ExAscale používají diagnostickou sadu vedle monitorovacích systémů. Tyto systémy poskytují neustálý dohled nad celkovou spolehlivostí systému a identifikují komponenty, které vykazují známky opotřebení, což je označuje k výměně, než způsobí výpadky.
„Diagnostické sady a monitorovací systém nám ukazují, jak stroj funguje. Můžeme vrtat do každé jednotlivé komponenty, abychom zjistili, kde selže a má proaktivní výstrahy. Technici také neustále pracují na stroji, aby nahradili neúspěšné komponenty a udržovali jej v operačním stavu,“ řekl Kleyn. „Aby udržely tyto stroje v chodu.“
Vysoké provozní rychlosti v ExAscale Computing vyžadují specializované operační systémy a aplikace, aby plně využily své zpracovatelské síly.
„Musíme být schopni paralelizovat výpočetní algoritmus na milionech zpracovatelských jednotek, heterogenně (nad uzly a v uzlu nad jádrem GPU nebo CPU),“ Manninen. „Ne všechny problémy s výpočtem se mu hodí. Komunikace mezi různými procesy a vlákny musí být pečlivě organizována; efektivně je implementované vstup a výstup je náročné.“
Vzhledem k složitosti prováděných simulací může být ověření výsledků také náročné. Výsledky počítače ExAscale nelze zkontrolovat, nebo alespoň ne v krátkém čase, konvenčními kancelářskými počítači. Místo toho aplikace používají předpovídané chybové lišty, které projektují hrubý odhad toho, jaké by měly být očekávané výsledky, s čímkoli mimo tyto tyče zlevněné.
Beyond ExAscale Computing
Podle Mooreův zákonOčekává se, že počet tranzistorů v integrovaném obvodu se bude zdvojnásobit každé dva roky. Pokud tato míra vývoje pokračuje (a je to velké, pokud, jak to nemůže pokračovat navždy), mohli bychom očekávat, že Zettascale – výpočet s 21 nuly – počítač přibližně za 10 let.
ExAscale Computing Excels při současném zpracování masivního počtu výpočtů ve velmi krátkém čase, zatímco kvantové výpočetní technika začíná řešit neuvěřitelně složité problémy, se kterými by konvenční výpočetní technika bojovala. Ačkoli kvantové počítače nejsou v současné době tak výkonné jako počítače ExAscale, předpovídá se, že je nakonec překonají.
Jedním možným vývojem by mohl být sloučení kvantového výpočtu a superpočítačů. Tento hybridní kvantový/klasický superpočítač by kombinoval výpočetní výkon kvantových počítačů s vysokorychlostním zpracováním klasického výpočtu. Vědci tento proces již zahájili, Přidání kvantového počítače do superpočítače fugaku v Japonsku.
„Když tyto věci nadále zmenšujeme a zlepšujeme naše chladicí schopnosti a učiníme z nich levnější, bude to příležitost vyřešit problémy, které jsme předtím nedokázali vyřešit,“ řekl Kleyn.



