věda

Google představuje Ironwood v Cloudu příští 2025, TPU pro „věk inference AI“

Architektura Ironwooda se mění až do 9 216 čipů chlazených kapalinou připojených přes špičkovou síť interconnect (ICI) (ICI) | Fotografický kredit: Zvláštní ujednání

Na příští konferenci ’25 představil Google Ironwood, jejich jednotku pro zpracování tenzorů sedmé generace (TPU), což znamenalo klíčový skok v technologii AI. Navržen speciálně pro odvození – proces, kde modely AI vytvářejí předpovědi na základě naučených dat -Ironwood je nejsilnější, škálovatelnější a energeticky efektivnější TPU Google se kdy vyvinula.

Ironwood znamená posun od reaktivních modelů AI, které reagují na dotazy, na proaktivní systémy, které vytvářejí poznatky nezávisle. Tento evoluce definuje, co Google nazývá „věk inference“, kde agenti AI autonomně načítají a syntetizují data, aby nabízeli komplexní odpovědi, nejen nezpracované informace.

Tento TPU je navržen tak, aby řešil obrovské výpočetní požadavky AI nové generace, včetně velkých jazykových modelů (LLM) a směsi odborníků (MOE), což je nezbytné pro úkoly vyžadující pokročilé uvažování. LLMS, stejně jako ty, které napájí chatboty, zpracovávají obrovské množství textu pro generování lidských odpovědí, zatímco MOE dynamicky aktivují různé části modelu, aby optimalizovaly výkon a účinnost.

Architektura Ironwooda se mění až do 9 216 čipů chlazených kapalinou připojených přes špičkovou síť mezi čipu (ICI). Toto nastavení zajišťuje rychlý přenos dat a zvýšenou synchronizaci přes čipy, kritické pro trénink a spuštění komplexních modelů AI. Aby své schopnosti uvedli do perspektivy, Ironwoodův 42,5 exaflops výpočetní moci trpasličí největší superpočítač na světě, El Capitan, který působí na 1,7 exaflopy.

Klíčem k Ironwoodově zdatnosti je jeho pokročilá Sparsecore, specializovaná součást, která urychluje zpracování aplikací, jako jsou systémy doporučení a finanční modelování. Ironwood navíc integruje software Google Pathways, což umožňuje bezproblémové distribuci pracovní zátěže AI přes tisíce TPU, čímž posouvá hranice generativní AI.

Účinnost je dalším charakteristickým znakem Ironwoodu. Poskytuje dvojnásobek výkonu na Watt ve srovnání s jeho předchůdcem, Trillium, díky optimalizovanému designu čipů a inovativní technologií chlazení kapalin. To je zásadní, protože rostoucí energetické požadavky AI představují výzvy pro udržitelné výpočetní techniky.

Schopnosti paměti také zaznamenaly dramatická vylepšení. Ironwood se může pochlubit 192 GB paměti s vysokou šířkou pásma (HBM) na čip – šestkrát vyšší než u trillia – což mu umožňuje zpracovat větší datové sady se sníženou latencí. Jeho šířka pásma HBM dosáhne působivých 7,2 terabitů za sekundu, což zajišťuje, že rychlý přístup k datům nezbytným pro moderní pracovní zátěž AI.

Vylepšená síť ICI s 1,2 terabitů za sekundu obousměrnou šířku pásma usnadňuje efektivní komunikaci mezi čipy. To je zásadní pro distribuované úkoly AI, kde různé části modelu běží současně napříč několika procesory, aby se urychlil výpočet.

Kromě aplikací specifických pro AI podporují rozšířené schopnosti společnosti Ironwood vědecké a finanční domény a rozšiřují její dopad. S modely jako Gemini 2.5 a Nobelovy ceny Alphafold již působí na TPUS, společnost Ironwood předvídá nové průlomy ve výzkumu a aplikacích AI.

Ironwood je nastaven na k dispozici koncem tohoto roku a stanoví nový měřítko pro výkon, účinnost a škálovatelnost v rychle se vyvíjející krajině umělé inteligence.

(Spisovatel byl pozván na událost Google další ’25 v Las Vegas, Nevada)

Zdrojový odkaz

Related Articles

Check Also
Close
Back to top button