Foxconn představuje první velký jazykový model

Společnost uvedla, že model je založen na architektuře Llama 3.1 Meta (File) | Foto kredit: Reuters
Taiwan’s Foxconn řekl v pondělí, že to spustilo První model velkého jazyka a plány na použití technologie ke zlepšení správy výrobního a dodavatelského řetězce.
Model s názvem „Foxbrain“ byl vyškolen pomocí 120 GPU NVIDIA H100 GPU a dokončen asi za čtyři týdny, uvedl největší výrobce smluvní elektroniky na světě.
Společnost, která sestavuje iPhone pro Apple a také produkuje servery umělé inteligence NVIDIA, uvedla, že model je založen na architektuře Llama 3.1 Meta.
Jedná se o první velký jazykový model Tchaj -wanu se schopnostmi uvažování, který je optimalizován pro tradiční čínské a tchajwanské jazykové styly, uvedl.
Foxconn uvedl, že ačkoliv ve srovnání s destilačním modelem Deepseeka v Číně došlo k mírné mezeře v oblasti výkonu, jeho celkový výkon je velmi blízký standardům světové úrovně.
Foxbrain původně navržený pro interní aplikace zahrnuje analýzu dat, podporu rozhodování, spolupráci dokumentů, matematiku, uvažování a řešení problémů a generování kódu.
Foxconn uvedl, že plánuje spolupracovat s technologickými partnery na rozšíření aplikací modelu, sdílení svých informací o open-source a propagaci AI ve výrobě, správě dodavatelského řetězce a inteligentním rozhodování.

NVIDIA poskytla podporu prostřednictvím svého superpočítače založeného na Tchaj-wanu „Taipei-1“ a nabídla technické poradenství během tréninku modelu, řekl Foxconn.
Taipei-1, největší superpočítač na Tchaj-wanu, je vlastněn a provozován společností Nvidia v Kaohsiungu, jižním městě na ostrově.
Foxconn oznámí další podrobnosti o modelu během konference vývojáře GTC NVIDIA v polovině března.
Publikováno – 10. března 2025 01:44