věda

Foxconn představuje první velký jazykový model

Společnost uvedla, že model je založen na architektuře Llama 3.1 Meta (File) | Foto kredit: Reuters

Taiwan’s Foxconn řekl v pondělí, že to spustilo První model velkého jazyka a plány na použití technologie ke zlepšení správy výrobního a dodavatelského řetězce.

Model s názvem „Foxbrain“ byl vyškolen pomocí 120 GPU NVIDIA H100 GPU a dokončen asi za čtyři týdny, uvedl největší výrobce smluvní elektroniky na světě.

Společnost, která sestavuje iPhone pro Apple a také produkuje servery umělé inteligence NVIDIA, uvedla, že model je založen na architektuře Llama 3.1 Meta.

Jedná se o první velký jazykový model Tchaj -wanu se schopnostmi uvažování, který je optimalizován pro tradiční čínské a tchajwanské jazykové styly, uvedl.

Foxconn uvedl, že ačkoliv ve srovnání s destilačním modelem Deepseeka v Číně došlo k mírné mezeře v oblasti výkonu, jeho celkový výkon je velmi blízký standardům světové úrovně.

Foxbrain původně navržený pro interní aplikace zahrnuje analýzu dat, podporu rozhodování, spolupráci dokumentů, matematiku, uvažování a řešení problémů a generování kódu.

Foxconn uvedl, že plánuje spolupracovat s technologickými partnery na rozšíření aplikací modelu, sdílení svých informací o open-source a propagaci AI ve výrobě, správě dodavatelského řetězce a inteligentním rozhodování.

NVIDIA poskytla podporu prostřednictvím svého superpočítače založeného na Tchaj-wanu „Taipei-1“ a nabídla technické poradenství během tréninku modelu, řekl Foxconn.

Taipei-1, největší superpočítač na Tchaj-wanu, je vlastněn a provozován společností Nvidia v Kaohsiungu, jižním městě na ostrově.

Foxconn oznámí další podrobnosti o modelu během konference vývojáře GTC NVIDIA v polovině března.

Zdrojový odkaz

Related Articles

Back to top button