věda

Co se stane, když se veřejné znalosti vytvoří na soukromé infrastruktuře?

Óza poslední rok se značné množství uznání za strojové učení (ML) dostalo k výzkumníkům pracujícím ve velkých technologických firmách nebo vedle nich, přestože nedávné pokroky v umělé inteligenci (AI) byly financovány a postaveny na podnikové infrastruktuře.

V roce 2024 Nobelova nadace udělila cenu za fyziku Johnu Hopfieldovi a Geoffrey Hintonovi za příspěvky, které umožnily učení s umělými neuronovými sítěmi, a cenu za chemii Demis Hassabis a John Jumper pro predikci proteinové struktury (spolu s výpočtovým návrhem Davida Bakera). Pan Hassabis a pan Jumper byli v době udělení ceny zaměstnáni ve společnosti Google DeepMind; Pan Hinton strávil ve společnosti Google deset let, než odešel v roce 2023. Tyto vztahy nevymazávají akademickou historii laureátů, ale ukazují, kde se nyní provádí výzkum na úrovni cen.

Tato změna spočívá na materiálních podmínkách a také na nápadech. Nejmodernější modely závisí na velkých výpočetních clusterech, spravovaných datech a inženýrských týmech. Program společnosti Google na vývoj tensor-processing units (TPU) pro svá datová centra ukazuje, jak se fixní kapitál může stát vědeckým vstupem, nikoli pouze nákladem na informační technologie. Víceleté financování Microsoftu a superpočítače Azure pro OpenAI odrážejí stejnou politickou ekonomiku z jiného úhlu.

Pouzdro pro veřejný přístup

Jakýkoli výzkum s veřejným původem by měl vrátit se do veřejné sféry. V této souvislosti veřejné peníze podpořily ranou teoretickou práci, akademické posty, stipendia, sdílené datové soubory, publikační infrastrukturu a často i samotné výzkumníky. Paralelně body, ve kterých se hodnota stala vyloučenou, ležely čím dál tím nižší: s ohledem na výpočetní zdroje (zkráceně výpočetní) to zahrnuje práva k datům a kódu, schopnost nasazovat modely v měřítku a rozhodnutí o uvolnění nebo zadržení vah. To pomáhá vysvětlit, proč byli nedávní laureáti Nobelovy ceny umístěni v podnikových laboratořích a proč jsou hraniční systémy trénovány převážně na systémech soukromého cloudu.

Ve 20. století firmy jako Bell Labs a IBM hostily oceněný základní výzkum. Velká část znalostí se však poté přesunula přes reprodukovatelné publikace a otevřené benchmarky. Například reprodukce práce pana Jumpera dnes může vyžadovat velké výpočetní rozpočty a specializované provozní znalosti. V důsledku toho nejde jen o to, aby korporace dostávaly ceny, ale také o to, že cesta od veřejného náhledu k fungujícímu systému je infrastruktura a zakázky řízené několika firmami.

Zapojení veřejných prostředků by tak mělo vytvořit konkrétní povinnosti v místech, kde se technologie uzavírá pro soukromou kontrolu. Pokud akademická laboratoř přijme veřejný grant, výstupy by měly zahrnovat artefakty, díky kterým je dílo použitelné, včetně školicího kódu, vyhodnocovacích sad a vah v modelech umělé inteligence, které mají být vydány v rámci otevřených licencí. Pokud veřejná agentura kupuje vývoj cloudových kreditů nebo provizí, zakázky by měly vyžadovat, aby se referenční hodnoty a vylepšení vracely zpět do společných zdrojů, než aby byly uzavřeny u dodavatele.

Odstraňte úzká hrdla

Argumentem není, že podnikové laboratoře nemohou dělat základní vědu; jasně mohou. Tvrdí se, že veřejná politika by měla snížit strukturální výhody soukromé ovládání. Zvažte vydání AlphaFold 2 od Google DeepMind, které spolu s kódem a veřejným přístupem k předpovědím umožnilo výzkumníkům mimo původní laboratoř provozovat systém na (přiměřeně) standardním hardwaru, získávat velké množství předpočítaných struktur a integrovat jejich výsledky do rutinních pracovních postupů. Všechny tyto práce byly podporovány veřejnými institucemi, které byly ochotny tyto zdroje hostit a udržovat.

Tam, kde je korporátní stack nepostradatelný, například při trénování hraničních modelů (s miliardami nebo biliony parametrů), tvrzení o „zodpovědném uvolnění“ se často ironicky promítají do uzavřeného vydání. Místo toho by důslednějším postojem mělo být propojení řízení rizik se strukturovaným modelem otevřenosti – možná modelem, který zahrnuje postupná vydání, přístup k vahám, otevřené nástroje pro testování průniku a jasné oddělení bezpečnostních zdůvodnění a obchodních modelů – spíše než umožnit soukromým subjektům uchýlit se k plošnému utajení ve jménu bezpečnosti.

Stejná logika platí pro výpočty: to znamená, že pokud se výpočetní zdroje stanou vědeckým úzkým hrdlem, mělo by se s nimi zacházet jako s veřejnou službou. Národní a regionální compute commons by měly přidělovat zdroje zdarma nebo za poplatek akademickým skupinám, neziskovým organizacím a malým firmám a kvalifikovat je podle otevřených výstupů a bezpečnostních postupů. Konečným cílem je obnovit schopnost veřejných institucí reprodukovat, testovat a rozšiřovat vedoucí práci ML, aniž by musely žádat o firemní povolení. Bez takového commons se však veřejně financované nápady budou i nadále proměňovat v fungující systémy na privátních cloudech a vráceny veřejnosti jako drahé informační produkty.

I když je lákavé považovat subjekty zaměstnávající laureáty a financující kanály za samostatné záležitosti, jednu symbolickou a druhou strukturální, spojují je výpočetní zdroje. Skutečnost, že laureáti Nobelovy ceny pracovali v Google DeepMind, odráží to, kde nyní působí týmy s vědci ML, experty na domény, daty a výpočty. Stejně tak skutečnost, že nejviditelnější systémy posledních dvou let byly školeny na Microsoft Azure v rámci finanční dohody, vysvětluje, kdo by se o takové školení mohl pokusit. Obě skutečnosti odrážejí základní koncentrace zdrojů.

Mimo průmysl vs akademická sféra

Reakce veřejných agentur by měla být přímá – řekněme vázáním financování na otevřenost grantů a veřejných zakázek a vyžadováním podrobného zveřejnění financování a účtování nákladů na výzkum ve výzkumných dokumentech. Tam, kde by plná otevřenost vytvořila nepřijatelná rizika, mohou agentury použít kapitál nebo licenční poplatky k financování výpočetních a datových společných zdrojů, které podporují širší ekosystém. Na druhou stranu u podnikových laboratoří by jejich důvěryhodnost měla spočívat na měřitelných příspěvcích do společného majetku.

Novináři a veřejnost by také měli překročit rámec „průmysl versus akademická sféra“.

Relevantní otázky jsou, kdo určuje výzkumnou agendu, kdo řídí infrastrukturu, kdo může reprodukovat výsledky a kdo těží z nasazení výsledných modelů umělé inteligence. Interpretace Nobelových cen za rok 2024 jako samotných průmyslových vítězství by postrádala pointu, že znalostní základna je kumulativní a spoléhá se na veřejné vstupy, zatímco schopnost operacionalizovat tyto znalosti je seskupená. Formulování tohoto vzoru nám umožňuje rozpoznat vědecké zásluhy a zároveň vyžadovat reformy, které zajistí, že veřejné vstupy produkují veřejné výnosy – v kódu, datech, vahách, srovnávacích kritériích a přístupu k výpočtům.

Jistě, ústředním závěrem není zášť nad firemními platy, ale reakce na skutečnost, že průlomy se stále častěji objevují na křižovatce veřejných znalostí a soukromé infrastruktury. Programem politiky by mělo být znovu sjednotit vrstvy, kde se veřejné a soukromé podniky rozcházejí – artefakty, datové soubory a výpočty – a zapečet toto očekávání do smluv a norem, které řídí výzkum.

V těchto podmínkách mohou být budoucí ocenění oslavována s odpovídajícím veřejným prospěchem, protože výstupy, díky nimž je věda využitelná, budou vráceny veřejnosti.

Publikováno – 11. listopadu 2025 06:45 IST

Zdrojový odkaz

Related Articles

Back to top button