Vědci učili „robota pes“ poháněného AI, jak hrát badminton proti lidem-a je to vlastně opravdu dobré

Vědci vyškolili čtyřnohového robota, aby hráli badmintonu proti lidskému soupeři, a to je rozdrceno přes soud, aby hrál shromáždění až 10 výstřelů.
Kombinací pohybů celého těla s vizuálním vnímáním robotnazývá se „Anymal„Naučil se přizpůsobit způsob, jakým se přesunul, aby dosáhl raketového závodu a úspěšně ji vrátil přes síť Umělá inteligence (AI).
To ukazuje, že čtyřnohé roboti mohou být postaveny jako soupeři v „složitých a dynamických sportovních scénářích“, vědci napsali ve studii zveřejněné 28. května v časopise Vědecká robotika.
Anymal je čtyřnohý robot podobný psům, který váží 110 liber (50 kilogramů) a stojí asi 1,5 stop (0,5 metrů) vysoký. Mít čtyři nohy umožňuje Anymal a Podobné čtyřnásobné roboty cestovat po náročném terénu a Pohybujte se nahoru a dolů překážkami.
Vědci již dříve přidali zbraně do těchto psích strojů a učili je, jak na to Načíst konkrétní objekty nebo Otevřené dveře popadnutím rukojeti. Koordinace kontroly končetin a vizuální vnímání v dynamickém prostředí však zůstává výzvou v robotice.
Související: Sledujte „robotového pes“, který se zablokuje základním kurzem parkouru pomocí AI
„Sport je pro tento druh výzkumu dobrou aplikací, protože můžete postupně zvyšovat konkurenceschopnost nebo potíže,“ spoluautor studie Yuntao MALive Science řekl robotický výzkumný pracovník dříve v Eth Zürichu a nyní s robotikou Startup Light.
Výuka nového psa nových triků
V tomto výzkumu MA a jeho tým připojili dynamickou rameno, které drží badmintonovou raketu pod úhlem 45 stupňů na standardní robot Anymal.
S přidáním paže stál robot 5 stop, vysoký 3 palce (1,6 m) a měl 18 kloubů: tři na každé ze čtyř nohou a šest na paži. Vědci navrhli komplexní vestavěný systém, který ovládal pohyby paží a nohou.
Tým také přidal stereofonní kameru, která měla na sobě dvě čočky naskládané na sebe, napravo od centra na přední straně těla robota. Obě čočky mu umožnily zpracovat vizuální informace o příchozích shlukcích v reálném čase a vypracovat, kam míří.
Robot se poté naučil stát se badmintonovým hráčem Posílení učení. S tímto typem strojového učení prozkoumal robot své prostředí a použil pokus a omyl, aby se naučil spatřit a sledovat raketu, navigovat k němu a otočit raketu.
Za tímto účelem vědci nejprve vytvořili simulované prostředí sestávající z badmintonového soudu, přičemž virtuální protějšek robota stojí ve středu. Virtuální raketoplány byly podávány z téměř středu poloviny soupeře soudu a robot byl pověřen sledováním své pozice a odhadem jeho letové trajektorie.
Poté vědci vytvořili přísný tréninkový režim, aby naučil Anymal, jak zasáhnout raketopty, s virtuálním trenérem odměňujícím robota za různé vlastnosti, včetně polohy rakety, úhlu hlavy rakety a rychlosti houpačky. Důležité je, že výkyvy byly časově založeny na motivaci přesných a včasných zásahů.
Shuttlecock mohl přistát kdekoli přes soud, takže robot byl také odměněn, pokud se efektivně přesunul přes soud a pokud se zbytečně nezrychlil. Cílem společnosti Anymal bylo maximalizovat, kolik toho bylo odměněno ve všech pokusech.
Na základě 50 milionů pokusů o tomto simulačním tréninku vytvořili vědci neuronovou síť, která by mohla ovládat pohyb všech 18 kloubů, aby cestoval a zasáhl raketoptock.
Rychlý student
Po simulacích vědci přenesli neuronovou síť do robota a Anymal byl propuštěn skrz své kroky v reálném světě.
Zde byl robot vyškolen, aby našel a sledoval jasně oranžový raketoplán, který podával jiný stroj, který vědcům umožnil ovládat rychlost, úhly a přistávací umístění raketových stop. Anymal musel rozbít přes soud, aby zasáhl raketovou rychlost, která by ji vrátila přes síť a do středu soudu.
Vědci zjistili, že po rozsáhlém tréninku by robot mohl sledovat raketa a přesně je vrátit s rychlostí houpačky až přibližně 39 stop za sekundu (12 metrů za sekundu) – zhruba polovinu rychlosti houpání průměrného amatérského amatérského badmintonového hráče, poznamenali vědci.
Anymal také upravil své pohybové vzorce na základě toho, jak daleko musí cestovat do Shuttlecock a jak dlouho to muselo dosáhnout. Robot nemusel cestovat, když byl raketoplán, aby měl přistát jen pár stop (půl metru) daleko, ale asi 5 stop (1,5 m), kterýkoli mal míchal, aby dosáhl raketoplánu pohybem všech čtyř nohou. Ve vzdálenosti asi 7 stop (2,2 m) se robot přesunul na raketoplán a vytvořil období výšky, která prodloužila dosah paže o 3 stopy (1 m) ve směru cíle.
„Ovládání robota, který se podívá na Shuttleclock, není tak triviální,“ řekla Ma. Pokud se robot dívá na Shuttlecock, nemůže se pohybovat velmi rychle. Ale pokud to nevypadá, nebude vědět, kam musí jít. „K tomuto kompromisu se musí stát poněkud inteligentním způsobem,“ řekl.
MA byl překvapen tím, jak dobře robot přišel na to, jak koordinovaným způsobem pohybovat všech 18 kloubů. Je to obzvláště náročný úkol, protože motor u každého kloubu se učí samostatně, ale konečné hnutí vyžaduje, aby pracovali v tandemu.
Tým také zjistil, že robot se spontánně začal pohybovat zpět do středu soudu po každém zásahu, podobně jako lidské hráče, které se připravují na příchozí kyvadlové.
Vědci však poznamenali, že robot nezohlednil hnutí soupeře, což je důležitý způsob, jak lidští hráči předpovídají trajektorie Shuttlecock. Zahrnutí odhadů lidských pozic by pomohlo zlepšit výkon společnosti Anymal, uvedl tým ve studii. Mohli by také přidat krk kloub, který umožní robotovi sledovat Shuttlecock po dobu více času, poznamenal Ma.
Myslí si, že tento výzkum bude nakonec mít aplikace mimo sport. Například by mohl podpořit odstranění trosek během úsilí o pomoc při katastrofách, řekl, protože robot by byl schopen vyrovnat dynamické vizuální vnímání agilním pohybem.



