AI vhled do stravování dětí a rizika obezity

Učením umělé inteligence rozpoznat každé sousto, které si dítě vezme, vědci odhalují skryté stravovací návyky, které by mohly změnit způsob, jakým předcházíme obezitě od jídelního stolu směrem ven.
Studie: ByteTrack: hloubkové učení pro počet skusů a detekci rychlosti skusu pomocí videí o jídle u dětí. Obrazový kredit: Andrii Spy_k/Shutterstock.com
Stravovací chování vrhá světlo na riziko nadměrné konzumace a obezity. Nová studie zveřejněná v časopise Hranice ve výživě představuje systém hlubokého učení pro analýzu chování dětí při kousání pomocí videí, která zaznamenávají dětská jídla.
Zavedení
Mikrostruktura jídla popisuje různé chování, ke kterému dochází během záchvatu jídla: kousnutí, žvýkání, rychlost skusu a velikost skusu. Analýza mikrostruktury jídla pomáhá identifikovat individuální stravovací návyky a jejich variace napříč spektrem typů potravin a odhalit mechanismy, které jsou základem poruch příjmu potravy a obezity.
Děti, u kterých se rozvine obezita, mají větší pravděpodobnost, že budou jíst větší sousta a jíst rychleji, což obojí zvyšuje množství zkonzumovaného jídla. Preventivní intervence by mohly být přizpůsobeny pomocí pozorované mikrostruktury jídla, což představuje nový způsob omezení této epidemie.
Zlatým standardem pro analýzu skusu a mikrostruktury je manuální pozorovací kódování, které zahrnuje ruční prohlížení videozáznamů stravovacího chování dětí a jejich anotaci časovými razítky. Přestože je tato metoda velmi spolehlivá a přesná, je pracná a vyžaduje velké množství času, kromě toho, že je nákladná.
Ve srovnání s ručním kódováním by automatizované systémy detekce skusu mohly být mnohem efektivnější a škálovatelnější. Ty však většinou využívají data pro dospělé z akustických senzorů a akcelerometrů na základě přednastavených limitů pohybu. Takové senzory mohou nesprávně interpretovat pití nebo gestikulaci, například, jako kousnutí.
Opět platí, že různé způsoby stravování (lžící, hůlkami nebo rukou) by mohly způsobit problémy s detekcí zvýšením obtížnosti aktu. Široká variabilita samotného aktu navíc ztěžuje automatizaci jeho detekce v různých prostředích.
To vedlo k použití automatizovaných platforem k detekci kousnutí. Tyto platformy mohou používat kritéria založená na umístění (vzdálenost od ruky, otevření úst) nebo metody optického toku ke sledování pohybů napříč po sobě jdoucími snímky. Nedokážou však spolehlivě odlišit stravovací chování od jiných pohybů, které jsou zvláště u dětí běžné.
To vyvolalo zájem o metody hlubokého učení využívající konvoluční neuronové sítě (CNN), většinou trénované a testované na přísně kontrolovaných video nahrávkách jídla, často dospělými. V reálném světě jsou taková videa neobvyklá; normou je špatné osvětlení a rozdíly v pohybech při jídle. Technologie hlubokého učení by mohla pomoci překonat interpretační obtíže způsobené takovými artefakty.
O studiu
ByteTrack je systém hlubokého učení, který používá video nahraná jídla pro děti k nalezení počtu kousnutí a rychlosti kousnutí. Trénovalo se na 242 videích (1440 minut) zaznamenaných od 94 dětí ve věku 7-9 let, z nichž každé absolvovalo čtyři jídla s týdenním odstupem. K trénování komponenty systému detekce obličeje byla použita podmnožina 52 videí. Videa byla rozšířena, aby zavedla skutečné změny v podmínkách nahrávání.
Při natáčení videa jedly děti čtyři jídla s týdenním odstupem, která obsahovala stejné jídlo, ale v různém množství. Systém funguje ve dvou fázích. První stupeň se používá pro detekci obličeje, zamknutí na obličeji cílového dítěte při ignorování ostatních lidí a předmětů.
K tomuto účelu byly použity dva systémy, jeden zaměřený na rychlé rozpoznání obličeje a druhý na rozpoznání v náročných situacích, kdy je obličej částečně blokován. Kombinace tak směřuje k dosažení účinné a přesné detekce obličeje.
Druhý používá tato čistá data k rozlišení aktivity kousnutí od ostatních pohybů. Za tímto účelem byla zkombinována konvoluční neuronová síť EfficientNet (CNN) s rekurentní sítí s dlouhou krátkodobou pamětí (LSTM). Model se upravil na rozostření, slabé osvětlení, změnu orientace, rotaci, chvění fotoaparátu a ruce nebo náčiní blokující výhled z úst. Výsledky získané modelem byly porovnány s manuálním observačním kódováním.
Výsledky studie
Testování ByteTrack ukázalo vysokou přesnost vyvolání a preciznost > 98 %. To ukázalo, že technologie vyvážila rychlost se schopností tolerovat proměnlivé vizuální projevy související s chováním při kousnutí.
Druhá fáze vykazovala střední výkon v detekci zákusu, dosahující v průměru 79% přesnosti, 68% zapamatování a skóre F1 ~71%. Došlo k celkovému přepočtu kousnutí, zejména během rané části jídla. Delší pojídání nebo pozdější část jídla měly tendenci být spojeny s podpočítáním kousnutí.
Mezi důvody patří rychlé kousání a falešně rostoucí detekce kousnutí. Později děti začnou ztrácet zájem o jídlo, což by mohlo vyvolat více pohybu, včetně těch, které blokují ústa, což snižuje detekci kousnutí.
Mělo vnitrotřídní korelační koeficient (ICC) 0,66 s kódováním zlatého standardu, i když videa, kde se dítě příliš pohybovalo nebo kde ruce nebo náčiní blokovaly ústa, byla méně spolehlivá. Přesto ByteTrack přesněji odráží situace ze skutečného světa, když dítě jedí, jsou přítomni další lidé (přibližně 80 % zaznamenaných jídel zahrnovalo další lidi, aby simulovali přirozené prostředí při jídle).
Je méně rušivý než jiné nositelné senzory namontované na brýlích nebo počítadlech kousnutí, které se musí zapínat a vypínat, což potenciálně narušuje přirozený tok procesu stravování. Ačkoli ByteTrack musí být spuštěn a zastaven ručně, není ještě optimalizován pro detekci záběru v reálném čase. Přesto zůstává méně rušivý a blíže naturalistickým pozorováním než nositelné systémy.
Kamery chytrých telefonů by mohly být v budoucnu použity pro přirozené nahrávání a v kombinaci s platformami, jako je ByteTrack, za předpokladu, že lze zajistit soukromí dat. Čas a úsilí ušetřené těmito technologickými aplikacemi jsou obrovské, což ukazuje na obrovskou potřebu jejich vývoje. Kromě toho eliminují zdroje lidských chyb, jako je únava, nezkušenost a nesprávná interpretace, pomocí stejných kritérií pro interpretaci všech videí. Než budou takové platformy dostupné pro použití v reálném čase, je zapotřebí další vylepšení.
Závěry
Tato pilotní studie demonstruje proveditelnost škálovatelného, automatizovaného nástroje pro detekci kousnutí v dětských jídlech.“
ByteTrack je první automatizovaný systém speciálně vyvinutý pro analýzu dětského stravovacího chování a jeho mírný úspěch je povzbudivý.
Omezení této metody byla zřejmá a je třeba navrhnout novější techniky pro zvýšení spolehlivosti v přítomnosti okluzí nebo při vysokém pohybu. Budoucí práce vyžaduje, aby byla platforma robustnější pro různé populace a v různých situacích nahrávání.



