Generatyvusis AI priartina robotus prie bendros paskirties

MIT-Policy-Comp-01-press.jpg


Dauguma humanoidinių robotų aprėpties, suprantama, buvo sutelktos į aparatinės įrangos dizainą. Atsižvelgiant į tai, kaip dažnai jų kūrėjai išmeta frazę „bendrosios paskirties humanoidai“, daugiau dėmesio reikėtų skirti pirmajai daliai. Po dešimtmečių vienos paskirties sistemų perėjimas prie labiau apibendrintų sistemų bus didelis žingsnis. Mes tiesiog dar nesame.

Stengimasis sukurti robotų intelektą, galintį visiškai išnaudoti platų judesių spektrą, kurį atveria dvikojų humanoidų dizainas, buvo pagrindinė mokslininkų tema. Generatyvinio AI naudojimas robotikoje pastaruoju metu taip pat buvo itin aktualus tema. Nauji MIT tyrimai rodo, kaip pastarasis gali labai paveikti pirmąjį.

Vienas didžiausių iššūkių kelyje į bendros paskirties sistemas yra mokymas. Turime tvirtą supratimą apie geriausią praktiką, kaip mokyti žmones atlikti įvairius darbus. Požiūriai į robotiką, nors ir perspektyvūs, yra fragmentiški. Yra daug daug žadančių metodų, įskaitant mokymąsi sustiprinti ir imituoti, tačiau ateityje sprendimai greičiausiai apims šių metodų derinius, papildytus generatyviniais AI modeliais.

Vienas iš pagrindinių MIT komandos siūlomų naudojimo atvejų yra galimybė palyginti svarbią informaciją iš šių mažų, konkrečioms užduotims skirtų duomenų rinkinių. Metodas buvo pavadintas politikos kompozicija (PoCo). Užduotys apima naudingus roboto veiksmus, tokius kaip nagų mušimas ir daiktų vartymas mentele.

“[Researchers] mokyti atskirą sklaidos modelį, kad išmoktumėte strategiją arba politiką, kaip atlikti vieną užduotį naudojant vieną konkretų duomenų rinkinį“, – pažymi mokykla. „Tada jie sujungia difuzijos modelių išmoktas strategijas į bendrą politiką, leidžiančią robotui atlikti kelias užduotis įvairiuose nustatymuose.”

Remiantis MIT, difuzijos modelių įtraukimas pagerino užduočių atlikimą 20%. Tai apima galimybę atlikti užduotis, kurioms reikia kelių įrankių, taip pat mokymąsi / prisitaikymą prie nepažįstamų užduočių. Sistema gali sujungti svarbią informaciją iš skirtingų duomenų rinkinių į veiksmų, reikalingų užduočiai atlikti, grandinę.

„Vienas iš šio požiūrio pranašumų yra tai, kad galime derinti politikos kryptis, kad gautume geriausius iš abiejų pasaulių“, – sako pagrindinė straipsnio autorė Lirui Wang. „Pavyzdžiui, politika, parengta remiantis realaus pasaulio duomenimis, gali pasiekti daugiau miklumo, o politika, parengta modeliuoti, gali pasiekti daugiau apibendrinimų.

Šio konkretaus darbo tikslas – sukurti žvalgybos sistemas, leidžiančias robotams sukeisti skirtingus įrankius skirtingoms užduotims atlikti. Daugiafunkcinių sistemų paplitimas priartintų pramonę prie bendros paskirties svajonės.



Source link

Draugai: - Marketingo agentūra - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Miesto naujienos - Šeimos gydytojai - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai - Teniso treniruotės - Pranešimai spaudai -