Kodėl „Apple“ taiko mažo modelio požiūrį į generatyvųjį AI
Vienas didžiausių klausimų, susijusių su modeliais, tokiais kaip „ChatGPT“, „Dvyniai“ ir „Midjourney“ nuo pat pristatymo, yra tai, kokį vaidmenį (jei yra) jie atliks mūsų kasdieniame gyvenime. Tai yra kažkas, ką „Apple“ siekia atsakyti savo požiūriu į kategoriją „Apple Intelligence“, kuri buvo oficialiai pristatyta šią savaitę WWDC 2024.
Pirmadienio pristatyme bendrovė pirmavo su žaibiškumu; kaip tik taip veikia pagrindinės pastabos. Kai vyriausiasis viceprezidentas Craigas Federighis nešokinėjo parašiutu ar nežaidė parkūro, naudodamas Holivudo (na, Cupertino) magiją, „Apple“ buvo pasiryžęs parodyti, kad jos vidiniai modeliai yra tokie pat pajėgūs kaip ir konkurentų.
Žiuri vis dar nesprendžia šio klausimo, o beta versijos sumažėjo tik pirmadienį, tačiau nuo to laiko bendrovė atskleidė kai kuriuos dalykus, dėl kurių jos požiūris į generatyvųjį AI skiriasi. Pirmiausia ir svarbiausia yra apimtis. Daugelis žinomiausių šios srities įmonių labiau žiūri į savo modelius. Šių sistemų tikslas – tarnauti kaip vieno langelio principo prie pasaulio informacijos.
Kita vertus, „Apple“ požiūris į kategoriją yra pagrįstas kažkuo pragmatiškesniu. „Apple Intelligence“ yra labiau pritaikytas požiūris į generatyvųjį dirbtinį intelektą, sukurtas naudojant skirtingas įmonės operacines sistemas. Tai labai „Apple“ požiūris ta prasme, kad pirmenybė teikiama be trikdžių naudotojo patirčiai.
„Apple Intelligence“ tam tikra prasme yra prekės ženklo kūrimo pratimas, tačiau kitu atveju bendrovė teikia pirmenybę generatyviems AI aspektams, kad galėtų sklandžiai įsilieti į operacinę sistemą. Tai visiškai gerai – ar net pageidautina – jei vartotojas neturi supratimo apie pagrindines technologijas, kurios maitina šias sistemas. Taip visada veikė „Apple“ produktai.
Kad modeliai būtų maži
Svarbiausia yra sukurti mažesnius modelius: mokyti sistemas pagal pritaikytą duomenų rinkinį, sukurtą specialiai operacinių sistemų naudotojams reikalingoms funkcijoms. Kol kas neaišku, kiek šių modelių dydis paveiks juodosios dėžės problemą, tačiau „Apple“ mano, kad bent jau daugiau konkrečios temos modelių padidins skaidrumą, kodėl sistema priima konkrečius sprendimus.
Dėl santykinai riboto šių modelių pobūdžio „Apple“ nesitiki, kad bus didžiulė įvairovė ragindama sistemą, tarkime, apibendrinti tekstą. Tačiau galiausiai svyravimas nuo raginimo iki raginimo priklauso nuo apibendrinamo teksto ilgio. Operacinėse sistemose taip pat yra grįžtamojo ryšio mechanizmas, į kurį vartotojai gali pranešti apie generacinės AI sistemos problemas.
Nors „Apple Intelligence“ yra daug labiau orientuota nei didesni modeliai, ji gali apimti daugybę užklausų, nes yra „adapteriai“, kurie yra skirti įvairioms užduotims ir stiliams. Tačiau apskritai „Apple“ nėra „didesnis, tuo geresnis“ metodas kuriant modelius, nes reikia atsižvelgti į tokius dalykus kaip dydis, greitis ir skaičiavimo galia, ypač kai kalbama apie įrenginiuose esančius modelius.
ChatGPT, Dvyniai ir kiti
Atsivertimas trečiųjų šalių modeliams, pvz., „OpenAI ChatGPT“, yra prasmingas, atsižvelgiant į ribotą „Apple“ modelių dėmesį. Bendrovė apmokė savo sistemas specialiai „MacOS“ / „iOS“ patirčiai, todėl bus daug informacijos, kuri nepatenka į jos taikymo sritį. Tais atvejais, kai sistema mano, kad trečiosios šalies programa būtų tinkamesnė atsakymui pateikti, sistemos raginimas paklaus, ar norite bendrinti tą informaciją išorėje. Jei tokio raginimo negaunate, užklausa apdorojama naudojant „Apple“ vidinius modelius.
Tai turėtų veikti taip pat su visais išoriniais „Apple“ partnerių modeliais, įskaitant „Google Gemini“. Tai vienas iš retų atvejų, kai sistema atkreips dėmesį į generatyvaus AI naudojimą tokiu būdu. Iš dalies toks sprendimas buvo priimtas siekiant panaikinti bet kokius susirūpinimą dėl privatumo. Kiekviena įmonė turi skirtingus vartotojų duomenų rinkimo ir mokymo standartus.
Reikalavimas, kad vartotojai kiekvieną kartą prisijungtų, „Apple“ neteks tam tikros pareigos, net jei tai padidina proceso trintį. Taip pat galite atsisakyti naudoti trečiųjų šalių platformas visoje sistemoje, tačiau tai apribotų operacinės sistemos / „Siri“ galimų pasiekti duomenų kiekį. Tačiau negalite vienu ypu atsisakyti „Apple Intelligence“. Vietoj to turėsite tai padaryti pagal funkciją.
Privatus debesų skaičiavimas
Kita vertus, nebus aišku, ar sistema apdoroja konkrečią užklausą įrenginyje, ar per nuotolinį serverį su „Private Cloud Compute“. „Apple“ filosofija yra tokia, kad toks atskleidimas nėra būtinas, nes ji savo serveriams laikosi tų pačių privatumo standartų, kaip ir įrenginiai, iki pirmosios šalies silicio, kuriame jie veikia.
Vienas iš būdų tiksliai žinoti, ar užklausa tvarkoma įrenginyje, ar ne, yra atjungti įrenginį nuo interneto. Jei problemai išspręsti reikia debesies kompiuterijos, bet įrenginys neranda tinklo, jis parodys klaidą, nurodydamas, kad negali atlikti prašomo veiksmo.
„Apple“ išskaido specifiką, kurioms veiksmams reikės apdorojimo debesyje pagrįsto apdorojimo. Čia veikia keli veiksniai, o nuolat kintantis šios sistemos pobūdis reiškia, kad šiandien gali prireikti debesų kompiuterijos, rytoj gali būti atlikta įrenginyje. Skaičiavimas įrenginyje ne visada bus greitesnis pasirinkimas, nes greitis yra vienas iš Apple Intelligence parametrų, į kuriuos atsižvelgiama nustatant, kur apdoroti raginimą.
Tačiau yra tam tikrų operacijų, kurios visada bus atliekamos įrenginyje. Ryškiausias iš jų yra „Image Playground“, nes visas sklaidos modelis saugomas vietoje. „Apple“ patobulino modelį, kad jis generuotų trijų skirtingų namų stilių vaizdus: animaciją, iliustraciją ir eskizą. Animacijos stilius šiek tiek panašus į kitos Steve'o Jobso įkurtos įmonės namų stilių. Panašiai šiuo metu teksto generavimas yra trijų stilių: draugiškas, profesionalus ir glaustas.
Net ir šioje ankstyvoje beta versijos stadijoje „Image Playground“ karta yra įspūdingai greita, dažnai užtrunka vos kelias sekundes. Kalbant apie įtraukimo klausimą kuriant žmonių atvaizdus, sistema reikalauja įvesti specifiką, o ne tiesiog spėlioti tokius dalykus kaip etninė priklausomybė.
Kaip „Apple“ tvarkys duomenų rinkinius
„Apple“ modeliai mokomi naudoti licencijuotų duomenų rinkinių ir tikrinant viešai prieinamą informaciją. Pastarasis pasiekiamas naudojant AppleBot. Bendrovės žiniatinklio tikrinimo programa veikia jau kurį laiką, teikianti kontekstinius duomenis tokioms programoms kaip „Spotlight“, „Siri“ ir „Safari“. Tikrinimo programa turi leidėjams skirtą atsisakymo funkciją.
„Naudodami Applebot-Extended“, pažymi „Apple“, „žiniatinklio leidėjai gali pasirinkti atsisakyti, kad jų svetainių turinys būtų naudojamas apmokyti Apple pagrindinius modelius, teikiančius generatyvias AI funkcijas visuose Apple produktuose, įskaitant Apple Intelligence, paslaugas ir kūrėjo įrankius.
Tai pasiekiama įtraukus raginimą į svetainės kodą. Atsiradus „Apple Intelligence“, bendrovė pristatė antrą raginimą, kuris leidžia svetaines įtraukti į paieškos rezultatus, bet neįtraukti į generatyvų AI modelių mokymą.
Atsakingas AI
Pirmąją WWDC dieną „Apple“ išleido informacinį dokumentą „Pristatome Apple įrenginio ir serverio pagrindo modelius“. Be kita ko, jame pabrėžiami principai, reglamentuojantys bendrovės AI modelius. Visų pirma, „Apple“ pabrėžia keturis dalykus:
- „Suteikite naudotojams išmaniuosius įrankius: nustatome sritis, kuriose dirbtinis intelektas gali būti naudojamas atsakingai kuriant įrankius, skirtus konkretiems vartotojų poreikiams patenkinti. Mes gerbiame tai, kaip mūsų vartotojai pasirenka naudoti šiuos įrankius savo tikslams pasiekti.
- „Atstovaukite savo vartotojus: kuriame labai asmeniškus produktus, siekdami autentiškai atstovauti naudotojams visame pasaulyje. Mes nuolat dirbame, kad išvengtume stereotipų ir sisteminio šališkumo mūsų AI įrankiuose ir modeliuose.
- „Projektuokite atsargiai: mes imamės atsargumo priemonių kiekviename proceso etape, įskaitant projektavimą, modelių mokymą, funkcijų kūrimą ir kokybės vertinimą, kad nustatytų, kaip mūsų AI įrankiai gali būti netinkamai naudojami arba gali sukelti žalą. Remdamiesi vartotojų atsiliepimais, nuolat ir aktyviai tobulinsime savo AI įrankius.
- „Apsaugokite privatumą: saugome savo vartotojų privatumą naudodami galingą apdorojimą įrenginyje ir novatorišką infrastruktūrą, pvz., „Private Cloud Compute“. Mes nenaudojame savo vartotojų privačių asmeninių duomenų ar naudotojų sąveikos, kai mokome savo pagrindų modelius.
„Apple“ pritaikytas požiūris į pagrindinius modelius leidžia sistemą pritaikyti konkrečiai vartotojo patirčiai. Bendrovė šį UX principą taikė nuo pat pirmojo „Mac“ pasirodymo. Suteikus kuo lengvesnę patirtį, naudinga vartotojui, tačiau tai neturėtų būti daroma privatumo sąskaita.
Tai bus sudėtinga balansavimo programa, kurią įmonei teks naršyti, nes dabartinis OS beta versijų skaičius pasieks bendrą prieinamumą šiais metais. Idealus būdas yra pasiūlyti tiek informacijos, kiek to reikalauja galutinis vartotojas. Tikrai bus daug žmonių, kuriems nerūpi, tarkime, ar užklausa vykdoma kompiuteryje, ar debesyje. Jie patenkinti, kad pagal numatytuosius nustatymus sistema yra tiksliausia ir efektyviausia.
Privatumo gynėjams ir kitiems, kurie domisi ta specifika, „Apple“ turėtų siekti kuo didesnio naudotojų skaidrumo – jau nekalbant apie skaidrumą leidėjams, kurie galbūt nenorėtų, kad jų turinys būtų naudojamas šiems modeliams mokyti. Yra tam tikrų aspektų, dėl kurių juodosios dėžės problema šiuo metu neišvengiama, tačiau tais atvejais, kai galima pasiūlyti skaidrumą, jis turėtų būti prieinamas vartotojams paprašius.