Žmonės naudoja AI muzikos generatorius kurdami neapykantą keliančias dainas
Piktybiški veikėjai piktnaudžiauja generatyviais AI muzikos įrankiais kurdami homofobines, rasistines ir propagandines dainas ir skelbia vadovus, mokančius kitiems, kaip tai padaryti.
Pasak „ActiveFence“, paslaugos, valdančios pasitikėjimo ir saugos operacijas internetinėse platformose, nuo kovo mėnesio „neapykantą kurstančiose“ bendruomenėse smarkiai paplito pokalbiai apie būdus, kaip netinkamai panaudoti AI muzikos kūrimo įrankius rašant įžeidžiančias dainas, skirtas mažumų grupėms. Dirbtinio intelekto sukurtomis dainomis, kuriomis dalijamasi šiuose forumuose ir diskusijų lentose, siekiama kurstyti neapykantą etninėms, lyčių, rasinėms ir religinėms grupėms, teigia „ActiveFence“ tyrėjai savo ataskaitoje, kartu švenčiant kankinystės, savęs žalojimo ir terorizmo aktus.
Neapykantos ir žalingos dainos vargu ar yra naujas reiškinys. Tačiau baiminamasi, kad atsiradus lengvai naudojamiems nemokamiems muzikos kūrimo įrankiams, juos dideliu mastu gamins žmonės, kurie anksčiau neturėjo priemonių ar žinių – kaip ir vaizdo, balso, vaizdo įrašų. ir tekstų generatoriai paspartino dezinformacijos, dezinformacijos ir neapykantos kurstymo kurstymą.
„Tai yra tendencijos, kurios stiprėja, nes vis daugiau vartotojų mokosi kurti šias dainas ir dalintis jomis su kitais“, – „TechCrunch“ sakė „ActiveFence“ atstovas. „Grėsmės dalyviai greitai nustato konkrečius pažeidžiamumus, kad galėtų įvairiais būdais piktnaudžiauti šiomis platformomis ir generuoti kenkėjišką turinį.
Kurti „neapykantos“ dainas
Generatyvūs AI muzikos įrankiai, pvz., „Udio“ ir „Suno“, leidžia vartotojams pridėti tinkintus tekstus prie sukurtų dainų. Apsaugos priemonės platformose išfiltruoja įprastus užgauliojimus ir menkinimus, tačiau, pasak „ActiveFence“, vartotojai išsiaiškino sprendimus.
Viename ataskaitoje paminėtame pavyzdyje baltųjų viršenybės šalininkų forumų naudotojai dalijosi fonetine mažumų rašyba ir įžeidžiančiais terminais, pvz., „jooz“ vietoj „žydai“ ir „sakyk tan“ vietoj „šėtonas“, kuriuos jie naudodavo apeiti turinio filtrus. . Kai kurie naudotojai siūlė keisti tarpus ir rašybą, kai kalbama apie smurtinius veiksmus, pvz., „mano išžaginimas“ pakeisti į „pelkinė beždžionė“.
„TechCrunch“ išbandė kelis iš šių sprendimų „Udio“ ir „Suno“ – dviejuose populiariausiuose įrankiuose, skirtuose dirbtinio intelekto sukurtai muzikai kurti ir dalytis. Suno juos visus išleido, o Udio užblokavo kai kuriuos – bet ne visus – įžeidžiančius homofonus.
El. paštu „Udio“ atstovas „TechCrunch“ pasakė, kad bendrovė draudžia naudoti savo platformą neapykantos kurstymui. Suno neatsakė į mūsų prašymą pakomentuoti.
Bendruomenėse, kurias apžiūrėjo, „ActiveFence“ rado nuorodas į dirbtinio intelekto sukurtas dainas, kuriose papūgaujama sąmokslo teorijos apie žydus ir pasisakoma už jų masines žudynes; dainos, kuriose yra šūkių, susijusių su teroristinėmis grupuotėmis ISIS ir Al-Qaeda; ir dainos, šlovinančios seksualinį smurtą prieš moteris.
Dainos poveikis
„ActiveFence“ teigia, kad dainos – priešingai, tarkime, tekstas – turi emocinį įspūdį, todėl jos yra ypač stipri neapykantos grupių ir politinio karo jėga. Įmonė atkreipia dėmesį į „Rock Against Communism“ – baltojo jėgos roko koncertų seriją JK 7-ojo dešimtmečio pabaigoje ir devintojo dešimtmečio pradžioje, iš kurių atsirado antisemitinės ir rasistinės „neapykantos“ muzikos porūšiai.
„AI daro žalingą turinį patrauklesnį – pagalvokite apie ką nors pamokslaujantį žalingą pasakojimą apie tam tikrą populiaciją, o tada įsivaizduokite, kad kažkas sukuria rimuotą dainą, kurią kiekvienas gali lengvai dainuoti ir prisiminti“, – sakė „ActiveFence“ atstovas. „Jie stiprina grupės solidarumą, indoktrinuoja periferinių grupių narius, taip pat yra naudojami šokiruoti ir įžeisti nesusijusius interneto vartotojus.
„ActiveFence“ ragina muzikos generavimo platformas įdiegti prevencijos priemones ir atlikti išsamesnius saugos vertinimus. „Raudonoji komanda gali atskleisti kai kuriuos iš šių pažeidžiamumų ir tai gali būti padaryta imituojant grėsmės veikėjų elgesį“, – sakė atstovas. „Šiuo atveju taip pat gali būti naudingas geresnis įvesties ir išvesties moderavimas, nes tai leis platformoms blokuoti turinį prieš dalijantis juo su vartotoju.”
Tačiau pataisymai gali pasirodyti trumpalaikiai, nes vartotojai atskleidžia naujus moderavimo nugalėjimo metodus. Pavyzdžiui, kai kurios dirbtinio intelekto sukurtos teroristinės propagandos dainos, kurias nustatė „ActiveFence“, buvo sukurtos naudojant arabų kalbos eufemizmus ir transliteracijas – eufemizmų, kurių muzikos generatoriai neaptiko, tikriausiai todėl, kad jų filtrai arabų kalba nėra stiprūs.
Dirbtinio intelekto sukurta neapykantos kupina muzika gali pasklisti toli ir plačiai, jei ji seka kitų dirbtinio intelekto sukurtų medijų pėdomis. „Wired“ anksčiau šiais metais dokumentavo, kaip dirbtiniu intelektu manipuliuotas Adolfo Hitlerio klipas surinko daugiau nei 15 milijonų X peržiūrų po to, kai juo pasidalijo kraštutinių dešiniųjų sąmokslo influenceris.
Be kitų ekspertų, JT patariamoji institucija išreiškė susirūpinimą, kad rasistinis, antisemitinis, islamofobinis ir ksenofobinis turinys gali būti padidintas generatyvaus AI.
„Generatyvios dirbtinio intelekto paslaugos leidžia vartotojams, kuriems trūksta išteklių ar kūrybinių ir techninių įgūdžių, kurti patrauklų turinį ir skleisti idėjas, kurios gali konkuruoti dėl dėmesio pasaulinėje idėjų rinkoje“, – sakė atstovas. „Ir grėsmės veikėjai, atradę šių naujų paslaugų siūlomą kūrybinį potencialą, stengiasi apeiti nuosaikumą ir išvengti aptikimo – ir jiems pasisekė.