Antropijos generalinis direktorius Dario Amodei perspėja apie „lenktynes“ suprasti AI, nes jis tampa galingesnis

Iškart pasibaigus AI veiksmo viršūnių susitikimui Paryžiuje, „Anthropic“ įkūrėjas ir generalinis direktorius Dario Amodei renginį pavadino „praleista galimybe“. Jis pridūrė, kad „didesnis dėmesys ir skubumas reikalingas kelioms temoms, atsižvelgiant į tai, kokiu tempu, kuriuo technologija progresuoja“, antradienį paskelbtame pranešime.
AI kompanija surengė į kūrėją orientuotą renginį Paryžiuje bendradarbiaudama su „French Startup Dust“, o „TechCrunch“ turėjo galimybę apklausti Amodei scenoje. Renginyje jis paaiškino savo minties liniją ir gynė trečiąjį kelią, kuris nėra nei grynas optimizmas, nei gryna kritika AI inovacijų ir valdymo temomis.
„Aš buvau neuromokslas, kur iš esmės žiūrėjau į tikras smegenis pragyvenimui. Ir dabar mes ieškome dirbtinių smegenų viduje pragyvenimui. Taigi per ateinančius kelis mėnesius mes turėsime įdomių pažangų aiškinamumo srityje – kur mes iš tikrųjų pradedame suprasti, kaip veikia modeliai “, -„ Amodei “pasakojo„ TechCrunch “.
„Bet tai tikrai lenktynės. Tai lenktynės tarp modelių galingesnių, o tai mums yra nepaprastai greita ir neįtikėtinai greita kitiems – jūs tikrai negalite sulėtėti, tiesa? … Mūsų supratimas turi neatsilikti nuo mūsų sugebėjimo kurti daiktus. Manau, kad tai vienintelis būdas “, – pridūrė jis.
Nuo pirmojo AI viršūnių susitikimo Bletchley mieste JK diskusijos apie AI valdymą tonas labai pasikeitė. Iš dalies tai lemia dabartinis geopolitinis kraštovaizdis.
„Aš nesu čia šį rytą, kad galėčiau kalbėti apie AI saugumą, kuris buvo konferencijos titulas prieš porą metų“, – antradienį AI veiksmo viršūnių susitikime sakė JAV viceprezidentas JD Vance. „Aš čia, norėdamas kalbėti apie AI galimybes“.
Įdomu tai, kad Amodei bando išvengti šio saugumo ir galimybių prieštaravimo. Tiesą sakant, jis mano, kad daugiau dėmesio skiriama saugumui yra galimybė.
„Originaliame viršūnių susitikime, JK Bletchley viršūnių susitikime, buvo daug diskusijų apie įvairios rizikos bandymus ir matavimus. Ir aš nemanau, kad šie dalykai labai sulėtino technologijas “, – antropijos renginyje sakė Amodei. „Jei ką, atlikę tokį matavimą padėjau mums geriau suprasti mūsų modelius, o tai galų gale padeda mums sukurti geresnius modelius“.
Kiekvieną kartą, kai Amodei šiek tiek pabrėžia saugumą, jis taip pat mėgsta visiems priminti, kad antropicas vis dar yra daug dėmesio skirdamas pasienio AI modelių statybai.
„Aš nenoriu nieko daryti, kad sumažinčiau pažadą. Kiekvieną dieną mes teikiame modelius, į kuriuos žmonės gali remtis, ir kurie yra naudojami daryti nuostabius dalykus. Ir mes tikrai neturėtume nustoti to daryti “, – sakė jis.
„Kai žmonės daug kalba apie riziką, aš tarsi susierzinau ir sakau:„ O, žmogau, niekas iš tikrųjų nepadarė gero darbo, kad iš tikrųjų išdėstytų, kokia puiki ši technologija gali būti “, – vėliau pridūrė jis. Pokalbis.
„Deepseek“ mokymo išlaidos yra „tiesiog tikslios“
Kai pokalbis perėjo į naujausius Kinijos LLM gamintojo „Deepseek“ modelius, Amodei sumenkino techninius pasiekimus ir teigė, kad jaučia, jog visuomenės reakcija yra „neorganinė“.
„Sąžiningai, mano reakcija buvo labai mažai. Mes matėme V3, kuris yra pagrindinis „Deepseek R1“ modelis, gruodžio mėn. Ir tai buvo įspūdingas modelis “, – sakė jis. „Gruodžio mėn. Išleistas modelis buvo toks labai įprastas išlaidų mažinimo kreivės, kurią matėme savo modeliuose ir kituose modeliuose“.
Pažymėtina, kad modelis nebuvo išeitas iš „trijų ar keturių pasienio laboratorijų“, pagrįstų JAV, jis išvardijo „Google“, „Openai“ ir „Anthropic“ kaip kai kurias pasienio laboratorijas, kurios paprastai voką stumia naujų modelių leidimais.
„Ir tai man buvo geopolitinio rūpesčio klausimas. Niekada nenorėjau, kad autoritarinės vyriausybės dominuotų šioje technologijoje “, – sakė jis.
Kalbant apie tariamas „Deepseek“ mokymo išlaidas, jis atmetė mintį, kad „Deepseek V3“ mokymas buvo 100 kartų pigesnis, palyginti su JAV mokymo išlaidomis, „manau (IT) tiesiog nėra tikslus ir nėra pagrįstas faktais“, – sakė jis.
Būsimi Claude'o modeliai su samprotavimais
Nors „Amodei“ trečiadienio renginyje nepaskelbė jokio naujo modelio, jis erzino kai kuriuos būsimus bendrovės leidimus – ir taip, tai apima kai kuriuos samprotavimo galimybes.
„Mes paprastai orientuojamės į tai, kad bandytume patys imtis samprotavimo modelių, kurie būtų geriau diferencijuoti. Mes nerimaujame dėl to, kad turime pakankamai pajėgumų, kad modeliai taptų protingesni, ir nerimaujame dėl saugumo dalykų “, – teigė Amodei.
Viena iš klausimų, kuriuos bando išspręsti „Anthropic“, yra modelio atrankos conundrum. Pavyzdžiui, jei turite „ChatGpt Plus“ paskyrą, gali būti sunku žinoti, kurį modelį turėtumėte pasirinkti modelio pasirinkimo iššokančiame iššokančiame lange kitam pranešimui.

Tas pats pasakytina apie kūrėjus, naudojančius didelio kalbos modelio (LLM) API savo programoms. Jie nori subalansuoti reikalus tarp tikslumo, atsakymų greičio ir išlaidų.
„Mus šiek tiek suglumino mintis, kad yra įprastų modelių, yra samprotavimo modelių ir kad jie yra tarsi skirtingi vienas nuo kito“, – teigė Amodei. „Jei aš kalbu su jumis, jūs neturite dviejų smegenų ir vienas iš jų reaguoja iškart ir, kaip, patinka, kitas laukia ilgesnio laiko“.
Anot jo, atsižvelgiant į įvestį, turėtų būti sklandesnis perėjimas tarp iš anksto apmokytų modelių, tokių kaip Claude 3.5 sonetas ar GPT-4o, ir modeliai, mokomi mokantis armatūros, ir kurie gali gaminti momentų grandinę (COT), pavyzdžiui, „Openai“ O1 arba „Deepseek's R1“.
„Mes manome, kad tai turėtų egzistuoti kaip vieno ištisinio subjekto dalis. Ir mes dar ne ten, bet Antropikas tikrai nori judėti ta linkme “, – teigė Amodei. „Turėtume sklandžiau pereiti nuo to į iš anksto apmokytus modelius, o ne„ štai dalykas a ir štai dalykas B “,-pridūrė jis.
Kadangi didelės AI kompanijos, tokios kaip „Anthropic“, ir toliau išleidžia geresnius modelius, Amodei mano, kad tai atvers puikias galimybes sutrikdyti didelius pasaulio verslo įmones kiekvienoje pramonėje.
„Mes bendradarbiaujame su kai kuriomis farmacijos kompanijomis, kad galėtumėte naudoti Claude rašyti klinikinius tyrimus, ir jie sugebėjo sutrumpinti laiką, reikalingą rašyti klinikinių tyrimų ataskaitą nuo 12 savaičių iki trijų dienų“, – teigė Amodei.
„Be biomedicinos, yra teisinis, finansinis, draudimas, produktyvumas, programinė įranga, energija. Manau, kad iš esmės bus – žlugdančių naujovių renesansas AI taikymo erdvėje. Ir mes norime padėti, norime visa tai palaikyti “, – padarė išvadą jis.
Perskaitykite visą mūsų dirbtinio žvalgybos veiksmo viršūnių susitikimą Paryžiuje.