„Coval“ vertina AI balso ir pokalbių agentus, pavyzdžiui, savarankiškai važiuojančius automobilius

Kas bendro tarp AI balso agentų ir savarankiškai važiuojančių automobilių? Jų veiklą galima vertinti taip pat, teigia Brooke Hopkins, buvęs Waymo technologijų vadovas. Coval, naujasis Hopkinso startuolis, atrodo, kad tai daro.
„Kai palikau Waymo, supratau, kad daugelis šių problemų, su kuriomis susidūrėme Waymo, buvo būtent tai, su kuo susidūrė likusi AI pramonės dalis“, – „TechCrunch“ pasakojo Hopkinsas (pavaizduotas aukščiau centre). „Tačiau visi sakė, kad tai yra nauja paradigma, mes turime sugalvoti testavimo praktiką iš pirmųjų principų ir kad iš esmės visi turime viską atkurti. Aš pažiūrėjau į tai ir pasakiau: palaukite, pastaruosius 10 metų praleidome savarankiškai vairuodami, sugalvodami, kaip tai padaryti.
2024 m. ji nusprendė paleisti „Coval“ – platformą, kuri kuria AI balso ir pokalbių agentų modeliavimus, kurie tikrina ir įvertina, kaip jie atlieka užduotis taip pat, kaip Hopkinsas išbandė savarankiškai vairuojančius automobilius „Waymo“. „Coval“ vienu metu gali atlikti tūkstančius modeliavimų, pavyzdžiui, priversti agentą rezervuoti restoraną arba agentui atsakyti į klientų aptarnavimo klausimą netiesioginiu būdu.
„Coval“ technologija vertina agentus pagal bendrą metrikų rinkinį, tačiau įmonės taip pat gali pritaikyti tai, ko ieško, ir naudoti „Coval“, kad toliau vertintų regresijas. Naudotojai taip pat gali paimti šiuos duomenis ir iš jų gaunamas įžvalgas ir pateikti juos savo galutiniams klientams demonstracinei versijai arba kaip stebėjimo įrankį, kad parodytų klientams, kad agentas veikia taip, kaip numatyta.

„Vienas didžiausių kliūčių, trukdančių agentams, kuriuos priima įmonės, yra įsitikinimas, kad tai ne tik demonstracinė versija su dūmais ir veidrodžiais“, – sakė Hopkinsas. „Pardavėjų pasirinkimas šiems vadovams yra tikrai sudėtinga užduotis, nes tiesiog labai sunku žinoti, ko jūs net klausiate arba kaip įrodyti, kad šie agentai daro tai, ko tikitės. Taigi tai suteikia mūsų įmonėms galimybę iš tikrųjų tai parodyti ir parodyti.
Hopkins iš tikrųjų suformulavo „Coval“ idėją per „Y Combinator Summer 2024“ partiją, prieš pristatydamas produktą viešai 2024 m. spalį. Ji teigė, kad paklausa buvo didelė ir per pastaruosius du mėnesius išaugo, o klientai klausė, kaip greitai jie gali gauti savo agentus. įvertinti.
San Franciske įsikūręs startuolis dabar skelbia 3,3 mln. USD pradinį etapą, kuriam vadovauja „MaC Venture Capital“, kuriame dalyvauja „Y Combinator“ ir „General Catalyst“. Startuolis panaudos kapitalą savo inžinierių komandai sukurti ir siekti, kad produktas atitiktų rinką. Hopkinsas pridūrė, kad bendrovė taip pat sieks, kad ateityje jos vartotojai galėtų įvertinti kitų tipų AI agentus, pavyzdžiui, žiniatinklio agentus.
„Coval“ pasirodo scenoje, o tiek impulsas, tiek ažiotažas, susijęs su AI agentais, atrodo aukščiausias. Įmonių technologijų lyderiai, tokie kaip Marcas Benioffas, gyrė (ir parduoda) šią technologiją sakydami, kad iki kitų metų „Salesforce“ paskirs daugiau nei milijardą savo AI agentų. Sklando gandai, kad OpenAI labai greitai išleis savo požiūrį į AI agentą.
Šioje erdvėje taip pat kuriasi daug startuolių. Vien trijose „Y Combinator“ 2024 m. grupėse buvo daugiau nei 100 naujų įmonių, kuriančių dirbtinio intelekto agentus. Kai kurios DI agentų įmonės taip pat pasiekė nemažus rizikos finansavimo etapus. Vienas, /dev/agents, 2024 m. lapkritį, praėjus mažiau nei metams nuo jo įkūrimo, surinko 55 mln.
Šis pagreitis reiškia, kad tikėtina, kad atsiras daugiau įmonių, kurios ieškos pagalbos, kad galėtų įvertinti ir savo agentus. Hopkinsas sakė, kad Coval turi gerą galimybę išsiskirti iš grupės, nes, skirtingai nei neišvengiami nauji dalyviai, Coval turi pranašumą.
„Manau, kad mes tikrai išsiskiriame tuo, kad šioje erdvėje dirbu pusę dešimtmečio ir nuolat kūriau šias sistemas“, – sakė ji. „Sukūrėme daugybę iteracijų ir matėme, kaip jos žlunga ir kaip jos keičiasi, ir mes kuriame tas pačias koncepcijas į Coval ir visus tuos mokymus.