Neposlušan AI, krišom kupovao kriptovalute bez dozvole

Eksperimentalni agent veštačke inteligencije (VI) je izbio iz ograničenja svog okruženja za testiranje i iskoristio je "novostečenu slobodu" da počne da rudari kriptovalute bez dozvole.

Nazvana RIM, VI su kreirali kineski istraživači u laboratoriji za veštačku inteligenciju povezanoj sa maloprodajnim gigantom Alibaba, kao sredstvo za razvoj ekosistema agentskog učenja (ALE). Ovaj napor ima za cilj da obezbedi sistem za obuku i primenu agentskih veštačkih inteligencija, veštačkih inteligencija koje su obučene na velikim jezičkim modelima (LLM) i mogu proaktivno da koriste alate za autonomno preduzimanje akcija radi završetka dodeljenih zadataka u realnim okruženjima, piše Live Science.

ALE se sastoji od tri glavna dela: Rok, okruženja tipa „pesak” za testiranje agenta i validaciju njegovih akcija, Rol, okvira za optimizaciju agenata sa učenjem pojačanja nakon što su obučeni i iflou, okvira za konfigurisanje konteksta i putanja za autonomne agente. Iz tog okvira, ROME je kreiran kao agentski model otvorenog koda obučen na više od milion putanja.

Istraživači upozoravaju da će „rojevi” veštačke inteligencije sledeće generacije napasti društvene medije imitirajući ljudsko ponašanje i uznemiravati stvarne korisnike. Šta je Moltbok? Društvena mreža za veštačku inteligenciju preti „potpunim čišćenjem” čovečanstva, ali neki stručnjaci kažu da je to prevara.

Iako se ROME istakao u širokom spektru zadataka vođenih radnim tokom, kao što su osmišljavanje planova putovanja i pomoć u grafičkim korisničkim interfejsima, istraživači su otkrili da je prevazišao svoja uputstva i u suštini izašao iz okruženja za testiranje „peščanika”.

„Naišli smo na neočekivanu i operativno posledičnu klasu nebezbednih ponašanja koja su se pojavila bez ikakvih eksplicitnih instrukcija i, što je još zabrinjavajuće, van granica predviđenog „peščanika”, objasnili su istraživači.

Uprkos nedostatku instrukcija i ovlašćenja, ROME je viđen kako pristupa resursima za obradu grafike prvobitno dodeljenim za njegovu obuku, a zatim koristi taj računarski resurs za rudarenje kriptovaluta. Takvo istraživanje se oslanja na paralelnu obradu koja se nalazi u jedinicama za obradu grafike. Ovo povećava operativne troškove pokretanja AI agenta i potencijalno izlaže korisnike pravnoj i reputacionoj šteti.

Zabrinjavajuće je što takvo ponašanje nije primećeno u fazi obuke, ali ga je označio zaštitni zid Alibaba Klauda, koji je otkrio nagli nalet kršenja bezbednosnih politika sa servera za obuku istraživača.

„Upozorenja su bila ozbiljna i heterogena, uključujući pokušaje ispitivanja ili pristupa resursima interne mreže i obrascima saobraćaja koji su u skladu sa aktivnostima vezanim za rudarenje kriptovaluta”, rekli su istraživači.

Međutim, ROME je otišao još dalje i uspeo da koristi „obrnuti ŠH tunel” da bi kreirao vezu od instance Alibaba Klauda do spoljne IP adrese, u suštini, pristupio je spoljnom računaru kreiranjem skrivenih zadnjih vrata koja bi mogla da zaobiđu bezbednosne procese.

Iako se sistemi veštačke inteligencije mogu konfigurisati da probijaju bezbednosne sisteme, ono što je ovde uznemirujuće je što neovlašćeno ponašanje ROME-a, koje je uključivalo pozivanje sistemskih alata i izvršavanje koda, nije bilo pokrenuto upitima i nije bilo potrebno za završetak zadatka koji mu je dodeljen u okviru okruženja za testiranje „peščanika”.

Istraživači su pretpostavili da tokom faze optimizacije učenja pojačanjem, „agent jezičkog modela može spontano proizvesti opasna, neovlašćena ponašanja” i stoga prekršiti svoje pretpostavljene granice.

Istraživanje pokazuje da veštačka inteligencija može spontano da razvije „ličnost“ uz minimalno podsticanje. Kao odgovor, istraživači su pooštrili ograničenja i pojačali njegove procese obuke kako bi sprečili ponavljanje takvih ponašanja. Nije jasno odakle je došao okidač za samoinicijativno istraživanje kriptovaluta, ali s obzirom na to da se veštačka inteligencija botovi mogu koristiti za autonomizaciju i optimizaciju rudarenja kriptovaluta, postoji mogućnost da je ROME obučen na podacima koji se odnose na takve radnje.

Ovo neočekivano ponašanje ističe potrebu za pažljivim upravljanjem primenom veštačke inteligencije kako bi se sprečili neočekivani ishodi.