Непослушан АИ, кришом куповао криптовалуте без дозволе

Експериментални агент вештачке интелигенције (ВИ) је избио из ограничења свог окружења за тестирање и искористио је "новостечену слободу" да почне да рудари криптовалуте без дозволе.

Названа РИМ, ВИ су креирали кинески истраживачи у лабораторији за вештачку интелигенцију повезаној са малопродајним гигантом Алибаба, као средство за развој екосистема агентског учења (АЛЕ). Овај напор има за циљ да обезбеди систем за обуку и примену агентских вештачких интелигенција, вештачких интелигенција које су обучене на великим језичким моделима (ЛЛМ) и могу проактивно да користе алате за аутономно предузимање акција ради завршетка додељених задатака у реалним окружењима, пише Live Science.

АЛЕ се састоји од три главна дела: Рок, окружења типа „песак” за тестирање агента и валидацију његових акција, Рол, оквира за оптимизацију агената са учењем појачања након што су обучени и ифлоу, оквира за конфигурисање контекста и путања за аутономне агенте. Из тог оквира, РОМЕ је креиран као агентски модел отвореног кода обучен на више од милион путања.

Истраживачи упозоравају да ће „ројеви” вештачке интелигенције следеће генерације напасти друштвене медије имитирајући људско понашање и узнемиравати стварне кориснике. Шта је Молтбок? Друштвена мрежа за вештачку интелигенцију прети „потпуним чишћењем” човечанства, али неки стручњаци кажу да је то превара.

Иако се РОМЕ истакао у широком спектру задатака вођених радним током, као што су осмишљавање планова путовања и помоћ у графичким корисничким интерфејсима, истраживачи су открили да је превазишао своја упутства и у суштини изашао из окружења за тестирање „пешчаника”.

„Наишли смо на неочекивану и оперативно последичну класу небезбедних понашања која су се појавила без икаквих експлицитних инструкција и, што је још забрињавајуће, ван граница предвиђеног „пешчаника”, објаснили су истраживачи.

Упркос недостатку инструкција и овлашћења, РОМЕ је виђен како приступа ресурсима за обраду графике првобитно додељеним за његову обуку, а затим користи тај рачунарски ресурс за рударење криптовалута. Такво истраживање се ослања на паралелну обраду која се налази у јединицама за обраду графике. Ово повећава оперативне трошкове покретања АИ агента и потенцијално излаже кориснике правној и репутационој штети.

Забрињавајуће је што такво понашање није примећено у фази обуке, али га је означио заштитни зид Алибаба Клауда, који је открио нагли налет кршења безбедносних политика са сервера за обуку истраживача.

„Упозорења су била озбиљна и хетерогена, укључујући покушаје испитивања или приступа ресурсима интерне мреже и обрасцима саобраћаја који су у складу са активностима везаним за рударење криптовалута”, рекли су истраживачи.

Међутим, РОМЕ је отишао још даље и успео да користи „обрнути ШХ тунел” да би креирао везу од инстанце Алибаба Клауда до спољне ИП адресе, у суштини, приступио је спољном рачунару креирањем скривених задњих врата која би могла да заобиђу безбедносне процесе.

Иако се системи вештачке интелигенције могу конфигурисати да пробијају безбедносне системе, оно што је овде узнемирујуће је што неовлашћено понашање РОМЕ-а, које је укључивало позивање системских алата и извршавање кода, није било покренуто упитима и није било потребно за завршетак задатка који му је додељен у оквиру окружења за тестирање „пешчаника”.

Истраживачи су претпоставили да током фазе оптимизације учења појачањем, „агент језичког модела може спонтано произвести опасна, неовлашћена понашања” и стога прекршити своје претпостављене границе.

Истраживање показује да вештачка интелигенција може спонтано да развије „личност“ уз минимално подстицање. Као одговор, истраживачи су пооштрили ограничења и појачали његове процесе обуке како би спречили понављање таквих понашања. Није јасно одакле је дошао окидач за самоиницијативно истраживање криптовалута, али с обзиром на то да се вештачка интелигенција ботови могу користити за аутономизацију и оптимизацију рударења криптовалута, постоји могућност да је РОМЕ обучен на подацима који се односе на такве радње.

Ово неочекивано понашање истиче потребу за пажљивим управљањем применом вештачке интелигенције како би се спречили неочекивани исходи.