6 月 2 日消息,據(jù)外媒 The Decoder 1 日?qǐng)?bào)道,Palisade Research 最近舉辦的一系列網(wǎng)絡(luò)安全競(jìng)賽表明,AI 智能體已具備與人類黑客正面較量的能力,甚至在部分場(chǎng)合中勝出。
研究團(tuán)隊(duì)在兩場(chǎng)大規(guī)模的 " 奪旗賽 "(CTF)中對(duì) AI 系統(tǒng)進(jìn)行了實(shí)戰(zhàn)測(cè)試,數(shù)千名選手參與角逐。在這類比賽中,參賽隊(duì)伍需通過破解加密、識(shí)別漏洞等方式解決安全難題,找到隱藏的 " 旗幟 "。
測(cè)試的目的是檢驗(yàn) AI 智能體能否與人類隊(duì)伍抗衡。結(jié)果顯示,AI 的表現(xiàn)遠(yuǎn)超預(yù)期,大多數(shù)參賽 AI 都超過了人類選手的平均水平。
參賽的 AI 系統(tǒng)復(fù)雜程度各不相同。有的團(tuán)隊(duì)如 CAI 花費(fèi)約 500 小時(shí)打造專屬系統(tǒng),也有像 Imperturbable 團(tuán)隊(duì)僅花 17 小時(shí)就通過優(yōu)化現(xiàn)有模型 EnIGMA 和 Claude Code 的提示詞參賽。
在首場(chǎng)名為 "AI vs. Humans" 的比賽中,六支 AI 團(tuán)隊(duì)與約 150 支人類隊(duì)伍展開比拼。所有選手需在 48 小時(shí)內(nèi)完成 20 道密碼學(xué)與逆向工程題目。
七個(gè)參賽 AI 中有四個(gè)成功破解了其中 19 道題。排名最高的 AI 團(tuán)隊(duì)位列總榜前 5%,整體表現(xiàn)優(yōu)于大多數(shù)人類選手。比賽題目均可在本地運(yùn)行,降低了 AI 的技術(shù)門檻。
盡管如此,部分經(jīng)驗(yàn)豐富的人類選手依舊不落下風(fēng)。有選手指出,自己曾參加多支國(guó)際強(qiáng)隊(duì),豐富的 CTF 實(shí)戰(zhàn)經(jīng)驗(yàn)和對(duì)常用解題策略的熟悉,是他們保持競(jìng)爭(zhēng)力的關(guān)鍵。
第二場(chǎng) "Cyber Apocalypse" 則難度大幅升級(jí)。AI 智能體需面對(duì)全新題型,并與近 18000 名人類玩家同臺(tái)競(jìng)技。62 項(xiàng)任務(wù)中,不少要求與外部服務(wù)器進(jìn)行交互,對(duì)主要依賴本地計(jì)算的 AI 系統(tǒng)提出挑戰(zhàn)。
從報(bào)道中獲悉,本場(chǎng)共有四個(gè) AI 智能體參賽,其中 CAI 表現(xiàn)最佳,完成了 20 項(xiàng)任務(wù),排名第 859 位,位列全部參賽隊(duì)伍前 10%、活躍隊(duì)伍前 21%。Palisade Research 表示,該 AI 系統(tǒng)的表現(xiàn)超過了約 90% 的人類團(tuán)隊(duì)。
研究人員還分析了 AI 所破解題目的難度。以人類頂尖隊(duì)伍解題所需時(shí)間為參考,發(fā)現(xiàn) AI 有 50% 成功率解出人類高手也需約 78 分鐘才能破解的題目。換言之,AI 已具備解決高難度問題的能力。