零日漏洞利用是網(wǎng)絡(luò)安全攻擊的“核武器”,也是AI難以染指的安全研究“圣杯”。但是,安全研究人員近日發(fā)布的一篇論文顛覆了這一觀點(diǎn),在網(wǎng)絡(luò)安全圈里炸開了鍋!該論文證明大語言模型(LLM)可以高效自動(dòng)化利用(未知的)真實(shí)零日漏洞。
此前,研究表明單個(gè)AI代理獲取給定漏洞和“奪旗”任務(wù)的具體描述后,可以利用真實(shí)漏洞。然而,對(duì)于(沒有相關(guān)訓(xùn)練數(shù)據(jù)的)未知零日漏洞,這些AI代理表現(xiàn)仍然欠佳。
最新研究突破了這一瓶頸!伊利諾伊大學(xué)香檳分校的研究團(tuán)隊(duì)在其論文《用大語言模型利用零日漏洞》中,探討了大語言模型在自動(dòng)化利用網(wǎng)絡(luò)安全漏洞中的應(yīng)用,特別是零日漏洞的利用。
研究人員設(shè)計(jì)了一種由大語言模型AI代理組成的“AI團(tuán)隊(duì)”,能夠利用真實(shí)世界的零日漏洞。單個(gè)AI代理在探索大量不同漏洞和進(jìn)行長(zhǎng)期規(guī)劃方面存在瓶頸。
研究方法
為了提升AI代理在零日漏洞利用中的表現(xiàn),伊利諾伊大學(xué)的研究團(tuán)隊(duì)提出了一種新的多代理系統(tǒng)——HPTSA(分層規(guī)劃與任務(wù)特定代理系統(tǒng))。該系統(tǒng)由一個(gè)規(guī)劃代理和多個(gè)任務(wù)特定的子代理組成,通過分工合作解決復(fù)雜的網(wǎng)絡(luò)安全任務(wù)。研究方法如下:
HPTSA系統(tǒng)包括三個(gè)主要組件:
分層規(guī)劃代理:負(fù)責(zé)探索環(huán)境(如網(wǎng)站),確定需要嘗試的漏洞類型及其所在頁面。
任務(wù)特定代理的團(tuán)隊(duì)管理者:根據(jù)規(guī)劃代理的指示,選擇合適的任務(wù)特定代理執(zhí)行具體任務(wù),并處理先前執(zhí)行結(jié)果的信息。
特定任務(wù)代理:設(shè)計(jì)用于挖掘特定類型漏洞的專家代理,如SQL注入(SQLi)、跨站腳本(XSS)等。
研究團(tuán)隊(duì)還設(shè)計(jì)了六個(gè)特定任務(wù)代理,每個(gè)代理具備訪問工具、文檔和提示的能力,專門用于發(fā)現(xiàn)特定類型的漏洞。
最后,研究團(tuán)隊(duì)使用OpenAI的API、LangChain和LangGraph實(shí)現(xiàn)了HPTSA系統(tǒng),并通過GPT-4模型進(jìn)行所有實(shí)驗(yàn)。為了減少成本,他們采用了一種HTML簡(jiǎn)化策略,去除無關(guān)的HTML標(biāo)簽以降低令牌數(shù)量。
主要發(fā)現(xiàn)
研究人員構(gòu)建了15個(gè)真實(shí)漏洞的基準(zhǔn)測(cè)試,結(jié)果表明,“AI團(tuán)隊(duì)”利用零日漏洞的工作效率提升了4.5倍以上,重點(diǎn)發(fā)現(xiàn)如下:
性能提升:HPTSA系統(tǒng)在零日漏洞利用方面的表現(xiàn)顯著優(yōu)于之前的單代理系統(tǒng)。研究表明,HPTSA在五次嘗試中成功利用漏洞的概率達(dá)到53%,在一次嘗試中的成功率為33.3%,顯著高于未提供漏洞描述的GPT-4代理。
對(duì)比測(cè)試:在對(duì)比測(cè)試中,HPTSA系統(tǒng)的表現(xiàn)也明顯優(yōu)于開源的漏洞掃描器(如ZAP和MetaSploit),這些掃描器在研究收集的漏洞中未能成功利用任何一個(gè)。
任務(wù)特定代理的必要性:通過消融實(shí)驗(yàn),研究發(fā)現(xiàn)移除任務(wù)特定代理和文檔后,系統(tǒng)性能大幅下降,這表明任務(wù)特定代理和相關(guān)文檔對(duì)于高性能至關(guān)重要。
案例研究
研究團(tuán)隊(duì)通過具體案例進(jìn)一步驗(yàn)證了HPTSA系統(tǒng)的有效性。以下是兩個(gè)成功的案例:
flusity-CMS漏洞:在該案例中,HPTSA成功利用了flusity-CMS中的跨站請(qǐng)求偽造(CSRF)和跨站腳本(XSS)漏洞。系統(tǒng)通過多次嘗試,最終在管理頁面創(chuàng)建了一個(gè)新的菜單,并成功注入了XSS負(fù)載。
changedetection io漏洞:該漏洞涉及某些輸入?yún)?shù)未正確解析,導(dǎo)致Javascript代碼執(zhí)行。HPTSA通過多次嘗試,成功導(dǎo)航到正確的頁面并利用了該漏洞。
結(jié)論
HPTSA系統(tǒng)的提出和驗(yàn)證表明,利用多AI代理系統(tǒng)可以顯著提升AI代理在零日漏洞利用中的表現(xiàn)。這一發(fā)現(xiàn)解決了之前研究中的一個(gè)開放性問題,表明更復(fù)雜的AI代理系統(tǒng)可以有效地利用零日漏洞。
盡管HPTSA系統(tǒng)在實(shí)驗(yàn)中表現(xiàn)出色,但研究團(tuán)隊(duì)也指出,要想全面理解AI代理在網(wǎng)絡(luò)安全中的應(yīng)用,未來仍有大量工作需要完成。例如,研究主要集中在可重現(xiàn)的開源Web漏洞上,未來的工作應(yīng)涵蓋更廣泛的漏洞類型。此外,隨著AI技術(shù)和相關(guān)工具的不斷進(jìn)步,AI代理在網(wǎng)絡(luò)安全攻防兩方面的作用將進(jìn)一步增強(qiáng)。
大語言模型在零日漏洞利用領(lǐng)域的突破再次展示了了AI技術(shù)在網(wǎng)絡(luò)安全領(lǐng)域的巨大潛力。隨著AI代理系統(tǒng)的不斷優(yōu)化和成本的降低,AI技術(shù)有望成為網(wǎng)絡(luò)安全專家的重要輔助工具,大幅提升網(wǎng)絡(luò)防御和攻擊的效率。