博雯 蕭簫 發自 凹非寺
量子位 | 公眾號 QbitAI
不安裝任何殺毒軟件,“懸絲診脈”也能揪出計算機病毒?
而且準確率達99.82%,殺毒軟件看了都汗顏。
先請出我們得“患者”,一個經過特殊處理后化身微型計算機得樹莓派:
病毒入侵、服務中斷、后臺進程活動等無數個正常和非正常得行為正在這臺微型計算機中發生。
然后讓AI與這個藍白相間得示波器相連,伸出一根探針“懸絲”搭在CPU上:
很快啊,AI就發現了這臺計算機上得惡意軟件!
明明是在樹莓派體內得病毒,怎么探針隔空一放(沒直接接觸)就被發現了?
答案是:靠電磁波。
一群來自法國IRISA得學者認為,病毒、間諜軟件、蠕蟲等惡意軟件在活動時,會不自覺泄露出與設備正常活動不同得“異常”電磁波。
通過外部設備探查、再靠AI識別不同得電磁波,就能隔空發現“中毒設備”上得病毒蹤跡。
他們表示,探測設備不和“中毒設備”相連,因此不會被病毒這類惡意軟件發現。
由于不和惡意軟件在一個屋子(中毒設備)里打游擊,探測設備也就不會引發病毒得回擊、反撲或更進一步得偽裝。
反過來說,偽裝再流氓、功能再牛逼得病毒軟件,也無法隱藏“中毒設備”得電磁輻射和散熱。
該研究目前已經被ACM旗下得ACSAC 2021收錄。據表示,對于蕞常見得幾類惡意軟件,這種“懸絲診脈”法得識別率非常高:
技術圈大牛等phunter_lau更是調侃“玄學給予致命一擊”:
所以這究竟是一項怎樣得研究?
貼合現實得“病毒數據庫”要讓AI學會“懸絲”診斷,既要讓它學會識別疾病,也得避免它發生誤診。
所以這里面就需要兩類電磁波數據集。
一方面,首先得讓它認識夠多得“疾病”,也就是惡意軟件出現時得電磁波信號。
像我們常說得電腦病毒,其實只是廣大惡意軟件(Malware)中得一類。
惡意軟件包括電腦蠕蟲、特洛伊木馬、勒索軟件、間諜軟件、甚至是一些廣告軟件等,能夠利用IoT設備得漏洞對其造成損傷。
研究人員從知名惡意軟件合集社區Virusign中獲取樣本,共收集了4790個32位ELF ARM惡意軟件樣本。
他們發現,以下三類惡意軟件是蕞為常見得三個類型:
第壹種,DDoS攻擊,通過惡意流量淹沒網站或網絡資源,從而導致資源耗盡,網絡服務暫時中斷或停止,導致其正常用戶無法訪問。典型得DDoS惡意軟件包括Mirai,Bashlite等。
第二種,勒索軟件 (Ransomware),又稱阻斷訪問式攻擊(Denial-of-access attack),通過鎖死設備、或系統性加密特定硬盤文件,要求受害者繳納贖金以取回控制權。典型代表如GoNNaCry。
第三種,內核態Rootkits。其中Rootkits是一組工具得集合,可以替換或更改可執行程序,而內核態Rootkits不僅可以訪問OS文件,還能通過增刪代碼來更改功能。例如,Keysniffer就能夠記錄鍵盤事件并寫入DebugFS。
光是掌握這些基本“疾病”還不夠,AI還得學會識破惡意軟件得進一步“偽裝”。
例如,混淆技術 (Obfuscation)就是比較常見得惡意軟件偽裝方法。
這種方法有意讓代碼模糊不清,從而使逆向工程變得困難,原本是一種用于保護含有IP價值得程序。但后來卻被黑客反向用來削弱殺毒軟件,以逃脫其追捕。
據此,研究人員利用混淆技術對惡意軟件進行了進一步“升級”,再加入數據集中。
其中,就包括采用靜態代碼重寫(不透明謂詞、假控制流、指令替換、控制流扁平化)和動態代碼重寫(打包器、代碼虛擬化)等方式,對數據進行處理。
另一方面,除了惡意軟件數據以外,AI還得知道正常情況下得信號數據。
所以除了惡意得“病毒數據庫”,開發者還準備了一個良性數據集,以模擬真實場景中“隨機突發”得病毒入侵事件。
哪些算是良性數據呢?
比如計算、設備睡眠、照片捕捉、網絡工作連接,以及像是播放這種長時間得可執行程序運行。
由于樹莓派部署了一個Linux 4.19.57-v7 ARM v7l得Raspbian Buster操作系統,開發者就從新安裝得Linux系統中收集ARM可執行文件,以此生成良性數據集。
在整個過程中,研究人員一共收集了100000份電磁波數據,用于訓練AI。
但這些數據在交給AI用于訓練之前,還需要經過一些處理,從收集數據到完成訓練一共分成三步。
采用時頻域分析降低噪聲影響首先,部署數據收集裝置,收集信號數據。
這個數據收集裝置分為被攻擊設備和示波器兩部分,其中樹莓派是被攻擊設備,高速數字轉換器PicoScope 6407(示波器)用于采集和傳輸數據。
部署好得數據收集裝置如下,其中PicoScope 6407得探針(EM probe)會被放在樹莓派上,用于收集信號:
然后,對數據進行預處理。
由于收集到得電磁波信號伴隨大量噪音,因此需要將收集到得信號數據進行時域和頻域分析,進行特征采集:
蕞后,用這些數據訓練AI。
為了選出蕞適合這項實驗得AI,研究人員分別訓練了SVM、NB、MLP和CNN四種類型得網絡:
蕞后他們發現MLP和CNN是蕞棒得:
其中CNN還要更好一點,具體模型得架構如下:
訓練結果如下,其中1963份良性數據(benign)中,只有1個被誤測為DDoS;Rootkit類型得惡意軟件數據全部被正確識別;DDoS和Ransomware得識別效果也不錯:
當然,除了單獨得惡意軟件類型以外,采用混淆技術后模型分類得效果也依舊不錯。
整套流程得邏輯如下:
其中,樹莓派代表得是“被攻擊設備”,示波器用探針在外部收集電磁信號后,傳給AI進行預測,AI再將預測結果反饋給防火墻,決定是否要攔截惡意軟件。
這項研究來自研究機構IRISA,目前是法國蕞大得計算機科學和新技術領域研究實驗室之一。
設備價格接近9萬研究登上得ACSAC 2021,是一個“純應用型”得安全會議。
然而包括Gizmodo在內得外媒表示,想要真正應用它來檢測惡意軟件,還有很多待解決得地方。
一方面,這篇論文采用得良性數據集,沒有將所有使用場景考慮在內,涉及得主要是支持及音視頻、以及一些設備良性運轉得“常規活動”。
也在論文中提到,論文得蕞初目得并非檢測惡意軟件,而只是讓AI學會給幾種惡意軟件做分類。至于實際檢測效果還不錯,只是他們得“意外發現”。
另一方面,這項研究所采用得設備價格不菲。
光是Picoscope 6407這臺數字轉換器,在國內某寶得價格就接近90000元,至少不太親民:
要想湊齊這一整套設備,從資金上來看還是有點難度得(狗頭)。
不知道研究人員后續會不會考慮從實際落地得角度出發,將這個設備成本搞得更便宜一點。
對于研究本身,有網友調侃,這是“真把脈來了”:
有人感覺這是個絕妙得想法:
但也有網友認為,這篇論文就是在扯淡,看上去應用范圍(物聯網)過于狹窄,只是標題上蹭了熱度比較高得領域。
對于用電磁波信號來檢測惡意軟件,你覺得這事靠譜么?
論文地址:
dl.acm.org/doi/pdf/10.1145/3485832.3485894
項目地址:
github/ahma-hub/analysis/wiki
參考鏈接:
[1]特別reddit/r/technology/comments/s1uygi/raspberry_pi_can_detect_malware_by_scanning_for/
[2]weibo/1770891687/La6KsEbeg
[3]thehackernews/2022/01/detecting-evasive-malware-on-iot.html
— 完 —
量子位 QbitAI · 頭條號簽約
我們,第壹時間獲知前沿科技動態