版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法
面向大數(shù)據(jù)全生命周期安全的主動(dòng)防御是目前大數(shù)據(jù)安全研究
的熱點(diǎn)之一。在分析大數(shù)據(jù)主動(dòng)防御系統(tǒng)對(duì)數(shù)據(jù)采集需求的基礎(chǔ)上,
提出了一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法。該方法基于
虛擬機(jī)內(nèi)省技術(shù),結(jié)合了帶內(nèi)采集和帶外采集的優(yōu)點(diǎn),并對(duì)數(shù)據(jù)采集
進(jìn)行了優(yōu)化設(shè)計(jì),實(shí)現(xiàn)了一種高效低損的數(shù)據(jù)采集能力。
內(nèi)容目錄:
0引言
1主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)
2基于虛擬化的數(shù)據(jù)采集技術(shù)
3低損耗數(shù)據(jù)采集方法
3.1基于虛擬機(jī)內(nèi)省的數(shù)據(jù)采集框架
3.2數(shù)據(jù)采集優(yōu)化
4效果分析
4.1采集效率
4.2采集效果
5結(jié)語
。、引言
隨著大數(shù)據(jù)技術(shù)的日益成熟,圍繞大數(shù)據(jù)的應(yīng)用呈現(xiàn)出了
多種多樣的特點(diǎn),使得大數(shù)據(jù)的流轉(zhuǎn)更加錯(cuò)綜復(fù)雜,導(dǎo)致了數(shù)
據(jù)暴露出更大的受攻擊面。同時(shí),大數(shù)據(jù)在全生命周期過程中
呈現(xiàn)出了類型動(dòng)態(tài)化、等級(jí)多樣化、權(quán)屬復(fù)雜化、使用實(shí)時(shí)化
等特點(diǎn),這些特點(diǎn)都導(dǎo)致了大數(shù)據(jù)環(huán)境下的安全威脅攻擊手段
多樣化,攻擊程序不斷更新迭代,使得大數(shù)據(jù)在全生命周期過
程中被竊取、被濫用、被篡改的風(fēng)險(xiǎn)不斷增大。
傳統(tǒng)的安全手段及體系呈現(xiàn)出的單點(diǎn)、靜態(tài)、被動(dòng)防護(hù)的
特點(diǎn)已不能有效應(yīng)對(duì)大數(shù)據(jù)環(huán)境下的安全威脅。在這種趨勢(shì)的
推動(dòng)下,安全防御思想正在從"以網(wǎng)絡(luò)為中心"向"以數(shù)據(jù)為
中心"轉(zhuǎn)變,安全防御體系正在從單點(diǎn)、靜態(tài)、被動(dòng)防護(hù)向全
面、動(dòng)態(tài)、主動(dòng)防護(hù)轉(zhuǎn)變。
在圍繞大數(shù)據(jù)全生命周期安全的主動(dòng)防御體系中,主動(dòng)防
御所需采集數(shù)據(jù)的種類多、數(shù)據(jù)量大,應(yīng)盡量減少對(duì)采集系統(tǒng)
資源的占用率,不影響被防御對(duì)象系統(tǒng)的正常運(yùn)行,因此,數(shù)
據(jù)采集效率對(duì)整個(gè)防御體系的準(zhǔn)確性、實(shí)時(shí)性和高效性至關(guān)重
要。
針對(duì)上述問題,特別是面向大數(shù)據(jù)分析應(yīng)用場(chǎng)景,本文提
出了一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法。該方法
采用無代理帶外采集方式,結(jié)合虛擬機(jī)內(nèi)省機(jī)制,從大數(shù)據(jù)分
析節(jié)點(diǎn)中的虛擬機(jī)外部對(duì)虛擬機(jī)內(nèi)部的數(shù)據(jù)進(jìn)行采集,僅采集
安全防御所需數(shù)據(jù),不僅提高了數(shù)據(jù)采集的效率,而且有效降
低了大數(shù)據(jù)分析節(jié)點(diǎn)網(wǎng)絡(luò)資源和虛擬機(jī)計(jì)算資源的占用率,從
而實(shí)現(xiàn)低損高效的數(shù)據(jù)采集目的。
1、主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)
大數(shù)據(jù)主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)如圖1所示。
切防御
虛
擬數(shù)據(jù)采集監(jiān)控0艮名
機(jī)
臉無代理采集(
君
內(nèi)
省
金U機(jī)監(jiān)控器集
數(shù)
點(diǎn)數(shù)
策
據(jù)
略
NetFlow/分
管
sFlow^-
析
理
,
,
一
一)
:采集管理平臺(tái)
圖1大數(shù)據(jù)主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)
在一個(gè)典型的面向大數(shù)據(jù)環(huán)境下的主動(dòng)安全防御系統(tǒng)中的
采集系統(tǒng)主要包括三類數(shù)據(jù):網(wǎng)絡(luò)、終端、大數(shù)據(jù)分析節(jié)點(diǎn)。
目前,針對(duì)大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)和終端的數(shù)據(jù)采集技術(shù)相對(duì)成
熟。網(wǎng)絡(luò)流量主要以探針的方式進(jìn)行數(shù)據(jù)采集,采集技術(shù)主要
有:基于SNMP的采集技術(shù)、基于流的采集技術(shù)和基于數(shù)據(jù)包
抓取的采集技術(shù);終端主要以代理或探針方式進(jìn)行數(shù)據(jù)采集,
終端采集代理或探針主要通過輕量化軟件容器實(shí)現(xiàn);大數(shù)據(jù)分
析節(jié)點(diǎn)由于部署在虛擬機(jī)上,數(shù)據(jù)采集方式以帶內(nèi)采集方式為
主,該方式的典型做法是基于主機(jī)的入侵檢測(cè)系統(tǒng),由中心采
集程序和植入虛擬機(jī)的代理程序組成,是一種松耦合的方法。
帶內(nèi)采集方式由于使用了采集程序和代理,會(huì)占用一定的虛擬
機(jī)資源,占用量高時(shí)會(huì)嚴(yán)重影響到虛擬機(jī)的正常運(yùn)行,而且更
易于被攻擊和被繞過而導(dǎo)致數(shù)據(jù)采集失敗,這些問題都會(huì)嚴(yán)重
影響主動(dòng)防御系統(tǒng)的響應(yīng)效率和防御效能,甚至導(dǎo)致防御失敗。
針對(duì)這些問題,本文提出了一種高效低損的數(shù)據(jù)采集方法,
該方法基于虛擬機(jī)內(nèi)省技術(shù),通過虛擬機(jī)監(jiān)控層從外部對(duì)虛擬
機(jī)內(nèi)部進(jìn)行選擇性的數(shù)據(jù)采集和監(jiān)控,實(shí)現(xiàn)了高效低損的采集
效果。同時(shí),由于帶外采集對(duì)虛擬機(jī)內(nèi)部是透明的,虛擬機(jī)內(nèi)
部無法感知到帶外監(jiān)控程序,因此本方法還具有更高的安全性。
2、基于虛擬化的數(shù)據(jù)采集技術(shù)
在大數(shù)據(jù)系統(tǒng)部署的過程中,為了實(shí)現(xiàn)高效的計(jì)算和存儲(chǔ)
能力,一般大數(shù)據(jù)計(jì)算集群和存儲(chǔ)集群分開部署,將計(jì)算集群
部署在云計(jì)算平臺(tái)上,在這種部署情況下,為了實(shí)現(xiàn)大數(shù)據(jù)環(huán)
境下的主動(dòng)防御能力,需要對(duì)計(jì)算集群進(jìn)行高效的數(shù)據(jù)采集和
分析。在虛擬化環(huán)境下,從數(shù)據(jù)采集實(shí)現(xiàn)技術(shù)的角度看,采集
方法主要有兩種:帶內(nèi)采集(In-band)和帶外采集
(Out-of-band)。
帶內(nèi)采集是指從虛擬機(jī)內(nèi)部進(jìn)行數(shù)據(jù)采集。如圖2所示,
該方法主要通過在虛擬機(jī)中加載代理模塊攔截虛擬機(jī)內(nèi)部事件
來實(shí)現(xiàn)。該方法的優(yōu)點(diǎn)在于事件攔截是在虛擬機(jī)內(nèi)部,可以直
接獲取操作系統(tǒng)語義,獲取的語義精準(zhǔn)且不需要進(jìn)行語義重構(gòu),
因此減少了性能開銷;缺點(diǎn)是容易遭受惡意軟件的攻擊和控制,
容易成為新的安全隱患點(diǎn),而且代理模塊采用加載的方式容易
被用戶終止而輕松繞過。
圖2帶內(nèi)采集(In-band)
帶外采集是指從虛擬機(jī)外部,在虛擬機(jī)管理器中對(duì)虛擬機(jī)
中的事件進(jìn)行攔截,從而實(shí)現(xiàn)對(duì)虛擬機(jī)數(shù)據(jù)的采集。由于帶外
采集是在虛擬機(jī)管理器中執(zhí)行,位于目標(biāo)虛擬機(jī)的底層,可將
數(shù)據(jù)采集單元與目標(biāo)虛擬機(jī)隔離開來,數(shù)據(jù)采集對(duì)目標(biāo)虛擬機(jī)
是不可感知的,因此增強(qiáng)了數(shù)據(jù)采集單元的安全性。
與帶內(nèi)采集相比,帶外采集具有更高的安全性,但其存在
虛擬機(jī)內(nèi)部的真實(shí)狀態(tài)與虛擬機(jī)外部抽取信息之間的語義鴻溝
問題,也就是如何將從外部抽取的低層信息(寄存器值、系統(tǒng)
調(diào)用、I/O請(qǐng)求等)轉(zhuǎn)譯成高層信息(進(jìn)程、文件等)o如圖3
所示,這種從虛擬機(jī)外部監(jiān)控虛擬機(jī)內(nèi)部的方法稱為虛擬機(jī)內(nèi)
省
(virtualmachineintrospection,VMI)o
圖3帶外采集(Out-of-band)
3、低損耗數(shù)據(jù)采集方法
通過結(jié)合帶內(nèi)和帶外數(shù)據(jù)采集方法的優(yōu)點(diǎn),本文提出了一
種基于虛擬機(jī)內(nèi)省機(jī)制,面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采
集方法。
3.1基于虛擬機(jī)內(nèi)省的數(shù)據(jù)采集框架
本方法的主要思路是采用虛擬機(jī)內(nèi)省技術(shù)在虛擬機(jī)監(jiān)控器
中設(shè)計(jì)數(shù)據(jù)采集監(jiān)控模塊,通過監(jiān)控模塊從虛擬機(jī)外部對(duì)虛擬
機(jī)內(nèi)部信息進(jìn)行采集,為了避免語義鴻溝問題,設(shè)計(jì)一個(gè)采集
注入模塊,在虛擬機(jī)啟動(dòng)時(shí),通過將采集代碼注入目標(biāo)虛擬機(jī)
內(nèi)存中,按照采集策略對(duì)所需數(shù)據(jù)安全信息進(jìn)行采集,因此無
須進(jìn)行語義轉(zhuǎn)換。低損耗數(shù)據(jù)采集方法的整體技術(shù)框架如圖4
所示。
數(shù)據(jù)采集監(jiān)控服務(wù)
「
采
數(shù)
數(shù)
集
據(jù)
據(jù)
策
處
分內(nèi)核層內(nèi)存采集注入代碼
略
理
析
管
理策略下發(fā)
-一數(shù)據(jù)采采集注
集tf塊入模塊
采集管理平臺(tái)
數(shù)據(jù)上報(bào)
圖4基于虛擬機(jī)內(nèi)省的數(shù)據(jù)采集框架
低損耗數(shù)據(jù)采集方法主要包括四個(gè)部分:策略設(shè)置模塊、
數(shù)據(jù)采集模塊、采集注入模塊和采集注入代碼。其工作流程說
明如下:
Stepl:虛擬機(jī)啟動(dòng)時(shí),虛擬機(jī)監(jiān)控器通過采集注入模塊將
采集代碼以無感方式注入目標(biāo)虛擬機(jī)的非換頁內(nèi)存中,保證代
碼不會(huì)被換出;
Step2:在虛擬機(jī)運(yùn)行過程中,數(shù)據(jù)采集監(jiān)控服務(wù)平臺(tái)管理員設(shè)
置目標(biāo)虛擬機(jī)的數(shù)據(jù)采集策略,采集策略管理模塊將制定好的
策略下發(fā)至虛擬機(jī)監(jiān)控器的策略設(shè)置模塊;
Step3策略管理模塊通過采集注入模塊將策略下發(fā)至目標(biāo)虛擬
機(jī)的采集注入代碼中;
Step4:采集注入代碼根據(jù)策略,采集進(jìn)程、文件操作、磁盤訪
問等信息;
Step5采集注入代碼將采集的信息定時(shí)或按照一定的數(shù)據(jù)量發(fā)
送給數(shù)據(jù)采集模塊;
Step6:數(shù)據(jù)采集模塊將采集數(shù)據(jù)進(jìn)行清洗后,按照標(biāo)準(zhǔn)格式發(fā)
送給數(shù)據(jù)采集監(jiān)控服務(wù)平臺(tái)。
數(shù)據(jù)采集監(jiān)控服務(wù)平臺(tái)將接收到的采集數(shù)據(jù)進(jìn)行數(shù)據(jù)處
理和數(shù)據(jù)分析,將發(fā)現(xiàn)的數(shù)據(jù)和進(jìn)程異常行為及時(shí)上報(bào)主動(dòng)防
御系統(tǒng),主動(dòng)防御系統(tǒng)根據(jù)接收到的威脅信息調(diào)整防御策略并
進(jìn)行相應(yīng)的協(xié)同防御。
3.2數(shù)據(jù)采集優(yōu)化
數(shù)據(jù)采集模塊位于虛擬機(jī)監(jiān)控器,利用虛擬機(jī)內(nèi)省機(jī)制
(LibVMI)實(shí)現(xiàn)虛擬機(jī)內(nèi)部數(shù)據(jù)的外部采集。LibVMI是美國
佐治亞理工學(xué)院的Payne等設(shè)計(jì)的一套開源內(nèi)省工具庫,如圖
5所示,該工具不需要對(duì)虛擬機(jī)監(jiān)視器進(jìn)行修改,而是直接利
用虛擬機(jī)監(jiān)視器提供的接口對(duì)虛擬機(jī)底層信息(進(jìn)程頁表、內(nèi)
存映射等)進(jìn)行重構(gòu),獲取虛擬機(jī)高層信息(進(jìn)程信息、內(nèi)核
數(shù)據(jù)),從而實(shí)現(xiàn)監(jiān)控虛擬機(jī)的行為和狀態(tài),這種方法對(duì)虛擬
機(jī)影響最小。
圖5數(shù)據(jù)采集模塊
基于虛擬機(jī)內(nèi)省機(jī)制的LibVMI也存在語義鴻溝問題,為
了避免該問題,本方法設(shè)計(jì)了采集注入代碼模塊,該模塊在虛
擬機(jī)啟動(dòng)時(shí)以無感的方式通過采集注入模塊注入虛擬機(jī)非換頁
內(nèi)存區(qū)域中,通過注入代碼直接采集虛擬機(jī)的高級(jí)信息,因此
不需要進(jìn)行語義轉(zhuǎn)換,從而解決了資源消耗問題。
同時(shí),為了提高數(shù)據(jù)采集效率,并進(jìn)一步減小對(duì)目標(biāo)虛擬機(jī)內(nèi)
存的占用率,對(duì)采集注入代碼進(jìn)行了優(yōu)化,設(shè)計(jì)了一種閾值綜
合判定規(guī)則,該規(guī)則綜合考慮了采集時(shí)間(C)和資源占用率(S)
兩個(gè)因素,資源占用率的閾值(T)一般為目標(biāo)虛擬機(jī)內(nèi)存的
1%,該閾值可根據(jù)用戶需要進(jìn)行設(shè)定,采集時(shí)間間隔(I)由
管理員設(shè)定,按照資源優(yōu)先原則,首先判斷資源占用率,如果S
>T,則數(shù)據(jù)輸出,否則,如果C>I,則數(shù)據(jù)輸出。
通過上述的優(yōu)化過程,從系統(tǒng)層面到采集實(shí)施層面均對(duì)整體數(shù)
據(jù)采集進(jìn)行了優(yōu)化,保障了采集效率和效果的有效權(quán)衡。
4、效果分析
實(shí)驗(yàn)采用服務(wù)器配置:
CPU:IntelXeonE5-26302.4GHz
內(nèi)存:64GB
硬盤:2TB
操作系統(tǒng):CentOS7.264位
軟件:yum、libvirt、qemu-kvm、LibVMI
采集數(shù)據(jù)如表1所示。
表1采集數(shù)據(jù)表
序
采集信息信息屬性
號(hào)
1虛擬機(jī)進(jìn)程列表進(jìn)程名稱、文件名、
2虛擬機(jī)文件操作文件權(quán)限、I/O操作
3虛擬機(jī)I/O操作類型、I/O操作權(quán)
限、I/O開放情況等
4虛擬機(jī)操作系統(tǒng)操作系統(tǒng)版本、虛
5虛擬機(jī)配置擬機(jī)操作系統(tǒng)配
置.、軟件安裝列表
等
4.1采集效率
本文設(shè)計(jì)的數(shù)據(jù)采集優(yōu)化方法采用了內(nèi)存注入代碼方式,
可直接從目標(biāo)虛擬機(jī)內(nèi)部采集數(shù)據(jù),經(jīng)過測(cè)試,通過對(duì)數(shù)據(jù)采
集1000次并取平均值計(jì)算,數(shù)據(jù)采集時(shí)間為0.002s,而采用
代理程序方式的采
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024冷庫租賃合同書范本(適用小型企業(yè))
- 2024年度互聯(lián)網(wǎng)廣告技術(shù)服務(wù)合同
- 2024年買賣合同標(biāo)的為新能源汽車
- 2024年度影視制作與發(fā)行承包合同
- 2024年度房地產(chǎn)商業(yè)綜合體建設(shè)項(xiàng)目施工合同
- 公租房個(gè)人收入證明(12篇)
- 2024年度安置房社區(qū)文化活動(dòng)合同
- 手機(jī)教學(xué)課件教學(xué)
- 2024年度品牌合作框架協(xié)議
- 2024年度特許經(jīng)營合同標(biāo)的及許可使用范圍
- 海洋工程柔性立管發(fā)展概況
- 漢語教師志愿者培訓(xùn)大綱
- 護(hù)理導(dǎo)論 評(píng)判性思維
- SPC培訓(xùn)資料_2
- 學(xué)習(xí)適應(yīng)性測(cè)驗(yàn)(AAT)
- ADS創(chuàng)建自己的元件庫
- MATLAB仿真三相橋式整流電路(詳細(xì)完美)
- 2019年重慶普通高中會(huì)考通用技術(shù)真題及答案
- 天秤座小奏鳴曲,Libra Sonatine;迪安斯,Roland Dyens(古典吉他譜)
- 鋼筋混凝土工程施工及驗(yàn)收規(guī)范最新(完整版)
- 光纜施工規(guī)范及要求
評(píng)論
0/150
提交評(píng)論