一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法_第1頁
一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法_第2頁
一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法_第3頁
一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法_第4頁
一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法

面向大數(shù)據(jù)全生命周期安全的主動(dòng)防御是目前大數(shù)據(jù)安全研究

的熱點(diǎn)之一。在分析大數(shù)據(jù)主動(dòng)防御系統(tǒng)對(duì)數(shù)據(jù)采集需求的基礎(chǔ)上,

提出了一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法。該方法基于

虛擬機(jī)內(nèi)省技術(shù),結(jié)合了帶內(nèi)采集和帶外采集的優(yōu)點(diǎn),并對(duì)數(shù)據(jù)采集

進(jìn)行了優(yōu)化設(shè)計(jì),實(shí)現(xiàn)了一種高效低損的數(shù)據(jù)采集能力。

內(nèi)容目錄:

0引言

1主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)

2基于虛擬化的數(shù)據(jù)采集技術(shù)

3低損耗數(shù)據(jù)采集方法

3.1基于虛擬機(jī)內(nèi)省的數(shù)據(jù)采集框架

3.2數(shù)據(jù)采集優(yōu)化

4效果分析

4.1采集效率

4.2采集效果

5結(jié)語

。、引言

隨著大數(shù)據(jù)技術(shù)的日益成熟,圍繞大數(shù)據(jù)的應(yīng)用呈現(xiàn)出了

多種多樣的特點(diǎn),使得大數(shù)據(jù)的流轉(zhuǎn)更加錯(cuò)綜復(fù)雜,導(dǎo)致了數(shù)

據(jù)暴露出更大的受攻擊面。同時(shí),大數(shù)據(jù)在全生命周期過程中

呈現(xiàn)出了類型動(dòng)態(tài)化、等級(jí)多樣化、權(quán)屬復(fù)雜化、使用實(shí)時(shí)化

等特點(diǎn),這些特點(diǎn)都導(dǎo)致了大數(shù)據(jù)環(huán)境下的安全威脅攻擊手段

多樣化,攻擊程序不斷更新迭代,使得大數(shù)據(jù)在全生命周期過

程中被竊取、被濫用、被篡改的風(fēng)險(xiǎn)不斷增大。

傳統(tǒng)的安全手段及體系呈現(xiàn)出的單點(diǎn)、靜態(tài)、被動(dòng)防護(hù)的

特點(diǎn)已不能有效應(yīng)對(duì)大數(shù)據(jù)環(huán)境下的安全威脅。在這種趨勢(shì)的

推動(dòng)下,安全防御思想正在從"以網(wǎng)絡(luò)為中心"向"以數(shù)據(jù)為

中心"轉(zhuǎn)變,安全防御體系正在從單點(diǎn)、靜態(tài)、被動(dòng)防護(hù)向全

面、動(dòng)態(tài)、主動(dòng)防護(hù)轉(zhuǎn)變。

在圍繞大數(shù)據(jù)全生命周期安全的主動(dòng)防御體系中,主動(dòng)防

御所需采集數(shù)據(jù)的種類多、數(shù)據(jù)量大,應(yīng)盡量減少對(duì)采集系統(tǒng)

資源的占用率,不影響被防御對(duì)象系統(tǒng)的正常運(yùn)行,因此,數(shù)

據(jù)采集效率對(duì)整個(gè)防御體系的準(zhǔn)確性、實(shí)時(shí)性和高效性至關(guān)重

要。

針對(duì)上述問題,特別是面向大數(shù)據(jù)分析應(yīng)用場(chǎng)景,本文提

出了一種面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采集方法。該方法

采用無代理帶外采集方式,結(jié)合虛擬機(jī)內(nèi)省機(jī)制,從大數(shù)據(jù)分

析節(jié)點(diǎn)中的虛擬機(jī)外部對(duì)虛擬機(jī)內(nèi)部的數(shù)據(jù)進(jìn)行采集,僅采集

安全防御所需數(shù)據(jù),不僅提高了數(shù)據(jù)采集的效率,而且有效降

低了大數(shù)據(jù)分析節(jié)點(diǎn)網(wǎng)絡(luò)資源和虛擬機(jī)計(jì)算資源的占用率,從

而實(shí)現(xiàn)低損高效的數(shù)據(jù)采集目的。

1、主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)

大數(shù)據(jù)主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)如圖1所示。

切防御

擬數(shù)據(jù)采集監(jiān)控0艮名

機(jī)

臉無代理采集(

內(nèi)

金U機(jī)監(jiān)控器集

數(shù)

點(diǎn)數(shù)

據(jù)

NetFlow/分

sFlow^-

,

一)

:采集管理平臺(tái)

圖1大數(shù)據(jù)主動(dòng)防御系統(tǒng)數(shù)據(jù)采集架構(gòu)

在一個(gè)典型的面向大數(shù)據(jù)環(huán)境下的主動(dòng)安全防御系統(tǒng)中的

采集系統(tǒng)主要包括三類數(shù)據(jù):網(wǎng)絡(luò)、終端、大數(shù)據(jù)分析節(jié)點(diǎn)。

目前,針對(duì)大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)和終端的數(shù)據(jù)采集技術(shù)相對(duì)成

熟。網(wǎng)絡(luò)流量主要以探針的方式進(jìn)行數(shù)據(jù)采集,采集技術(shù)主要

有:基于SNMP的采集技術(shù)、基于流的采集技術(shù)和基于數(shù)據(jù)包

抓取的采集技術(shù);終端主要以代理或探針方式進(jìn)行數(shù)據(jù)采集,

終端采集代理或探針主要通過輕量化軟件容器實(shí)現(xiàn);大數(shù)據(jù)分

析節(jié)點(diǎn)由于部署在虛擬機(jī)上,數(shù)據(jù)采集方式以帶內(nèi)采集方式為

主,該方式的典型做法是基于主機(jī)的入侵檢測(cè)系統(tǒng),由中心采

集程序和植入虛擬機(jī)的代理程序組成,是一種松耦合的方法。

帶內(nèi)采集方式由于使用了采集程序和代理,會(huì)占用一定的虛擬

機(jī)資源,占用量高時(shí)會(huì)嚴(yán)重影響到虛擬機(jī)的正常運(yùn)行,而且更

易于被攻擊和被繞過而導(dǎo)致數(shù)據(jù)采集失敗,這些問題都會(huì)嚴(yán)重

影響主動(dòng)防御系統(tǒng)的響應(yīng)效率和防御效能,甚至導(dǎo)致防御失敗。

針對(duì)這些問題,本文提出了一種高效低損的數(shù)據(jù)采集方法,

該方法基于虛擬機(jī)內(nèi)省技術(shù),通過虛擬機(jī)監(jiān)控層從外部對(duì)虛擬

機(jī)內(nèi)部進(jìn)行選擇性的數(shù)據(jù)采集和監(jiān)控,實(shí)現(xiàn)了高效低損的采集

效果。同時(shí),由于帶外采集對(duì)虛擬機(jī)內(nèi)部是透明的,虛擬機(jī)內(nèi)

部無法感知到帶外監(jiān)控程序,因此本方法還具有更高的安全性。

2、基于虛擬化的數(shù)據(jù)采集技術(shù)

在大數(shù)據(jù)系統(tǒng)部署的過程中,為了實(shí)現(xiàn)高效的計(jì)算和存儲(chǔ)

能力,一般大數(shù)據(jù)計(jì)算集群和存儲(chǔ)集群分開部署,將計(jì)算集群

部署在云計(jì)算平臺(tái)上,在這種部署情況下,為了實(shí)現(xiàn)大數(shù)據(jù)環(huán)

境下的主動(dòng)防御能力,需要對(duì)計(jì)算集群進(jìn)行高效的數(shù)據(jù)采集和

分析。在虛擬化環(huán)境下,從數(shù)據(jù)采集實(shí)現(xiàn)技術(shù)的角度看,采集

方法主要有兩種:帶內(nèi)采集(In-band)和帶外采集

(Out-of-band)。

帶內(nèi)采集是指從虛擬機(jī)內(nèi)部進(jìn)行數(shù)據(jù)采集。如圖2所示,

該方法主要通過在虛擬機(jī)中加載代理模塊攔截虛擬機(jī)內(nèi)部事件

來實(shí)現(xiàn)。該方法的優(yōu)點(diǎn)在于事件攔截是在虛擬機(jī)內(nèi)部,可以直

接獲取操作系統(tǒng)語義,獲取的語義精準(zhǔn)且不需要進(jìn)行語義重構(gòu),

因此減少了性能開銷;缺點(diǎn)是容易遭受惡意軟件的攻擊和控制,

容易成為新的安全隱患點(diǎn),而且代理模塊采用加載的方式容易

被用戶終止而輕松繞過。

圖2帶內(nèi)采集(In-band)

帶外采集是指從虛擬機(jī)外部,在虛擬機(jī)管理器中對(duì)虛擬機(jī)

中的事件進(jìn)行攔截,從而實(shí)現(xiàn)對(duì)虛擬機(jī)數(shù)據(jù)的采集。由于帶外

采集是在虛擬機(jī)管理器中執(zhí)行,位于目標(biāo)虛擬機(jī)的底層,可將

數(shù)據(jù)采集單元與目標(biāo)虛擬機(jī)隔離開來,數(shù)據(jù)采集對(duì)目標(biāo)虛擬機(jī)

是不可感知的,因此增強(qiáng)了數(shù)據(jù)采集單元的安全性。

與帶內(nèi)采集相比,帶外采集具有更高的安全性,但其存在

虛擬機(jī)內(nèi)部的真實(shí)狀態(tài)與虛擬機(jī)外部抽取信息之間的語義鴻溝

問題,也就是如何將從外部抽取的低層信息(寄存器值、系統(tǒng)

調(diào)用、I/O請(qǐng)求等)轉(zhuǎn)譯成高層信息(進(jìn)程、文件等)o如圖3

所示,這種從虛擬機(jī)外部監(jiān)控虛擬機(jī)內(nèi)部的方法稱為虛擬機(jī)內(nèi)

(virtualmachineintrospection,VMI)o

圖3帶外采集(Out-of-band)

3、低損耗數(shù)據(jù)采集方法

通過結(jié)合帶內(nèi)和帶外數(shù)據(jù)采集方法的優(yōu)點(diǎn),本文提出了一

種基于虛擬機(jī)內(nèi)省機(jī)制,面向大數(shù)據(jù)主動(dòng)防御的低損耗數(shù)據(jù)采

集方法。

3.1基于虛擬機(jī)內(nèi)省的數(shù)據(jù)采集框架

本方法的主要思路是采用虛擬機(jī)內(nèi)省技術(shù)在虛擬機(jī)監(jiān)控器

中設(shè)計(jì)數(shù)據(jù)采集監(jiān)控模塊,通過監(jiān)控模塊從虛擬機(jī)外部對(duì)虛擬

機(jī)內(nèi)部信息進(jìn)行采集,為了避免語義鴻溝問題,設(shè)計(jì)一個(gè)采集

注入模塊,在虛擬機(jī)啟動(dòng)時(shí),通過將采集代碼注入目標(biāo)虛擬機(jī)

內(nèi)存中,按照采集策略對(duì)所需數(shù)據(jù)安全信息進(jìn)行采集,因此無

須進(jìn)行語義轉(zhuǎn)換。低損耗數(shù)據(jù)采集方法的整體技術(shù)框架如圖4

所示。

數(shù)據(jù)采集監(jiān)控服務(wù)

數(shù)

數(shù)

據(jù)

據(jù)

分內(nèi)核層內(nèi)存采集注入代碼

理策略下發(fā)

-一數(shù)據(jù)采采集注

集tf塊入模塊

采集管理平臺(tái)

數(shù)據(jù)上報(bào)

圖4基于虛擬機(jī)內(nèi)省的數(shù)據(jù)采集框架

低損耗數(shù)據(jù)采集方法主要包括四個(gè)部分:策略設(shè)置模塊、

數(shù)據(jù)采集模塊、采集注入模塊和采集注入代碼。其工作流程說

明如下:

Stepl:虛擬機(jī)啟動(dòng)時(shí),虛擬機(jī)監(jiān)控器通過采集注入模塊將

采集代碼以無感方式注入目標(biāo)虛擬機(jī)的非換頁內(nèi)存中,保證代

碼不會(huì)被換出;

Step2:在虛擬機(jī)運(yùn)行過程中,數(shù)據(jù)采集監(jiān)控服務(wù)平臺(tái)管理員設(shè)

置目標(biāo)虛擬機(jī)的數(shù)據(jù)采集策略,采集策略管理模塊將制定好的

策略下發(fā)至虛擬機(jī)監(jiān)控器的策略設(shè)置模塊;

Step3策略管理模塊通過采集注入模塊將策略下發(fā)至目標(biāo)虛擬

機(jī)的采集注入代碼中;

Step4:采集注入代碼根據(jù)策略,采集進(jìn)程、文件操作、磁盤訪

問等信息;

Step5采集注入代碼將采集的信息定時(shí)或按照一定的數(shù)據(jù)量發(fā)

送給數(shù)據(jù)采集模塊;

Step6:數(shù)據(jù)采集模塊將采集數(shù)據(jù)進(jìn)行清洗后,按照標(biāo)準(zhǔn)格式發(fā)

送給數(shù)據(jù)采集監(jiān)控服務(wù)平臺(tái)。

數(shù)據(jù)采集監(jiān)控服務(wù)平臺(tái)將接收到的采集數(shù)據(jù)進(jìn)行數(shù)據(jù)處

理和數(shù)據(jù)分析,將發(fā)現(xiàn)的數(shù)據(jù)和進(jìn)程異常行為及時(shí)上報(bào)主動(dòng)防

御系統(tǒng),主動(dòng)防御系統(tǒng)根據(jù)接收到的威脅信息調(diào)整防御策略并

進(jìn)行相應(yīng)的協(xié)同防御。

3.2數(shù)據(jù)采集優(yōu)化

數(shù)據(jù)采集模塊位于虛擬機(jī)監(jiān)控器,利用虛擬機(jī)內(nèi)省機(jī)制

(LibVMI)實(shí)現(xiàn)虛擬機(jī)內(nèi)部數(shù)據(jù)的外部采集。LibVMI是美國

佐治亞理工學(xué)院的Payne等設(shè)計(jì)的一套開源內(nèi)省工具庫,如圖

5所示,該工具不需要對(duì)虛擬機(jī)監(jiān)視器進(jìn)行修改,而是直接利

用虛擬機(jī)監(jiān)視器提供的接口對(duì)虛擬機(jī)底層信息(進(jìn)程頁表、內(nèi)

存映射等)進(jìn)行重構(gòu),獲取虛擬機(jī)高層信息(進(jìn)程信息、內(nèi)核

數(shù)據(jù)),從而實(shí)現(xiàn)監(jiān)控虛擬機(jī)的行為和狀態(tài),這種方法對(duì)虛擬

機(jī)影響最小。

圖5數(shù)據(jù)采集模塊

基于虛擬機(jī)內(nèi)省機(jī)制的LibVMI也存在語義鴻溝問題,為

了避免該問題,本方法設(shè)計(jì)了采集注入代碼模塊,該模塊在虛

擬機(jī)啟動(dòng)時(shí)以無感的方式通過采集注入模塊注入虛擬機(jī)非換頁

內(nèi)存區(qū)域中,通過注入代碼直接采集虛擬機(jī)的高級(jí)信息,因此

不需要進(jìn)行語義轉(zhuǎn)換,從而解決了資源消耗問題。

同時(shí),為了提高數(shù)據(jù)采集效率,并進(jìn)一步減小對(duì)目標(biāo)虛擬機(jī)內(nèi)

存的占用率,對(duì)采集注入代碼進(jìn)行了優(yōu)化,設(shè)計(jì)了一種閾值綜

合判定規(guī)則,該規(guī)則綜合考慮了采集時(shí)間(C)和資源占用率(S)

兩個(gè)因素,資源占用率的閾值(T)一般為目標(biāo)虛擬機(jī)內(nèi)存的

1%,該閾值可根據(jù)用戶需要進(jìn)行設(shè)定,采集時(shí)間間隔(I)由

管理員設(shè)定,按照資源優(yōu)先原則,首先判斷資源占用率,如果S

>T,則數(shù)據(jù)輸出,否則,如果C>I,則數(shù)據(jù)輸出。

通過上述的優(yōu)化過程,從系統(tǒng)層面到采集實(shí)施層面均對(duì)整體數(shù)

據(jù)采集進(jìn)行了優(yōu)化,保障了采集效率和效果的有效權(quán)衡。

4、效果分析

實(shí)驗(yàn)采用服務(wù)器配置:

CPU:IntelXeonE5-26302.4GHz

內(nèi)存:64GB

硬盤:2TB

操作系統(tǒng):CentOS7.264位

軟件:yum、libvirt、qemu-kvm、LibVMI

采集數(shù)據(jù)如表1所示。

表1采集數(shù)據(jù)表

采集信息信息屬性

號(hào)

1虛擬機(jī)進(jìn)程列表進(jìn)程名稱、文件名、

2虛擬機(jī)文件操作文件權(quán)限、I/O操作

3虛擬機(jī)I/O操作類型、I/O操作權(quán)

限、I/O開放情況等

4虛擬機(jī)操作系統(tǒng)操作系統(tǒng)版本、虛

5虛擬機(jī)配置擬機(jī)操作系統(tǒng)配

置.、軟件安裝列表

4.1采集效率

本文設(shè)計(jì)的數(shù)據(jù)采集優(yōu)化方法采用了內(nèi)存注入代碼方式,

可直接從目標(biāo)虛擬機(jī)內(nèi)部采集數(shù)據(jù),經(jīng)過測(cè)試,通過對(duì)數(shù)據(jù)采

集1000次并取平均值計(jì)算,數(shù)據(jù)采集時(shí)間為0.002s,而采用

代理程序方式的采

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論