數(shù)據(jù)挖掘技術(shù)在案件串并和嫌疑人排查中的應(yīng)用_第1頁
數(shù)據(jù)挖掘技術(shù)在案件串并和嫌疑人排查中的應(yīng)用_第2頁
數(shù)據(jù)挖掘技術(shù)在案件串并和嫌疑人排查中的應(yīng)用_第3頁
數(shù)據(jù)挖掘技術(shù)在案件串并和嫌疑人排查中的應(yīng)用_第4頁
數(shù)據(jù)挖掘技術(shù)在案件串并和嫌疑人排查中的應(yīng)用_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、在案件串并和嫌疑人排查中的應(yīng)用一、序言傳統(tǒng)的信息管理系統(tǒng)(),主要針對的是日常的結(jié)構(gòu)化問題,以提高組織的運(yùn)營效率為目標(biāo),通過將大量的數(shù)據(jù)轉(zhuǎn)換為有價(jià)值的信息來強(qiáng)化管理。隨著社會(huì)的進(jìn)步和技術(shù)的發(fā)展,人們不再僅僅滿足于獲取多種信息和簡單的使用信息,而是想在深層次上利用這些信息為組織的決策提供幫助。因此,為了彌補(bǔ)的不足,為了更好進(jìn)行市場預(yù)測、資源配置、人力優(yōu)化和生產(chǎn)管理,在管理科學(xué)、運(yùn)籌學(xué)、數(shù)理統(tǒng)計(jì)、人工智能等新方法和新技術(shù)的推動(dòng)下,人們開始重視決策支持系統(tǒng)()的研究和應(yīng)用?!啊笔录l(fā)生以后,西方主要發(fā)達(dá)國家都高度重視數(shù)據(jù)挖掘在刑事犯罪情報(bào)分析領(lǐng)域的應(yīng)用研究。刑事犯罪數(shù)據(jù)的分析與挖掘主要是通過對犯罪記

2、錄進(jìn)行分析,從而發(fā)現(xiàn)犯罪行為的規(guī)律、趨勢,了解不同犯罪行為之間的關(guān)聯(lián),以及何種狀態(tài)會(huì)誘發(fā)何種犯罪行為,進(jìn)行串并案分析,提供破案線索和情報(bào),預(yù)測并預(yù)防犯罪。在中國,隨著經(jīng)濟(jì)增長、社會(huì)變革深入、人員流動(dòng)性增強(qiáng),影響社會(huì)穩(wěn)定的不安定因素增加。特別是2008年以后,中國大陸人均突破3000美元,侵財(cái)類案件進(jìn)入高發(fā)周期,流竄作案、團(tuán)伙作案等新型犯罪手段層出不窮。部分公安機(jī)關(guān)開始運(yùn)用商業(yè)智能()的思維,利用商業(yè)智能()分析工具,結(jié)合長期積累的偵查辦案經(jīng)驗(yàn),探索建設(shè)警務(wù)決策支持系統(tǒng),研究開展基于犯罪數(shù)據(jù)的分析挖掘。二、案件串并和嫌疑人排查的主要方法1、關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則算法指數(shù)據(jù)中兩個(gè)或多個(gè)變量取值之間暗

3、含的某種規(guī)律性。支持度是對關(guān)聯(lián)規(guī)則重要性的衡量,置信度是對關(guān)聯(lián)規(guī)則準(zhǔn)確性的衡量。以挖掘關(guān)聯(lián)規(guī)則為目標(biāo)的挖掘過程一般包含兩個(gè)階段,第一階段,從資料庫中找出所有的高頻項(xiàng)目組,它們出現(xiàn)的頻率相對于所有組而言,達(dá)到或超過所設(shè)定的最小支持度。第二階段,從高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則,保證應(yīng)用該規(guī)則得到的結(jié)果可以達(dá)到最小的置信度。關(guān)聯(lián)規(guī)則在公安情報(bào)分析中的典型應(yīng)用是對犯罪行為規(guī)律的挖掘。運(yùn)用關(guān)聯(lián)規(guī)則可以發(fā)現(xiàn)犯罪分子的身份、年齡、地域等特征與其在實(shí)施犯罪行為中所使用的手段、特點(diǎn)、選擇的地點(diǎn)以及侵害對象等方面的關(guān)聯(lián)規(guī)律性,把具有相似特征的犯罪人員從海量數(shù)據(jù)中分揀出來,形成“高危人群”數(shù)據(jù)庫,利用高危人群數(shù)據(jù)庫指導(dǎo)

4、幫助案件偵破。2、聚類分析聚類分析方法主要是研究對象中各點(diǎn)之間存在的程度不同的相似性,根據(jù)對象屬性找出各點(diǎn)間相似程度的序列,把一些相似程度較大的點(diǎn)聚合為一類。在公安情報(bào)分析中,聚類分析方法應(yīng)用最廣泛??梢詫Ψ缸锸侄?、特點(diǎn)、作案時(shí)間等關(guān)鍵要素進(jìn)行挖掘,幫助分析人員確定具有較高相似度的案件,刻畫嫌疑人特征,并把看似不相關(guān)的案件進(jìn)行合并偵查??梢酝诰虬l(fā)現(xiàn)案件的高發(fā)時(shí)段、高發(fā)地區(qū)以及高發(fā)的作案手段,指導(dǎo)巡邏防控和情報(bào)預(yù)警。3、協(xié)同過濾協(xié)同過濾分析方法是在用戶群中找到指定用戶興趣相似的用戶,綜合這些相似用戶對某一信息的評價(jià),形成該指定用戶對此信息的喜好程度的預(yù)測。一般分為基于項(xiàng)目的協(xié)同過濾和基于用戶的協(xié)

5、同過濾。在公安實(shí)戰(zhàn)中,我們可以將案件(一串案件)發(fā)生軌跡視為“項(xiàng)目”,將嫌疑人活動(dòng)軌跡視為“對項(xiàng)目的偏好”,通過計(jì)算軌跡吻合度,推薦可能的犯罪嫌疑人。4、分類與回歸分類與回歸分析主要用于找出描述并區(qū)分?jǐn)?shù)據(jù)類的模型(或函數(shù)),以便能夠使用模型預(yù)測未知的對象類。分類分析的目的是學(xué)會(huì)一個(gè)分類模型,該模型能把數(shù)據(jù)庫中的項(xiàng)映射到給一組類別中的某一個(gè)類。在公安情報(bào)分析中,可以使用分類與回歸的分析方法,將特定的人員(例如:前科人員)映射到“高危人群”中,當(dāng)“高危人群”出現(xiàn)時(shí),出符合“犯罪內(nèi)容”特征的犯罪預(yù)警。三、案件串并和嫌疑人排查業(yè)務(wù)需求1、業(yè)務(wù)背景隨著“金盾工程”建設(shè)的深入開展,各級公安機(jī)關(guān)已經(jīng)逐步建立

6、了各類公共基礎(chǔ)信息資源庫、人員社會(huì)行為動(dòng)態(tài)信息資料庫和業(yè)務(wù)信息系統(tǒng),積累了大量的數(shù)據(jù)資源,這些數(shù)據(jù)資源和信息系統(tǒng)在輔助各級公安機(jī)關(guān)業(yè)務(wù)人員進(jìn)行案件調(diào)查工作和服務(wù)群眾等方面帶來了很大的幫助,在一定程度上提高了案件處理的效率和水平。但是,大部分公安機(jī)關(guān)對案件進(jìn)行串并、摸排嫌疑人仍停留在利用經(jīng)驗(yàn)積累進(jìn)行人工分析的初級階段。面對信息資源不斷增長的現(xiàn)狀,公安機(jī)關(guān)迫切需要運(yùn)用數(shù)據(jù)挖掘的思想和方法,對各類數(shù)據(jù)背后所蘊(yùn)涵的內(nèi)在的、必然的因果關(guān)系進(jìn)行挖掘,提高案件串并和嫌疑人排查工作效率。2、業(yè)務(wù)應(yīng)用場景由于犯罪行為動(dòng)力定型的穩(wěn)定性和犯罪心理的思維定式,系列犯罪案件的作案人在其不斷的犯罪活動(dòng)中的行為和特征具有穩(wěn)

7、定性和規(guī)律性。本文所描述的分析方法適用于具有連續(xù)作案行為特征的犯罪情報(bào)分析,例如:團(tuán)伙流竄案件、涉黑涉惡案件等可防性案件,不適用于偶發(fā)的、突發(fā)的“激情”犯罪。3、建設(shè)目標(biāo)使用成熟的圖形化展示工具,集成串并案分析、排查嫌疑人功能,建立一個(gè)面向情報(bào)分析人員的智能分析系統(tǒng)。系統(tǒng)具備自學(xué)習(xí)功能,提供便捷、有效的串并案模型和排查模型,促進(jìn)信息深度利用,提高公安機(jī)關(guān)信息化應(yīng)用水平、串并案和排查嫌疑人工作效率。4、業(yè)務(wù)流程(1)建立案件特征庫。分析已破案件特征,包括:案件類別、作案特點(diǎn)、作案時(shí)機(jī)、侵害對象、作案工具等項(xiàng)目,分別生成串并案模型。(2)建立違法犯罪人員特征庫。對已破案件以及相關(guān)的違法犯罪人員進(jìn)行

8、分析,挖掘案件特征與犯罪人員特征的潛在關(guān)聯(lián)關(guān)系,構(gòu)建“高危人群”數(shù)據(jù)庫。(3)運(yùn)用串并案模型,針對未破案件,開展案件串并,并推薦出可能作案的高危人群。(4)構(gòu)建違法犯罪人員活動(dòng)軌跡數(shù)據(jù)庫,包括:違法犯罪人員乘坐出租車軌跡,違法犯罪人員機(jī)動(dòng)車經(jīng)過卡口(電子警察)軌跡,違法犯罪人員手機(jī)經(jīng)過電子圍欄(基站)軌跡,違法犯罪人員上網(wǎng)、住宿、社??ㄏM(fèi)、公交(公共自行車)軌跡,重點(diǎn)人員本地金融活動(dòng)軌跡,違法犯罪人員室外活動(dòng)軌跡(基于天網(wǎng)工程人像比對發(fā)現(xiàn))。備注:違法犯罪人員機(jī)動(dòng)車包含其本人所有車輛、同住人和同戶人所有車輛。(5)將已串并案件的案發(fā)軌跡與符合高危特征的犯罪人員活動(dòng)軌跡疊加分析,計(jì)算時(shí)間和空間

9、上的吻合度,并推薦出未破案件的可能嫌疑人。四、詳細(xì)設(shè)計(jì)方案根據(jù)需求分析,實(shí)現(xiàn)業(yè)務(wù)應(yīng)用功能總體設(shè)計(jì)思路為:對數(shù)據(jù)進(jìn)行匯集、整合、建模,運(yùn)用數(shù)據(jù)挖掘算法發(fā)現(xiàn)和揭示數(shù)據(jù)中隱含的關(guān)聯(lián)關(guān)系,并使用圖形方式展示。項(xiàng)目總體邏輯架構(gòu)圖如下:圖1:總體邏輯架構(gòu)圖1、數(shù)據(jù)獲?。簩?shù)據(jù)挖掘的數(shù)據(jù)源進(jìn)行搜集整理。根據(jù)業(yè)務(wù)需求,搜集案件、嫌疑人、嫌疑人活動(dòng)軌跡信息,獲取數(shù)據(jù)源連接和訪問權(quán)限,對數(shù)據(jù)結(jié)構(gòu)進(jìn)行分析,完成找到數(shù)據(jù)的工作。根據(jù)需求和數(shù)據(jù)源狀況,確定數(shù)據(jù)更新方法、更新策略,選擇工具,本項(xiàng)目選擇。 數(shù)據(jù)源名稱來源策略備注刑事案件信息本地業(yè)務(wù)系統(tǒng)立案時(shí)間、每日、增量用于挖掘案件特征刑事案件現(xiàn)場勘驗(yàn)信息本地業(yè)務(wù)系統(tǒng)勘驗(yàn)

10、時(shí)間、每日、增量用于挖掘案件特征違法犯罪人員(本地)本地業(yè)務(wù)系統(tǒng)錄入時(shí)間、每日、增量按身份證去重,用于挖掘高危人群特征違法犯罪人員(全國)公安部下發(fā)每月、批量按身份證去重,用于挖掘高危人群特征戶籍人口本地業(yè)務(wù)系統(tǒng)錄入(修改)時(shí)間、每日、增量用于確定違法犯罪人員同戶人實(shí)有人口本地業(yè)務(wù)系統(tǒng)錄入(修改)時(shí)間、每日、增量用于確定違法犯罪人員同住人出租車軌跡以及乘客照片社會(huì)資源乘車時(shí)間、每日、增量照片比對確定身份,發(fā)現(xiàn)軌跡卡口過車信息本地業(yè)務(wù)系統(tǒng)過車時(shí)間、每日、增量發(fā)現(xiàn)軌跡電子警察抓拍信息本地業(yè)務(wù)系統(tǒng)抓怕時(shí)間、每日、增量發(fā)現(xiàn)軌跡電子圍欄和話單本地業(yè)務(wù)系統(tǒng)經(jīng)過(通話)時(shí)間、每日、增量發(fā)現(xiàn)軌跡網(wǎng)吧上網(wǎng)記錄本

11、地業(yè)務(wù)系統(tǒng)下網(wǎng)時(shí)間、每日、增量發(fā)現(xiàn)軌跡旅館住宿記錄本地業(yè)務(wù)系統(tǒng)入住時(shí)間、每日、增量發(fā)現(xiàn)軌跡社??ㄏM(fèi)記錄社會(huì)資源刷卡時(shí)間、每日、增量發(fā)現(xiàn)軌跡公交(公共自行車)刷卡記錄社會(huì)資源刷卡時(shí)間、每日、增量發(fā)現(xiàn)軌跡重點(diǎn)人員本地金融活動(dòng)記錄公安部下發(fā)刷卡時(shí)間、每日、增量發(fā)現(xiàn)軌跡違法犯罪人員室外活動(dòng)軌跡本地業(yè)務(wù)系統(tǒng)經(jīng)過時(shí)間、每日、增量圖像挖掘、圖片比對確定身份,發(fā)現(xiàn)軌跡表1:數(shù)據(jù)源表2、預(yù)處理:為數(shù)據(jù)挖掘提供符合要求數(shù)據(jù),包括數(shù)據(jù)清洗、轉(zhuǎn)換(標(biāo)準(zhǔn)化)、裝載、建模。采用數(shù)據(jù)抽取工具(),對收集的數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換及裝載,實(shí)現(xiàn)數(shù)據(jù)的整合、去重,向多維數(shù)據(jù)倉庫提供高質(zhì)量的數(shù)據(jù)。圖2:過程在此基礎(chǔ)上對數(shù)據(jù)進(jìn)行關(guān)

12、聯(lián)、建模,為情報(bào)分析研判提供可用的數(shù)據(jù)。根據(jù)業(yè)務(wù)特性,確定案件、犯罪人員以及犯罪人員活動(dòng)軌跡三個(gè)主題,區(qū)分維度數(shù)據(jù)表和事實(shí)數(shù)據(jù)表,建立數(shù)據(jù)倉庫模型。下圖為案件事實(shí)表以及相關(guān)維度表數(shù)據(jù)結(jié)構(gòu)示例。圖3:數(shù)據(jù)結(jié)構(gòu)實(shí)例(案件表)3、數(shù)據(jù)挖掘:使用挖掘算法進(jìn)行挖掘,找出有用的信息。(1)運(yùn)用聚類分析方法,對某地近十年來的已破刑事案件進(jìn)行分析,構(gòu)建刑事案件空間向量矩陣,矩陣的行為一起刑事案件的一個(gè)空間向量,矩陣的列為作案手段、選擇處所、選擇時(shí)間、作案特點(diǎn)等特征。采用聚類操作后,如果多個(gè)案件的多個(gè)或全部屬性都有相似性,就可以認(rèn)為這是一串案件,并形成一套分類規(guī)則,即案件串并模板。下圖展示了部分串并案模板。圖4

13、:案件串并模板示例圖5:案件串并模板示例(2)運(yùn)用關(guān)聯(lián)規(guī)則分析方法,對某地近十年來的已破刑事案件特征(I1:作案手段、I2:作案特點(diǎn)、I3:案件類型、I4:選擇處所)和犯罪分子特征(I5:戶籍地行政區(qū)劃)進(jìn)行關(guān)聯(lián),構(gòu)建數(shù)據(jù)庫事務(wù)集合D。運(yùn)用算法,掃描事務(wù)數(shù)據(jù)庫,產(chǎn)生候選項(xiàng)集,設(shè)置50,逐步迭代,產(chǎn)生頻繁k項(xiàng)集以及支持度計(jì)數(shù),k2且必須要包含I5:戶籍地行政區(qū)劃;設(shè)置80%,由頻繁k項(xiàng)集產(chǎn)生并輸出強(qiáng)關(guān)聯(lián)規(guī)則,得出高危人群數(shù)據(jù)庫。表2展示了運(yùn)用關(guān)聯(lián)規(guī)則分析方法分析的高危人群部分?jǐn)?shù)據(jù)樣本。I1作案手段I2作案特點(diǎn)I3案件類型I4選擇處所I5行政區(qū)劃區(qū)劃名稱迷信多人作案詐騙街面340823安徽樅陽縣技

14、術(shù)開鎖單人作案盜竊車內(nèi)財(cái)物路面411528河南息縣冒充軍人、干部單人作案詐騙412825河南上蔡縣撬防盜門入室作案入室盜竊工商企業(yè)430427湖南耒陽市利用口香糖技術(shù)開鎖入室作案入室盜竊居民小區(qū)431224湖南溆浦縣飛車搶奪多人作案搶奪440229廣東翁源縣插片開鎖多人作案入室盜竊452728廣西東蘭縣夜間攀爬翻窗多人作案入室盜竊居民小區(qū)513428四川涼山籍表2:高危人群樣例數(shù)據(jù)(3)運(yùn)用串并案模板對現(xiàn)行案件進(jìn)行串并,并根據(jù)案件特征(作案手段、作案特點(diǎn)、案件類型、選擇處所等)比對高危人群數(shù)據(jù)庫,推薦出可能作案的高危人群。圖6:運(yùn)用串并案模板進(jìn)行串并案件(4)建立符合可能作案的高危人群特征(戶

15、籍地)的違法犯罪人員活動(dòng)軌跡數(shù)據(jù)庫,構(gòu)建案件軌跡與嫌疑人員活動(dòng)軌跡的空間和時(shí)間矢量矩陣,通過計(jì)算矢量距離,推導(dǎo)出與案件時(shí)間、軌跡吻合度最高,且符合案件特征的可能的作案嫌疑人。表3展示了一串案件發(fā)生時(shí),6個(gè)符合特征的嫌疑人手機(jī)位置與案件發(fā)生地點(diǎn)的空間矢量距離,表示沒有發(fā)現(xiàn)其活動(dòng)信息。嫌疑人1嫌疑人2嫌疑人3嫌疑人4嫌疑人5嫌疑人6案件1325m589m案件2600m400m5060m案件3160m2430m3680m案件4400m890m280m表3:嫌疑人手機(jī)位置與案件發(fā)生地點(diǎn)的空間矢量矩陣通過對表3的數(shù)據(jù)進(jìn)行分析,可以初步判定嫌疑人1、嫌疑人2、嫌疑人3具有重大嫌疑。在實(shí)際操作中,單一種類軌跡構(gòu)成的矩陣可能非常稀疏,往往需要將多種軌跡信息進(jìn)行疊加分析,以提高分析的準(zhǔn)確性。4、用戶界面:將數(shù)據(jù)挖掘通過可視化的方法展示給用戶。(1)數(shù)據(jù)挖掘過程具有高度的交互性,在涉及多維數(shù)據(jù)挖掘的過程中,要構(gòu)建靈活的用戶界面和探索式的挖掘環(huán)境。在串并案模板挖掘過程中,我們采用構(gòu)建立方體()的方法,允許用戶運(yùn)用知識背景進(jìn)行下鉆、切片、維度旋轉(zhuǎn)、設(shè)置度量等操作。(2)數(shù)據(jù)挖掘結(jié)果展示采用可視化圖形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論