2012美賽論文翻譯--逮捕罪犯模型.docx_第1頁
2012美賽論文翻譯--逮捕罪犯模型.docx_第2頁
2012美賽論文翻譯--逮捕罪犯模型.docx_第3頁
2012美賽論文翻譯--逮捕罪犯模型.docx_第4頁
2012美賽論文翻譯--逮捕罪犯模型.docx_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

逮捕罪犯模型你的組織,ICM正在對一項密謀的犯罪行動進行調(diào)查。調(diào)查人員非常清楚一些參與密謀的人,希望能夠確定其他成員和他們的領(lǐng)導(dǎo)之后進行逮捕。罪犯和犯罪嫌疑人都在一家大的公司的一個綜合辦公室里工作。這家公司成長很快并以自己的名字命名在研發(fā)一種軟件并面向銀行和信用卡公司銷售。ICM最近發(fā)現(xiàn)了這個公司82名員工一小部分的信息,相信可以幫助他們找到最有可能的未知合伙人和領(lǐng)導(dǎo)。因為信息業(yè)務(wù)是面向所有的員工,因此很有可能一些(可能一大部分)指定的溝通員并不涉及此次的密謀。實際上,調(diào)查人員很清楚有一部分的人并不涉及此案。建模的目標(biāo)就是確定這個綜合辦公室里誰最有可能是罪犯。列一個有先后次序的列表有助于ICM實施監(jiān)督,并進一步審問。明確的劃分共犯和非共犯也能幫助區(qū)分每組的人員。當(dāng)然如果指出密謀的領(lǐng)導(dǎo)者對DA公司也會有幫助。在給出這次案件數(shù)據(jù)之前,你的主管給了你一份她幾年前在別的城市工作的這種情況的方案(調(diào)查EZ)。盡管她對自己調(diào)查EZ的案子很滿意,但她說那只是個小的簡單的例子,并會對你理解你的任務(wù)有所幫助。她給的數(shù)據(jù)如下:她認(rèn)為有十個人是共犯:Anne#, Bob, Carol, Dave*, Ellen, Fred,George*, Harry, Inez, and Jaye#.(*表示這其中共犯可能性大的,#表示非共犯可能性大的)。28個信息的年表她基于自己的分析都做了相應(yīng)的標(biāo)號:Anne to Bob:你今天為什么遲到?(1)Bob to Carol:那個死Anne總是監(jiān)督我。我沒遲到(1)Carol to Dave:Anne和Bob又在爭論著Bob的磨嘰。(1)Dave to Ellen:我今天早上要見你。你什么時候來?把預(yù)算文檔帶來。(2)Dave to Fred:我今天什么時候都能去見你。告訴我什么時候合適。我需要帶預(yù)算文檔么?(2)Dave to George:我待會兒去見你要談好多事情。我希望其他人的也準(zhǔn)備好了。把這些弄好了很重要。(3)Harry to George:你壓力太大了。到底怎么了?我們的預(yù)算會沒問題的。(2)(4)Inez to George:我今天特累。你過得怎么樣?(5)I也很累Jaye to Inez:沒什么進展。想去吃午餐么?(5)Inez to Jaye:幸好很安靜。我很累。今天不去吃午飯了,對不起?。?)George to Dave:該談?wù)劻爽F(xiàn)在?。?)Jaye to Anne:你今天去吃午飯么?(5)Dave to George:不行。我在正要去見Fred的路上呢。(3)George to Dave:去完那兒到這兒來。(3)Anne to Carol:誰該監(jiān)督Bob?他總是游手好閑。(1)Carol to Anne:別管他。他和George and Dave一起工作的很好。(1)George to Dave:這很重要。該死的Fred。Ellen那邊怎么樣了?(3)沒準(zhǔn)可以推出E是Ellen to George:你跟Dave談了么?(3)George to Ellen:還沒呢。你呢?(3)Bob to Anne:我沒遲到。就像你知道的我午飯時間都在干活。(1)Bob to Dave:告訴他們我沒遲到。你了解我的。(1)只有D了解BEllen to Carol:找Anne并確定好下周預(yù)算會議的程序,還要幫我把George冷靜下來。(2)Harry to Dave:你沒發(fā)現(xiàn)今天George又壓力特大么?(4)Dave to George:死Harry認(rèn)為你壓力太大了。別讓他擔(dān)心否則他又該絮叨了。(4)George to Harry:就是總是加班再加上家里出了些問題。我會沒事的。(4)H不是Ellen to Harry:如果我錯過了今天的會,有事么?Fred會在的而且他比我更了解預(yù)算。(2)Harry to Fred:我認(rèn)為明年的預(yù)算對許多人都施加了壓力。也許我們今天需要花點時間給他們減減壓了。(2)(4)Fred to Harry:我認(rèn)為我們的預(yù)算很健康。我看不到任何有壓力的東西。(2)信息量結(jié)束。你的主管指出她只破解信息中五個不同的主題:1)Bob很磨嘰,2)預(yù)算,3)重要的位置問題但是假設(shè)是密謀的一部分,4)George的壓力,5)午飯和其他的社會問題。在信息的編碼中可以看到,有些信息根據(jù)內(nèi)容有兩個主題。你主管分析她的情況時用的是一個顯示溝通聯(lián)系和信息種類的網(wǎng)絡(luò)的方法。下面的圖表是一個信息網(wǎng)絡(luò)的模型以及結(jié)果中的信息種類的編碼都標(biāo)注在網(wǎng)絡(luò)圖里。你的主管指出已知的共犯George and Dave, 和Ellen and Carol是通過分析得出的,以及后來Bob自己為了減刑承認(rèn)犯罪了,但是對于Carol的指控后來撤消了。你的主管也十分確定Inez也涉及此案,但是始終無法對她立案。你的主觀的建議是你們組一定要明確犯罪雙方這樣像Inez人就不會逃跑了,也不會有人像Carol一樣被誤判,同時ICM需要有信譽這樣就不會有人像Bob一樣有機會減刑。你的主管為當(dāng)前的案例整理了一個網(wǎng)絡(luò)式的數(shù)據(jù)庫,以同樣的格式,但是范圍更大些。調(diào)查人員提示說這個密謀是有關(guān)挪用公司基金以及用互聯(lián)網(wǎng)詐騙盜取那些與公司有業(yè)務(wù)往來的那些人的信用卡的錢。主管給你看的EZ小例子只有10個人(節(jié)點),27條線(信息),5個話題,1個密謀話題,2個已知共犯和2個已知的非共犯。到目前為止,新的情況(case)有83個節(jié)點, 400連接(其中一些涉及超過1個主題),消息流量已超過21000字,15個主題(其中3個已被視為是可疑的),7個已知的同謀者,和8個已知的非同謀。這些數(shù)據(jù)在所附的電子表格文件中: names.xls , Topics.xls , Messages.xls 。 names.xls包含關(guān)鍵節(jié)點序號的辦公室人員名字。topics.xls包含15個主題號碼的代碼,也就是一個主題的簡短說明。由于安全和隱私問題,你的小組不會有直接傳達(dá)的所有信息流量。messages.xls提供傳播消息的鏈接節(jié)點(links of the nodes)和消息中包含的主題代碼。幾個消息包含了三個話題。為了幫忙顯現(xiàn)(visualize可視化)消息流量,圖2提供了人和消息鏈接(the people and message links)的網(wǎng)絡(luò)模型。在這種情況下,這些消息的話題沒有被表示出來因為在圖1中表示了。這些話題的編號在文件Messages.xls中給出了,而且在文件Topics.xls中描述了。要求1:到目前為止,已經(jīng)知道Jean, Alex, Elsie, Paul, Ulf, Yao, 和Harvey是同謀。也知道,Darlene, Tran, Jia, Ellin, Gard, Chris, Paige, 和Este不是同謀。三個有嫌疑的消息主題(suspicious message topics)是7、11和13. 更多關(guān)于消息主題的細(xì)節(jié)在文件Topics.xls中。按照屬于同謀的可能性大小建立模型和算法,把83個節(jié)點(人)區(qū)分優(yōu)先次序,并解釋你的模型和指標(biāo)。Jerome, Delores, 和Gretchen是公司的高級管理人員。如果了解到他們其中任何一個人涉及到陰謀,將是非常有益的。要求2:如果有新信息確定了topic 1與犯罪相關(guān),而且Chris是其中一個同謀者,那么這個優(yōu)先清單會怎樣變化?要求3:獲得和理解與這個消息流量(message traffic)類似的文本信息的一個強大的技術(shù)叫做語義網(wǎng)絡(luò)分析;作為一個在人工智能和計算語言學(xué)的方法,它提供了有關(guān)的知識(消息)或語言推理的結(jié)構(gòu)和步驟。另一種在自然語言處理過程中的計算語言學(xué)能力是文本分析。就我們的罪犯逮捕方案來講,解釋清楚對消息流量的內(nèi)容和背景的語義分析和文本分析(如果你能獲得原始信息)怎樣才能使你的團隊來開發(fā)更好的模型并進行辦公室人員的分類。你對文件Topics.xls中的對話主題描述,是否用了這些capabilities(語義網(wǎng)絡(luò)分析、文本分析)來提高你的模型了么?要求4:您的完整報告將最終送到 DA,所以它必須詳細(xì)而清楚地說明你的假設(shè)和方法,但不能超過20頁。你可以以單獨的文件形式在附件中提交你的程序,而這是不計算在你的頁面限制內(nèi)的,但提交這些程序并不是必需的。你的supervisor希望ICM成為世界上最好的解決白領(lǐng)階層高科技犯罪的組織,希望你們的方法有助于解決世界各地的重要案件,尤其是那些消息流量(message traffic)數(shù)據(jù)非常龐大的案件(成千上萬的人與數(shù)以萬計的消息,并可能包括以百萬計的單詞量)。她特別要求你的報告要包括“更深入的進行消息內(nèi)容的網(wǎng)絡(luò)、語義和文本分析 怎樣對你的模型和建議有幫助”這一討論。作為給她報告的一部分,解釋你已經(jīng)使用的網(wǎng)絡(luò)模型技術(shù)以及他們?yōu)槭裁匆约霸鯓幽軌蛟谌魏晤愋偷木W(wǎng)絡(luò)數(shù)據(jù)庫中被用來識別(確定)、區(qū)分優(yōu)先次序和分類類似的節(jié)點,而不只是限于有關(guān)犯罪陰謀和消息數(shù)據(jù)。例如,當(dāng)你有表明感染機率的節(jié)點并已確定了一些感染節(jié)點的各種圖像或化學(xué)數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論