版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
服刑人員書(shū)信智能審查方法研究摘要:信件作為犯人和家人聯(lián)絡(luò)的主要途徑,長(zhǎng)期以來(lái)遭到嚴(yán)格的管制。該文重要討論了怎樣更人性化、自動(dòng)化的實(shí)現(xiàn)信件的審閱,在保證改造經(jīng)過(guò)順利進(jìn)行的前提下,更好的尊敬服刑人員的隱私權(quán)。智能化的方法在提升工作效率的同時(shí)節(jié)省了人力。本文關(guān)鍵詞語(yǔ):通信自在;書(shū)信審查;智能算法通訊自在與通訊機(jī)密是憲法賦予每一個(gè)公民的基本權(quán)利,,〔監(jiān)獄法〕中規(guī)定服刑人員信件應(yīng)遭到檢查,即限制服刑人員通信自在與通信機(jī)密與〔憲法〕規(guī)定的公民通信自在權(quán)存在沖突,單純的依靠法律知識(shí)難以解決能否以及怎樣對(duì)服刑人員書(shū)信進(jìn)行審核的難題。1.傳統(tǒng)的書(shū)信審查制度存在的問(wèn)題〔監(jiān)獄法〕在服刑人員服刑期間通信方面作了十分規(guī)定:“罪犯在服刑期間能夠與別人通信,但是來(lái)往信件應(yīng)當(dāng)經(jīng)過(guò)監(jiān)獄檢查。監(jiān)獄發(fā)現(xiàn)有礙罪犯改造內(nèi)容的信件,能夠扣留。罪犯寫(xiě)給監(jiān)獄的上級(jí)機(jī)關(guān)和司法機(jī)關(guān)的信件,不受檢查〞?!矐椃ā车?3條規(guī)定,公民的合法的私有產(chǎn)業(yè)不受進(jìn)犯。國(guó)家為了公共利益的需要,能夠按照法律規(guī)定對(duì)公民的私有產(chǎn)業(yè)實(shí)行征收或者征用并給予補(bǔ)償。憲法規(guī)定的公民通信自在與通信機(jī)密包含兩方面內(nèi)涵:一是通信自在,公民在與別人交往中,通過(guò)信件、電話、傳真、電子郵件等形式表達(dá)自在意愿的自在,任何組織和個(gè)人不得非法干預(yù);二是通信機(jī)密,指公民與別人的通信內(nèi)容,任何組織和個(gè)人不得竊聽(tīng)、偷看、傳播,或以非法方式獲取。兩者結(jié)合起來(lái)構(gòu)成了完好的通信自在權(quán)。〔監(jiān)獄法〕的“限制規(guī)定〞與〔憲法〕“前提〞不相吻合[1]。第一,憲法并未授予監(jiān)獄機(jī)關(guān)檢查信件的權(quán)利,即主體資格不能成立。第二,“有礙改造〞作為扣留信件理由不充足,與立憲目的也不符。第三,檢查手段缺乏憲法及現(xiàn)實(shí)合理根據(jù)。。純潔從法律的角度去解決此問(wèn)題困難重重。引進(jìn)監(jiān)測(cè)儀,以一種愈加科學(xué)、精確、高效的手段解決此問(wèn)題勢(shì)在必行。2.垃圾郵件處理帶來(lái)的啟示在因特網(wǎng)的各種效勞中,電子郵件是最基本的效勞之一。一般來(lái)說(shuō),但凡未經(jīng)用戶答應(yīng)就強(qiáng)行發(fā)送到用戶的郵箱中的任何電子郵件就稱為垃圾郵件。垃圾郵件一般具有批量發(fā)送的特征。其內(nèi)容包含賺錢信息、成人廣告、商業(yè)或個(gè)人網(wǎng)站廣告、電子雜志、連環(huán)信等。人們?cè)谙硎茈娮余]件提供的方便的同時(shí),也在遭到垃圾郵件的困擾[2]。中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)反垃圾郵件中心在年月日發(fā)布的〔年第四次中國(guó)反垃圾郵件狀態(tài)調(diào)查報(bào)告〕顯示,中國(guó)互聯(lián)網(wǎng)用戶平均每周收到垃圾郵件16.71封,已經(jīng)連續(xù)屢次跨越了正常郵件的數(shù)量。大量的垃圾郵件不僅占用了網(wǎng)絡(luò)傳輸帶寬,影響正常網(wǎng)絡(luò)通信,更浪費(fèi)了人們的時(shí)間和精神。對(duì)垃圾郵件的過(guò)濾方法得到了普遍的關(guān)注。當(dāng)前重要的垃圾郵件過(guò)濾技術(shù)有3類:1基于域名和路由等的過(guò)濾技術(shù):包含黑白名單、實(shí)時(shí)黑名單、反向域名檢測(cè)等技術(shù);2基于行為的過(guò)濾技術(shù):包含過(guò)濾群發(fā)、流量監(jiān)控、挑戰(zhàn)回應(yīng)和蜜罐技術(shù)等;3基于內(nèi)容的過(guò)濾技術(shù):包含規(guī)則〔集〕匹配、樸素貝葉斯、支持向量機(jī)、近鄰法、最大熵值法等。基于內(nèi)容的過(guò)濾技術(shù)是當(dāng)前垃圾郵件過(guò)濾技術(shù)應(yīng)用的主流,即通過(guò)對(duì)郵件內(nèi)容的判定,來(lái)確定能否為垃圾郵件?;趦?nèi)容的垃圾郵件處理的理論基礎(chǔ)來(lái)源于文本分類技術(shù),一個(gè)文本〔下面基本不區(qū)分“文本〞和“文檔〞兩個(gè)詞的含義〕分類問(wèn)題就是將一篇文檔歸入預(yù)先定義的幾個(gè)類別中的一個(gè)或幾個(gè),而文本的自動(dòng)分類則是使用計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)這樣的分類。文本分類是用電腦對(duì)文本集根據(jù)一定的分類體系或標(biāo)準(zhǔn)進(jìn)行自動(dòng)分類標(biāo)記,與文本分類相近的概念是文本聚類。文本聚類是指,由機(jī)器將類似的文檔歸在一起。與文本分類的區(qū)別在于,文本分類是監(jiān)督學(xué)習(xí),類別是事先規(guī)定好的,文本聚類是無(wú)監(jiān)督學(xué)習(xí),由計(jì)算機(jī)把類似文本歸在一起,事先并不劃定好類別。文本分類基本方法能夠歸結(jié)為根據(jù)待分類數(shù)據(jù)的某些特征來(lái)進(jìn)行匹配,選擇最優(yōu)的匹配結(jié)果,進(jìn)而實(shí)現(xiàn)分類。計(jì)算機(jī)并不認(rèn)識(shí)文檔,因而首先就要設(shè)法怎樣轉(zhuǎn)化一篇文檔為計(jì)算機(jī)所承受,轉(zhuǎn)化方法要與文本有對(duì)應(yīng)關(guān)系。對(duì)于計(jì)算機(jī)文本分類而言,這是最主要的步驟。文本分類和垃圾郵件領(lǐng)域知識(shí)的成熟為信件的智能化處理提供了理論基礎(chǔ),相關(guān)方法的嘗試一定會(huì)使長(zhǎng)期以來(lái)困擾的書(shū)信問(wèn)題得到解決。人工智能是一門很年輕的新興學(xué)科,但其應(yīng)用的領(lǐng)域卻特別廣泛,包含問(wèn)題求解、形式辨別、符號(hào)運(yùn)算、天然語(yǔ)言理解、智能檢索、機(jī)器證明、專家系統(tǒng)、機(jī)器人學(xué)等幾個(gè)方面。下面?zhèn)戎亟榻B其中的四種?!?〕問(wèn)題求解問(wèn)題求解是人工智能研究的一個(gè)主要方面。人工智能的很多概念,如:歸納、推斷、、規(guī)劃等都與問(wèn)題求解有關(guān)?!?〕專家系統(tǒng)專家系統(tǒng)是一個(gè)智能計(jì)算機(jī)程序系統(tǒng),其內(nèi)部含有大量的某個(gè)領(lǐng)域?qū)<宜降闹R(shí)與經(jīng)歷體驗(yàn),能夠利用人類專家的知識(shí)和解決問(wèn)題的方法來(lái)處理該領(lǐng)域問(wèn)題。也就是說(shuō),專家系統(tǒng)是一個(gè)具有大量的專門知識(shí)與經(jīng)歷體驗(yàn)的程序系統(tǒng),它應(yīng)用人工智能技術(shù)和計(jì)算機(jī)技術(shù),根據(jù)某領(lǐng)域一個(gè)或多個(gè)專家提供的知識(shí)和經(jīng)歷體驗(yàn),進(jìn)行推理和判定,模仿人類專家的決策經(jīng)過(guò),以便解決那些需要人類專家處理的復(fù)雜問(wèn)題,簡(jiǎn)而言之,專家系統(tǒng)是一種模仿人類專家解決領(lǐng)域問(wèn)題的計(jì)算機(jī)程序系統(tǒng).〔3〕機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)(MachineLearning)是研究計(jì)算機(jī)如何模仿或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,從新組織已有的知識(shí)構(gòu)造使之不斷改善本身的性能。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它重要使用歸納、綜合而不是演繹。機(jī)器學(xué)習(xí)的研究,重要在下面三個(gè)方面進(jìn)行:一是研究人類學(xué)習(xí)的機(jī)理、人腦思維的經(jīng)過(guò);二是研究機(jī)器學(xué)習(xí)的方法以及建立針對(duì)詳細(xì)任務(wù)的學(xué)習(xí)系統(tǒng)[3]。〔4〕形式辨別形式辨別(PatternRecognition)是指對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描繪敘述、分辨體認(rèn)、分類和解釋的經(jīng)過(guò),是信息科學(xué)和人工智能的主要構(gòu)成部分。形式辨別又常稱作形式分類,從處理問(wèn)題的性質(zhì)和解決問(wèn)題的方法等角度,形式辨別分為有監(jiān)督的分類〔SupervisedClassification〕和無(wú)監(jiān)督的分類(UnsupervisedClassification)兩種3.智能化的書(shū)信審查方法智能化的書(shū)信審查方法牽涉到了計(jì)算機(jī)的多個(gè)研究領(lǐng)域,詳細(xì)的實(shí)現(xiàn)方法如下:(1)信息辨別。即怎樣把服刑人員手寫(xiě)的內(nèi)容轉(zhuǎn)化了計(jì)算機(jī)能夠辨別的信息。這是形式辨別領(lǐng)域的一個(gè)課題。形式辨別(PatternRecognition)是指對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描繪敘述、分辨體認(rèn)、分類和解釋的經(jīng)過(guò),是信息科學(xué)和人工智能的主要構(gòu)成部分,它能夠辨別字符、字母、公式等多種信息。每個(gè)人的筆體不一樣,辨別的效果也就有差別。〔2〕分詞。對(duì)于中文文本而言[4],由于詞與詞之間沒(méi)有明顯的切分標(biāo)記,所以首先需要對(duì)中文文本進(jìn)行分詞。如今的分詞方法固然有多種,但歸納起來(lái)不過(guò)乎兩種:一類是機(jī)械式分詞法,一般以分詞詞典為根據(jù),通過(guò)文檔中的漢字串和詞表中的詞逐一匹配來(lái)完成詞的切分。另一類是理解式分詞法,即利用漢語(yǔ)的語(yǔ)法知識(shí)和語(yǔ)義知識(shí)以及心理學(xué)知識(shí)進(jìn)行分詞,需要建立分詞數(shù)據(jù)庫(kù)、知識(shí)庫(kù)和推理庫(kù)。后者可謂是理想的方法,但在語(yǔ)法分析、語(yǔ)義分析乃至篇章理解還沒(méi)有得到解決之前,其分詞系統(tǒng)重要采取機(jī)械分詞法,或者介于二者之間的某種分詞方法?!?〕特征選擇。一封信件經(jīng)過(guò)預(yù)處理后即被表示為一個(gè)特征空間[5],但此特征空間的維數(shù)必定很大,假如直接在這里基礎(chǔ)上進(jìn)行分類,將對(duì)分類造成很大的負(fù)擔(dān),因而必需在分類之前對(duì)特征空間進(jìn)行維數(shù)約減,保留下對(duì)分類奉獻(xiàn)最大的那些特征。如“的〞、“非常〞等一些詞就會(huì)略去,由于它們對(duì)文本分類的奉獻(xiàn)非常小。所謂特征選擇就是從特征集中選擇一個(gè)真子集,知足。其中,為原始特征集的大小,為選擇后的特征集大小。選擇的原則是特征選擇后能有效提升文本精確率。選擇沒(méi)有改變?cè)继卣骺臻g的性質(zhì),只是從原始特征空間中選擇了一部分主要的特征,構(gòu)成一個(gè)新的低維空間?!?〕文本分類算法。選擇樸素貝葉斯算法作為分類算法。貝葉斯分類器是將貝葉斯定理應(yīng)用到文本分類領(lǐng)域,通過(guò)計(jì)算屬于各個(gè)類其余概率,將文本歸為概率最大的一類。算法描繪敘述如下:1、每個(gè)書(shū)信樣本用一個(gè)維特征向量表示,分別描繪敘述對(duì)個(gè)屬性樣本的個(gè)度量,每個(gè)關(guān)鍵字為1個(gè)度量。2、和兩個(gè)類分別代表正常信件和問(wèn)題信件。樣本屬于某個(gè)類的概率為:(1)式〔1〕表示在給定文檔的條件下,屬于類其余概率〔稱為后驗(yàn)概率〕。所以對(duì)文檔分類的問(wèn)題就轉(zhuǎn)化為計(jì)算的值,使獲得最大值的那個(gè)類別就是所屬的類別。假定特征項(xiàng)間條件獨(dú)立,即屬性間不存在依靠關(guān)系,即假設(shè)每個(gè)特征變量在給定類別變量下都是獨(dú)立的。(2)4.其他可供選擇的過(guò)濾方法支持向量機(jī)〔SVM〕是構(gòu)建在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的新的學(xué)習(xí)方法,它的優(yōu)越性重要表如今:1〕它是針對(duì)小樣本空間進(jìn)行優(yōu)化的算法,而不是針對(duì)無(wú)限樣本優(yōu)化算法;2〕算法將原始問(wèn)題轉(zhuǎn)換成為一個(gè)對(duì)偶優(yōu)化問(wèn)題,這樣能夠有效得避免象神經(jīng)網(wǎng)絡(luò)一樣獲得部分最優(yōu)解,而獲得全局最優(yōu)解;3〕算法將原始問(wèn)題映射到新的高維空間下,這樣在原始空間下非線性問(wèn)題在新的特征空間下變換為線性問(wèn)題;4〕由于算法是構(gòu)建在構(gòu)造風(fēng)險(xiǎn)最小化原則基礎(chǔ)上,而非經(jīng)歷體驗(yàn)風(fēng)險(xiǎn)最小化原則上。支持向量機(jī)重要是用來(lái)處理二類問(wèn)題的。在原始數(shù)據(jù)空間中,假如存在一個(gè)線性函數(shù)無(wú)毛病的把數(shù)據(jù)分開(kāi),那么稱該數(shù)據(jù)集完全線性可分;假如存在一個(gè)線性函數(shù)能夠以低毛病率把數(shù)據(jù)分開(kāi),則稱該數(shù)據(jù)集是近似線性可分;假如存在非線性函數(shù)把數(shù)據(jù)集分開(kāi),則稱該數(shù)據(jù)集非線性可分。基于支持向量機(jī)的垃圾短信過(guò)濾方法。該方法根據(jù)短信內(nèi)容作為出發(fā)點(diǎn),利用支持向量機(jī)算法對(duì)短信文本進(jìn)行分類辨別,進(jìn)而完成對(duì)垃圾短信的過(guò)濾。核心思想為以為新建分為兩種可能及合格與不合格,利用支持向量機(jī)的二類分類特性進(jìn)行分類。聚類方法能夠從某些角度去解決此問(wèn)題。將物理或抽象的集合分構(gòu)成為由類似的對(duì)象構(gòu)成的多個(gè)類的經(jīng)過(guò)稱為聚類。由聚類所生產(chǎn)的是一組數(shù)據(jù)對(duì)象的組合,這些對(duì)象與同一個(gè)簇中的對(duì)象相互類似,與其它簇中的對(duì)象相異。在很多應(yīng)用中,能夠?qū)⒁粋€(gè)簇的數(shù)據(jù)對(duì)象作為一個(gè)整體來(lái)對(duì)待。聚類分析與分類不同,它要?jiǎng)澐值念悇e是未知的。聚類分析源于很多研究領(lǐng)域,包含數(shù)據(jù)發(fā)掘、統(tǒng)計(jì)學(xué)、生物學(xué)、以及機(jī)器學(xué)習(xí)。它在許多方面有著廣泛的應(yīng)用。核心思路為將新建數(shù)據(jù)分成兩類。5.結(jié)論本文嘗試通過(guò)計(jì)算機(jī)當(dāng)中形式辨別和機(jī)器學(xué)習(xí)中文本分類的知識(shí)解決服刑人員書(shū)信審查的問(wèn)題。從計(jì)算機(jī)的角度解決此問(wèn)題對(duì)于監(jiān)獄信息化、科技化有著深遠(yuǎn)意義。文中的貝葉斯算法只是諸多算法中的一種,對(duì)于不同的數(shù)據(jù)不同的算法有著不同的效果,鑒于本文描繪敘述文本即書(shū)信性質(zhì)的特殊性,哪種算法更合適尚待論證。以下為參考文獻(xiàn):[1]溫澤彬。服刑人員信件檢查的憲法分析[J],西南政法大學(xué)學(xué)報(bào);2008年03期。[2]張付志,伍朝輝,姚芳?;谪惾~斯算法的垃圾郵件過(guò)濾技術(shù)的研究與改良[J]。燕山大
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度360有錢聯(lián)盟(拓展版)數(shù)字貨幣交易服務(wù)合作協(xié)議2篇
- 2024有試用期勞動(dòng)合同范本與試用期管理策略解析3篇
- 2025年數(shù)字貨幣支付系統(tǒng)合作協(xié)議模板3篇
- 二零二四年度餐飲采購(gòu)合同某酒店與某咖啡機(jī)供應(yīng)商之間的供需協(xié)議
- 2024影視制作公司與網(wǎng)絡(luò)視頻平臺(tái)版權(quán)購(gòu)買協(xié)議
- 2025年度文化娛樂(lè)產(chǎn)業(yè)財(cái)產(chǎn)保全擔(dān)保協(xié)議3篇
- 紡織品基本知識(shí)培訓(xùn)課件
- 2024年物聯(lián)網(wǎng)安全保密協(xié)議3篇
- 2024年黃金交易平臺(tái)運(yùn)營(yíng)協(xié)議
- 2024年薪酬管理服務(wù)外包協(xié)議范本版B版
- 學(xué)校2025年寒假特色實(shí)踐作業(yè)綜合實(shí)踐暨跨學(xué)科作業(yè)設(shè)計(jì)活動(dòng)方案
- 2024數(shù)據(jù)資源采購(gòu)及運(yùn)營(yíng)管理合同3篇
- 人教版小學(xué)數(shù)學(xué)一年級(jí)上冊(cè)20以內(nèi)加減混合口算練習(xí)題全套
- 兒童青少年行為和情緒障礙的護(hù)理
- 《業(yè)務(wù)員銷售技巧》課件
- 《汽車涂裝》2024-2025學(xué)年第一學(xué)期工學(xué)一體化課程教學(xué)進(jìn)度計(jì)劃表
- 自升式塔式起重機(jī)安裝與拆卸施工方案
- 2024年物流運(yùn)輸公司全年安全生產(chǎn)工作計(jì)劃例文(4篇)
- 期末卷(一)-2023-2024學(xué)年高一年級(jí)地理上學(xué)期高頻考題期末測(cè)試卷(江蘇專用)(原卷版)
- QCT1067.5-2023汽車電線束和電器設(shè)備用連接器第5部分:設(shè)備連接器(插座)的型式和尺寸
- 廣西基本醫(yī)療保險(xiǎn)門診特殊慢性病申報(bào)表
評(píng)論
0/150
提交評(píng)論