北交大計(jì)算機(jī)論文_第1頁(yè)
北交大計(jì)算機(jī)論文_第2頁(yè)
北交大計(jì)算機(jī)論文_第3頁(yè)
北交大計(jì)算機(jī)論文_第4頁(yè)
北交大計(jì)算機(jī)論文_第5頁(yè)
已閱讀5頁(yè),還剩65頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、高等教育自學(xué)考試畢業(yè)設(shè)計(jì)(論文)北京交通大學(xué)70畢業(yè)設(shè)計(jì)(論文)裝訂規(guī)范1、畢業(yè)設(shè)計(jì)(論文)封皮;2、畢業(yè)設(shè)計(jì)(論文)評(píng)議意見(jiàn)書;3、畢業(yè)設(shè)計(jì)(論文)任務(wù)書;4、開(kāi)題報(bào)告;5、中文摘要;6、畢業(yè)設(shè)計(jì)(論文)目錄;7、畢業(yè)設(shè)計(jì)(論文)正文;8、參考文獻(xiàn);9、附錄。北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文)題目:基于網(wǎng)絡(luò)數(shù)據(jù)包郵件信息的獲取與還原技術(shù)研究姓名: 周理根 專業(yè):計(jì)算機(jī)應(yīng)用軟件工作單位: 職 務(wù): 準(zhǔn)考證號(hào): 050213100650 設(shè)計(jì)(論文)指導(dǎo)教師: 發(fā)題日期: 年 月 日完成日期: 年 月 日畢業(yè)設(shè)計(jì)(論文)評(píng)議意見(jiàn)書專業(yè)計(jì)算機(jī)應(yīng)用軟件姓 名周理根題目基于網(wǎng)絡(luò)數(shù)據(jù)包郵件信息的獲取與還原技術(shù)

2、研究指導(dǎo)教師評(píng)閱意見(jiàn)成績(jī)?cè)u(píng)定: 指導(dǎo)教師: 年 月 日答辯組意見(jiàn)答辯組負(fù)責(zé)人:年 月 日備注畢業(yè)設(shè)計(jì)(論文)任務(wù)書畢業(yè)設(shè)計(jì)(論文)題目:基于網(wǎng)絡(luò)數(shù)據(jù)包郵件信息的獲取與還原技術(shù)研究一、畢業(yè)設(shè)計(jì)(論文)內(nèi)容通過(guò)分析郵件格式,郵件傳輸?shù)膬煞N方式,討論與郵件相關(guān)的若干問(wèn)題,主要包括網(wǎng)絡(luò)數(shù)據(jù)包的捕獲,基于SMTP/POP3協(xié)議的郵件信息獲取技術(shù)以及基于HTTP協(xié)議的Webmail郵件信息獲取技術(shù),論述一個(gè)基于java系統(tǒng)對(duì)電子郵件內(nèi)容進(jìn)行還原。 二、基本要求了解郵件技術(shù),熟悉java語(yǔ)言,討論基于網(wǎng)絡(luò)數(shù)據(jù)包(數(shù)據(jù)鏈路層幀)的郵件信息獲取技術(shù),包括網(wǎng)絡(luò)數(shù)據(jù)包的捕獲與重組、基于SMTP/POP3協(xié)議郵件信息

3、的識(shí)別與獲取以及基于HTTP協(xié)議的Webmail郵件信息識(shí)別與獲取?;谶@兩種方式的郵件格式的基礎(chǔ)上,討論了基于網(wǎng)絡(luò)數(shù)據(jù)包的郵件還原系統(tǒng)的相關(guān)問(wèn)題。以達(dá)到對(duì)電子郵件進(jìn)行網(wǎng)絡(luò)監(jiān)視的目的。 三、重點(diǎn)研究的問(wèn)題1、熟悉電子郵件技術(shù)。2、java技術(shù)簡(jiǎn)介。3、分析電子郵件的格式。4、基于SMTP/POP3協(xié)議的郵件信息獲取技術(shù)以及基于HTTP協(xié)議的Webmail郵件信息獲取技術(shù)。5、論述一個(gè)系統(tǒng)對(duì)電子郵件內(nèi)容進(jìn)行還原,以達(dá)到對(duì)電子郵件進(jìn)行網(wǎng)絡(luò)監(jiān)視的目的。四、主要技術(shù)指標(biāo)(無(wú))五、其他需要說(shuō)明的問(wèn)題1.論文題目一般不超過(guò)25個(gè)字,要簡(jiǎn)練準(zhǔn)確,可分二行書寫;2.開(kāi)題報(bào)告:由學(xué)生認(rèn)真書寫,經(jīng)指導(dǎo)教師簽字后的

4、開(kāi)題報(bào)告有效;3.摘要:中文摘要字?jǐn)?shù)應(yīng)在400字左右,包括論文題目、論文摘要、關(guān)鍵詞(3至5個(gè));4.目錄:按三級(jí)標(biāo)題編寫,要求層次清晰,且要與正文標(biāo)題一致,主要包括摘要、正文主要層次標(biāo)題、參考文獻(xiàn)、附錄等。5.正文:論文正文包括緒論(或前言、概述等)、論文主體、結(jié)論。工科論文要求符合科技論文格式,正文文字應(yīng)在15000字以上;6.參考文獻(xiàn):必須是學(xué)生本人真正閱讀過(guò)的,以近期發(fā)表的雜志類文獻(xiàn)為主,圖書類文獻(xiàn)不能過(guò)多,且要與論文工作直接相關(guān);論文要用統(tǒng)一的畢業(yè)論用紙,用中文打印正文,用宋體或楷體小四號(hào)字,版面上寬2.5cm,下空2cm,左右空2cm(靠裝訂線一側(cè)加0.5cm空白用于裝訂)。對(duì)字體

5、和字號(hào)的要求如下:題目用一號(hào)(分兩行書寫時(shí)用小一號(hào))黑體字;每層次(章)題序和標(biāo)題用小二號(hào)黑體字,題序和標(biāo)題之間空兩字,不加標(biāo)點(diǎn)(下同);每二層次(節(jié))題序和標(biāo)題用四號(hào)黑體字;第四層次(款)題序和標(biāo)題用小四號(hào)黑體字;第五層次(項(xiàng))以下標(biāo)題和題序與第四層次同。下達(dá)任務(wù)日期: 2014年8月1日要求完成日期: 2014年8月31日指導(dǎo)教師: 開(kāi) 題 報(bào) 告題 目:基于網(wǎng)絡(luò)數(shù)據(jù)包郵件信息的獲取與還原技術(shù)研究報(bào)告人: 周理根 2014 年 6 月 21 日一、 文獻(xiàn)綜述1、課題研究背景21世紀(jì)是網(wǎng)絡(luò)飛速發(fā)展的時(shí)代,網(wǎng)絡(luò)已經(jīng)日益成為生活中不可或缺的通訊工具,電子郵件通過(guò)互聯(lián)網(wǎng)為世界各地的Internet

6、用戶提供了一種極為快速、簡(jiǎn)單和經(jīng)濟(jì)的通訊和交換信息的方法,更是已經(jīng)成為互聯(lián)網(wǎng)上最流行的應(yīng)用之一,然而與之相關(guān)的網(wǎng)絡(luò)安全問(wèn)題也接踵而來(lái)。為了遏制網(wǎng)絡(luò)中大量存在的垃圾郵件,需要對(duì)網(wǎng)絡(luò)中傳輸?shù)泥]件信息進(jìn)行獲取,有效控制和阻止不良信息的傳播、機(jī)密信息的泄露和垃圾郵件的泛濫,以實(shí)現(xiàn)垃圾郵件的恰當(dāng)過(guò)濾。本次畢業(yè)設(shè)計(jì)通過(guò)分析郵件傳輸?shù)膬煞N方式,討論與郵件相關(guān)的若干問(wèn)題,主要包括網(wǎng)絡(luò)數(shù)據(jù)包的捕獲,基于SMTP/POP3協(xié)議的郵件信息獲取技術(shù)以及基于HTTP協(xié)議的Webmail郵件信息獲取技術(shù)。首先分析了電子郵件的格式及其實(shí)現(xiàn)原理,然后實(shí)現(xiàn)捕獲與過(guò)濾,TCP 數(shù)據(jù)流重組的功能,然后需要建立一個(gè)系統(tǒng)對(duì)電子郵件內(nèi)容

7、進(jìn)行還原。然后以Java為平臺(tái),這兩種方式的郵件格式的電子郵件的截獲和郵件信息還原的有關(guān)技術(shù)和核心算法,設(shè)計(jì)一個(gè)基于網(wǎng)絡(luò)數(shù)據(jù)包的郵件還原系統(tǒng),郵件還原系統(tǒng)基本功能包括:郵件數(shù)據(jù)捕獲過(guò)濾、用戶登錄、郵件收取還原、郵件發(fā)送。郵件還原系統(tǒng)達(dá)到對(duì)電子郵件進(jìn)行網(wǎng)絡(luò)監(jiān)視,最終達(dá)到有效控制和阻止不良信息的傳播、機(jī)密信息的泄露和垃圾郵件的泛濫。2、課題研究現(xiàn)狀垃圾郵件(未經(jīng)許可的商業(yè)郵件或不受歡迎的非法郵件)成為1990年以來(lái)一直困擾著互聯(lián)網(wǎng)的問(wèn)題。那時(shí),互聯(lián)網(wǎng)越來(lái)越商業(yè)化,越來(lái)越接近消費(fèi)者。一開(kāi)始只是感覺(jué)到少數(shù)人制造一些電子廣告,而現(xiàn)在垃圾郵件占用了目前大部分的郵件空間。垃圾郵件造成惡性商業(yè)形象,損害了郵件

8、使用者的利益,占用網(wǎng)絡(luò)資源,而且它對(duì)公司的網(wǎng)絡(luò)系統(tǒng)和網(wǎng)絡(luò)可信度,效率和安全性造成嚴(yán)重的威脅。大多數(shù)關(guān)于垃圾郵件的討論圍繞在技術(shù)層面。然而,驅(qū)使垃圾郵件不斷增加的卻是經(jīng)濟(jì)原因,要求發(fā)送者的商業(yè)公司為發(fā)送垃圾郵件支付的巨額費(fèi)用。反垃圾郵件是一項(xiàng)長(zhǎng)期而艱巨的工作。第一代反垃圾郵件技術(shù):1、基礎(chǔ)MTA控制:MTA協(xié)議應(yīng)該能控制基于每個(gè)域名的通訊連接,比如,防止“開(kāi)放轉(zhuǎn)發(fā)”并不能當(dāng)作一種獨(dú)立的反垃圾郵件技術(shù)。因?yàn)閰f(xié)議是在早期還沒(méi)有產(chǎn)生垃圾郵件問(wèn)題時(shí)被提出的,并沒(méi)有預(yù)見(jiàn)到會(huì)有這些基本的安全隱患。2、白名單和黑名單:黑名單(Black List)和白名單(White List)。分別是已知的垃圾郵件發(fā)送者或

9、可信任的發(fā)送者IP地址或者郵件地址?,F(xiàn)在有很多組織都在做bl(block list),將那些經(jīng)常發(fā)送垃圾郵件的IP地址(甚至IP地址范圍)收集在一起,做成block list。目前很多郵件接收端都采用了黑白名單的方式來(lái)處理垃圾郵件,包括MUA和MTA,當(dāng)然在MTA中使用得更廣泛,這樣可以有效地減少服務(wù)器的負(fù)擔(dān)。3、簡(jiǎn)單的關(guān)鍵字搜索:簡(jiǎn)單的關(guān)鍵字搜索一直是對(duì)抗垃圾郵件的基本方法。這一功能存在于垃圾郵件成為互聯(lián)網(wǎng)的主要問(wèn)題之前,那時(shí)作為內(nèi)容過(guò)濾的一部分和基于反病毒產(chǎn)品的解決方案和服務(wù)。4、標(biāo)題過(guò)濾和信件頭測(cè)試:信頭測(cè)試意味著郵件已通過(guò)SMTP協(xié)議。例如信件的寄件人和收件人,如果不合法的信息被傳輸?shù)?/p>

10、時(shí)候,將遞送一個(gè)通告并拒絕遞送該信息。信頭測(cè)試是從收件人,發(fā)件人和日期中測(cè)試有問(wèn)題的郵件,如果包含錯(cuò)誤形式或者信息便予以阻止。5、簡(jiǎn)單的DNS測(cè)試:使用SMTP協(xié)議交換發(fā)送者信息的時(shí)候查詢發(fā)送者的互聯(lián)網(wǎng)域名可以驗(yàn)證這些信息是否準(zhǔn)確。比如,查詢發(fā)送者的域或者發(fā)送郵件的主機(jī)名是否存在(通過(guò)查詢發(fā)送者域的IP地址和主機(jī)名是否對(duì)應(yīng)) 。第二代反垃圾郵件技術(shù):1、實(shí)時(shí)黑名單:盡管在基于網(wǎng)址和域名上它是一個(gè)DNS測(cè)試,RBLs是真實(shí)的反垃圾郵件技術(shù),在RBLs之后的概念是簡(jiǎn)單的維護(hù)一個(gè)發(fā)送垃郵件的網(wǎng)址,以阻止垃圾郵件的繼續(xù)發(fā)送。這種技術(shù)會(huì)有一定的效果,但容易被繞過(guò)。比如,改變IP地址,或者利用第三方的服務(wù)

11、器來(lái)發(fā)送垃圾郵件。同樣地,域名很容易被獲得,并被垃圾郵件發(fā)送者利用,因而不能完全依賴它來(lái)判別垃圾郵件。 2、電子簽名:這是對(duì)于垃圾郵件防御有重大意義的一項(xiàng)技術(shù)。電子簽名技術(shù)就是,如果垃圾郵件以大量的相同信息發(fā)送,可以用電子簽名技術(shù)產(chǎn)生一個(gè)唯一的電子簽名來(lái)收集和辨別垃圾郵件。如果能夠獲得充足的垃圾郵件樣本,對(duì)于降低垃圾郵件的比率有重要意義。但是這種技術(shù)需要及時(shí)操作才能達(dá)成效果。第三代反垃圾郵件技術(shù):貝葉斯過(guò)濾是利用統(tǒng)計(jì)學(xué)的方法檢測(cè)垃圾郵件,基于垃圾郵件中單個(gè)詞語(yǔ)的出現(xiàn)概率來(lái)判定,這是反垃圾郵件技術(shù)上的第一個(gè)突破,貝葉斯過(guò)濾技術(shù)的發(fā)展從根本上把反垃圾郵件的重點(diǎn)從網(wǎng)絡(luò)和協(xié)議改變?yōu)猷]件內(nèi)容。梭子魚的貝

12、葉斯規(guī)則庫(kù)在出廠之前都經(jīng)過(guò)近萬(wàn)封郵件的培訓(xùn),到達(dá)用戶之后,用戶繼續(xù)對(duì)其進(jìn)行培訓(xùn),被“有效培訓(xùn)”以后,過(guò)濾垃圾郵件的準(zhǔn)確率達(dá)到99% 。第四代反垃圾郵件技術(shù):垃圾郵件的存在原因還有一部分是因?yàn)椋赟MTP創(chuàng)造之初,只是用于學(xué)校,政府和軍隊(duì),因?yàn)槭且粋€(gè)封閉的系統(tǒng),所以不存在非法使用和電子郵件的濫用。1990年起,互聯(lián)網(wǎng)廣泛的應(yīng)用于商業(yè),但是之前的技術(shù)隱患仍然存在。垃圾郵件和反垃圾郵件活動(dòng)必將長(zhǎng)期存在,經(jīng)過(guò)了十幾年的發(fā)展,新興的反垃圾郵件技術(shù)也層出不窮。但無(wú)論哪一種技術(shù),都無(wú)法完全應(yīng)對(duì)多變的垃圾郵件。3、 基本研究方法郵件還原系統(tǒng)的開(kāi)發(fā)屬于應(yīng)用軟件開(kāi)發(fā),由用戶提供各種協(xié)議下郵件過(guò)濾功能提出,經(jīng)歷系統(tǒng)

13、分析,系統(tǒng)設(shè)計(jì),系統(tǒng)開(kāi)發(fā)實(shí)施,運(yùn)行和維護(hù),直至整個(gè)開(kāi)發(fā)周期完成,其基本的開(kāi)發(fā)流程各個(gè)階段完成的任務(wù)如下:系統(tǒng)開(kāi)發(fā)階段各個(gè)階段相關(guān)任務(wù)總體規(guī)劃對(duì)系統(tǒng)的需求做出分析,進(jìn)行方案可行性分析系統(tǒng)分析設(shè)計(jì)系統(tǒng)的邏輯模型,指出現(xiàn)行系統(tǒng)局限和不足,編寫系統(tǒng)分析說(shuō)明書系統(tǒng)設(shè)計(jì)編寫系統(tǒng)設(shè)計(jì)說(shuō)明書,系統(tǒng)框架,系統(tǒng)流程。系統(tǒng)實(shí)施系統(tǒng)程序的編寫和調(diào)試。4、重點(diǎn)研究問(wèn)題1、 研究電子郵件技術(shù)及電子郵件的發(fā)展歷史三個(gè)重要的電子郵件傳輸協(xié)議多用途Internet郵件擴(kuò)展(Multipurpose Internet Mail Extensions)。2、 研究Java語(yǔ)言的優(yōu)勢(shì),選擇java語(yǔ)言開(kāi)發(fā)環(huán)境。3、 分析研究基于郵件

14、客戶端的電子郵件格式與基于瀏覽器的電子郵件格式4、 研究網(wǎng)絡(luò)數(shù)據(jù)包的郵件信息獲取,識(shí)別SMTP/POP3命令識(shí)別服務(wù)器響應(yīng),判斷當(dāng)前會(huì)話狀態(tài)定位郵件數(shù)據(jù)郵件特征信息提Webmail郵件信息獲取分離客戶/服務(wù)器的多次請(qǐng)求/應(yīng)答交互過(guò)濾客戶/服務(wù)器請(qǐng)求/應(yīng)答交互集。5、 研究郵件還原系統(tǒng)的設(shè)計(jì)、數(shù)據(jù)包捕獲與過(guò)濾、SMTP/POP3 協(xié)議的郵件還原、SMTP/POP2的郵件還原過(guò)程截獲郵件數(shù)據(jù)還原郵件內(nèi)容、HTTP協(xié)議的Webmail 郵件還原模塊、HTTP協(xié)議的Webmail郵件還原過(guò)程定位 Webmail 郵件數(shù)據(jù)建立 Webmail 郵件知識(shí)庫(kù)還原郵件內(nèi)容。二、 選題的目的和意義本論文的目的:

15、基于Java為平臺(tái),開(kāi)發(fā)簡(jiǎn)易郵件處理系統(tǒng),獲取網(wǎng)絡(luò)中傳輸?shù)泥]件信息,分析處理郵件信息論文的意義:為郵件使用客戶處理大量郵件,遏制網(wǎng)絡(luò)中大量存在的垃圾郵件,阻止不良信息的傳播、機(jī)密信息的泄露和垃圾郵件的泛濫,以實(shí)現(xiàn)垃圾郵件的恰當(dāng)過(guò)濾。三、 研究方案:本次畢業(yè)設(shè)計(jì)在軟件的開(kāi)發(fā)和管理過(guò)程中都要體現(xiàn)軟件工程的思想。在軟件開(kāi)發(fā)過(guò)程中采用個(gè)人軟件開(kāi)發(fā)過(guò)程中項(xiàng)目開(kāi)發(fā)的方法,嚴(yán)格遵守其開(kāi)發(fā)的順序,經(jīng)歷需求、設(shè)計(jì)、編碼、測(cè)試等步驟。在整個(gè)過(guò)程中需求和設(shè)計(jì)大約占總體的50%,編碼大約占20%,測(cè)試大約占20%,剩下的大約占10%。在項(xiàng)目開(kāi)發(fā)的過(guò)程中,還有中期檢查報(bào)告。這樣才能了解并控制項(xiàng)目開(kāi)發(fā)的進(jìn)度,熟悉電子郵件

16、的網(wǎng)絡(luò)協(xié)議,熟悉Java開(kāi)發(fā),利用協(xié)議編程實(shí)現(xiàn)與郵件服務(wù)的鏈接。本系統(tǒng)實(shí)現(xiàn)功能如下:完成了接收郵件,系統(tǒng)登錄,聯(lián)系人管理,過(guò)濾垃圾郵件,優(yōu)化收件速度,郵件存入統(tǒng)一的數(shù)據(jù)庫(kù),對(duì)郵件的綜合有效利用。四、進(jìn)度計(jì)劃:序號(hào)畢業(yè)設(shè)計(jì)(論文)各階段內(nèi)容時(shí)間安排備注1資料收集、調(diào)研,撰寫開(kāi)題報(bào)告14.6.21以前2文獻(xiàn)查閱;相關(guān)技術(shù)學(xué)習(xí)14.6.22-14.7.13系統(tǒng)設(shè)計(jì)方案及代碼實(shí)現(xiàn)14.7.2-14.7.304關(guān)鍵問(wèn)題研究,論文整理、完善14.8.1-14.9.15論文完成,答辯14.9.1 以后五、指導(dǎo)教師意見(jiàn):中 文 摘 要網(wǎng)絡(luò)已經(jīng)日益成為生活中不可或缺的通訊工具,電子郵件簡(jiǎn)稱為E-Mail是以電子

17、的格式(如Microsoft Word文檔、.txt文件等)通過(guò)互聯(lián)網(wǎng)為世界各地的Internet用戶提供了一種極為快速、簡(jiǎn)單和經(jīng)濟(jì)的通訊和交換信息的方法,更是已經(jīng)成為互聯(lián)網(wǎng)上最流行的應(yīng)用之一,然而與之相關(guān)的網(wǎng)絡(luò)安全問(wèn)題也接踵而來(lái)。為了遏制網(wǎng)絡(luò)中大量存在的垃圾郵件,需要對(duì)網(wǎng)絡(luò)中傳輸?shù)泥]件信息進(jìn)行獲取,有效控制和阻止不良信息的傳播、機(jī)密信息的泄露和垃圾郵件的泛濫,以實(shí)現(xiàn)垃圾郵件的恰當(dāng)過(guò)濾。本文通過(guò)分析郵件傳輸?shù)膬煞N方式,討論與郵件相關(guān)的若干問(wèn)題,主要包括網(wǎng)絡(luò)數(shù)據(jù)包的捕獲,基于SMTP/POP3協(xié)議的郵件信息獲取技術(shù)以及基于HTTP協(xié)議的Webmail郵件信息獲取技術(shù)。首先分析了電子郵件的格式及其

18、實(shí)現(xiàn)原理,然后實(shí)現(xiàn)捕獲與過(guò)濾,TCP 數(shù)據(jù)流重組的功能,然后需要建立一個(gè)系統(tǒng)對(duì)電子郵件內(nèi)容進(jìn)行還原。然后以Java為平臺(tái),這兩種方式的郵件格式的電子郵件的截獲和郵件信息還原的有關(guān)技術(shù)和核心算法,設(shè)計(jì)一個(gè)基于網(wǎng)絡(luò)數(shù)據(jù)包的郵件還原系統(tǒng),以達(dá)到對(duì)電子郵件進(jìn)行網(wǎng)絡(luò)監(jiān)視,最終達(dá)到有效控制和阻止不良信息的傳播、機(jī)密信息的泄露和垃圾郵件的泛濫。關(guān)鍵詞:郵件傳輸協(xié)議; Webmail郵件;網(wǎng)絡(luò)數(shù)據(jù)包捕獲;郵件還原。Abstract:Internet has increasingly become an indispensable communication tool life, e-mail referred

19、 to as E-Mail is in electronic format (such as Microsoft Word documents, .txt files, etc.) via the Internet provides an extremely fast for Internet users around the world simple method for exchanging information and communication and economy, it is has become one of the Internet's most popular a

20、pplication, however, associated with network security problems follow. To curb the network there are a lot of spam, the need for network transmission of e-mail information acquisition, effectively control and prevent the spread of harmful information, the disclosure of confidential information and s

21、pam proliferation, in order to achieve proper spam filter.This paper analyzes the messages transmitted in two ways, to discuss a number of issues related to e-mail, including capture network packets, access to technology-based e-mail SMTP / POP3 protocol information and messages based on the HTTP pr

22、otocol Webmail access to information technology. Firstly, the format and the realization of the principles of e-mail, and then implement capture and filtering, TCP data stream reassembly function, and the need to establish a system of e-mail content to be restored. Then to Java as a platform for tec

23、hnical and core algorithms and e-mail messages intercepted two ways to restore e-mail message format is designed to restore the system based on a network packet mail, e-mail in order to achieve network monitoring, final achieve effective control and prevent the spread of harmful information, disclos

24、ure of confidential information and spam proliferation.key words:mple Mail Transfer Protocol; Webmail mail; network packet capture; Mail reduction;目 錄1 引言142 電子郵件技術(shù)142.1 什么是電子郵件142.2 電子郵件的發(fā)展歷史152.3 三個(gè)重要的電子郵件傳輸協(xié)議162.4 多用途Internet郵件擴(kuò)展(Multipurpose Internet Mail Extensions)213 Java技術(shù)簡(jiǎn)介243.1 Java是什么?243

25、.2 Java語(yǔ)言的優(yōu)勢(shì)244 電子郵件格式分析284.1 基于郵件客戶端的電子郵件格式284.2 基于瀏覽器的電子郵件格式285 基于網(wǎng)絡(luò)數(shù)據(jù)包的郵件信息獲取295.1 識(shí)別SMTP/POP3命令305.2 識(shí)別服務(wù)器響應(yīng)305.3 判斷當(dāng)前會(huì)話狀態(tài)315.4 定位郵件數(shù)據(jù)315.5 郵件特征信息提315.6 Webmail郵件信息獲取31 5.6.1 分離客戶/服務(wù)器的多次請(qǐng)求/應(yīng)答交互31 5.6.2 過(guò)濾客戶/服務(wù)器請(qǐng)求/應(yīng)答交互集326 還原郵件系統(tǒng)設(shè)計(jì)326.1 數(shù)據(jù)包捕獲與過(guò)濾模塊336.2 數(shù)據(jù)流分析與重組模塊356.3 基于 SMTP/POP3 協(xié)議的郵件還原41 6.3.1

26、 使用 SMTP/POP2的郵件還原過(guò)程41 6.3.2 截獲郵件數(shù)據(jù)42 6.3.3 還原郵件內(nèi)容426.4 基于 HTTP 協(xié)議的 Webmail 郵件還原模塊42 6.4.1 基于HTTP協(xié)議的Webmail郵件還原過(guò)程42 6.4.2 定位 Webmail 郵件數(shù)據(jù)43 6.4.3 建立 Webmail 郵件知識(shí)庫(kù)43 6.4.4 還原郵件內(nèi)容43結(jié)論44參考文獻(xiàn)45附 錄461 引言隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和網(wǎng)絡(luò)知識(shí)的普及,網(wǎng)絡(luò)安全問(wèn)題變得越來(lái)越嚴(yán)重。在眾多網(wǎng)絡(luò)應(yīng)用中,E- mail在Internet以其使用方便、投遞迅速和費(fèi)用低廉的特點(diǎn)而得到廣泛使用,用戶通過(guò)電子郵件可以與另一用戶進(jìn)

27、行通信,包括簡(jiǎn)單的電子信函和文件傳輸?shù)?,給人們的生活帶來(lái)了極大的便利。與此同時(shí), 越來(lái)越多的垃圾郵件在網(wǎng)絡(luò)中泛濫, 不僅占用大量網(wǎng)絡(luò)、存儲(chǔ)和運(yùn)算資源,而且給用戶的工作造成了嚴(yán)重干擾。因此,如果能夠?qū)崿F(xiàn)郵件信息的有效獲取, 繼而對(duì)垃圾郵件進(jìn)行過(guò)濾, 就可以在一定程度上遏制網(wǎng)絡(luò)中的垃圾郵件。從目前的技術(shù)發(fā)展來(lái)看,電子郵件的收發(fā)主要存在兩種方式:第一種是使用Outlook、Fox mail等郵件客戶端軟件連接郵件服務(wù)器,通過(guò)SMTP/POP3 協(xié)議收發(fā)郵件;第二種是使用IE、Fire-Fox等瀏覽器軟件登錄ISP的Web站點(diǎn),通過(guò)HTTP協(xié)議收發(fā)郵件(稱Webmail郵件)。針對(duì)這兩種方式, 本文主

28、要討論基于網(wǎng)絡(luò)數(shù)據(jù)包(數(shù)據(jù)鏈路層幀)的郵件信息獲取技術(shù),包括網(wǎng)絡(luò)數(shù)據(jù)包的捕獲與重組、基于SMTP/POP3協(xié)議郵件信息的識(shí)別與獲取以及基于HTTP協(xié)議的Webmail郵件信息識(shí)別與獲取。掌握了Base64編碼的原理和方法,然后以Java為平臺(tái),這兩種方式的郵件格式的電子郵件的截獲和郵件信息還原的有關(guān)技術(shù)和核心算法。本文有關(guān)技術(shù)和算法經(jīng)過(guò)了實(shí)驗(yàn)的驗(yàn)證。2 電子郵件技術(shù)2.1 什么是電子郵件電子郵件(Electronic Mail,簡(jiǎn)稱E-mail)是Internet上的最重要信息服務(wù)方式。普通郵件通過(guò)郵局、郵差送到我們的手上,而電子郵件是以電子的格式(如Microsoft Word文檔、.txt

29、文件等)通過(guò)互聯(lián)網(wǎng)為世界各地的Internet用戶提供了一種極為快速。簡(jiǎn)單和經(jīng)濟(jì)的通訊和交換信息的方法。與常規(guī)信函相比,E-Mail非常迅速,把信息傳遞世界由幾天到幾十天減少到幾分鐘,而且E-mail使用非常方便,即寫即發(fā),省去了粘貼郵票和跑郵局的煩惱。與電話相比,E-mail的使用是非常經(jīng)濟(jì)的,傳輸幾乎是免費(fèi)的。而且這種服務(wù)不僅僅是一對(duì)一的服務(wù),用戶可以向一批人發(fā)信件,或者向一個(gè)人這么發(fā),向另外一個(gè)人那么發(fā)。正是由于這些優(yōu)點(diǎn),Internet上數(shù)以億計(jì)的用戶都有自己的E-mail地址,E-mail也稱為利用率最高的Internet應(yīng)用。2.2 電子郵件的發(fā)展歷史2.2.1 電子郵件的誕生據(jù)電

30、子郵件發(fā)明人雷.湯姆林森(RayTomlinson)回憶道,電子郵件的誕生是在1971年秋季(確切時(shí)間已經(jīng)無(wú)法考證),當(dāng)時(shí)已經(jīng)有一種可傳輸文件的電腦程序以及一種原始的信息程序。但兩個(gè)程序存在極大的使用局限例如:使用信息程序的人只能給接收方發(fā)送公報(bào),接收方的電腦還必須與發(fā)送方一致。發(fā)明電子郵件時(shí),湯姆林森是馬薩諸塞州受聘于美國(guó)軍方,參與Arpanet網(wǎng)絡(luò)(互聯(lián)網(wǎng)的前身)的建設(shè)和維護(hù)工作。湯姆林森對(duì)已有的傳輸文件程序以及信息程序進(jìn)行研究,研制出一套新程序,它可以通過(guò)電腦網(wǎng)絡(luò)發(fā)送和接收信息,再也沒(méi)有了以前的種種限制。為了讓人們都擁有易識(shí)別的電子郵箱地址,湯姆林森決定采用符號(hào),符號(hào)前面加用戶名,后面加

31、用戶郵箱所在地址,電子郵件由此誕生。2.2.2 電子郵件的30年發(fā)展歷程雖然電子郵件是在70年代發(fā)明的,它卻是在80年才得以興起。70年代的沉寂主要是由于但是使用的Arpanet網(wǎng)絡(luò)的人太少,網(wǎng)絡(luò)的速度也僅為目前2.8Kbps。受網(wǎng)絡(luò)速度的限制,那時(shí)的用戶只能發(fā)送些簡(jiǎn)短的信息,根本別想象現(xiàn)在那樣發(fā)送大量照片;到80年代中期,個(gè)人電腦興起,電子郵件開(kāi)始在電腦迷以及大學(xué)生中廣泛傳播開(kāi)來(lái);到90年代中期,互聯(lián)網(wǎng)瀏覽器誕生,全球網(wǎng)民人數(shù)激增,電子郵件被廣為使用。2.2.3 Eudora簡(jiǎn)史使用電子郵件成為主流的第一個(gè)程序是Euroda,是由史蒂夫.道納爾在1988年編寫的。由于Euroda是第一個(gè)有圖

32、形界面的電子郵件管理程序,它很快就成為各公司和大學(xué)校園內(nèi)的主要使用的電子郵件程序。然而Euroda的低位并沒(méi)有維持太長(zhǎng)時(shí)間。隨著互聯(lián)網(wǎng)的興起,Netscape和微軟相續(xù)推出了他們的瀏覽器和相關(guān)程序。微軟和它開(kāi)發(fā)的outlook使Euroda逐漸走向衰落。在過(guò)去的5年中,關(guān)于電子郵件發(fā)生的最大變化是基于互聯(lián)網(wǎng)的電子郵件的興起。人們可以通過(guò)任何互聯(lián)網(wǎng)的計(jì)算機(jī)在郵件網(wǎng)站上維護(hù)他們的郵件賬號(hào),而不是只能在他們的家中或公司的互聯(lián)網(wǎng)電腦上使用郵件。這種郵件是由Hotmail推廣的。入境Hotmail已經(jīng)成為一大熱門網(wǎng)站。Hotmail的成功使一大批競(jìng)爭(zhēng)者得到了啟發(fā),很快電子郵件成為門戶網(wǎng)站的必有服務(wù),如雅

33、虎、Netscape、Exicite和Lycos等,都有自己的電子郵件服務(wù)。2.3 三個(gè)重要的電子郵件傳輸協(xié)議 2.3.1 SMTP協(xié)議 SMTP協(xié)議:即簡(jiǎn)單郵件傳輸協(xié)議。RFC821講述了SMTP傳輸郵件的過(guò)程和規(guī)范,RFC822講述了郵件消息的格式。SMTP協(xié)議提出于1982年8月,提出者致力解決了通信雙方正確收發(fā)信息的問(wèn)題1。隨著網(wǎng)絡(luò)的普及,原有的SMTP協(xié)議已經(jīng)不能適應(yīng)當(dāng)前的商用環(huán)境,有些研究者對(duì)電子郵件協(xié)議進(jìn)行了多次擴(kuò)充,并在1999年針對(duì)垃圾郵件問(wèn)題提出了SMTP反垃圾郵件擴(kuò)展協(xié)議。 SMTP模型(圖1.3-1)在工作時(shí),首先由用戶發(fā)送請(qǐng)求給發(fā)送端SMTP;然后,發(fā)送端SMTP與接

34、收端SMTP建立雙向傳輸通道。此處接收端SMTP可能是最終接收端,也可能是中間轉(zhuǎn)發(fā)接收端。雙向通道建立起來(lái)之后。接收端和發(fā)送端SMTP就按協(xié)議規(guī)定的命令進(jìn)行應(yīng)答。圖 2.3-1SMTP協(xié)議,它主要包括:HELO、MAIL、RCPT、DATA、SEND、SOM L、 SAM L、RSET、VRFY、EXPN、HELP、NOOP、QUIT和TURN等指令。目前客戶端和SMTP服務(wù)器端的交互基本升級(jí)到了ESMTP協(xié)議,已經(jīng)很少有用SMTP協(xié)議的郵件中轉(zhuǎn)服務(wù)器了。ESMTP協(xié)議是在SMTP協(xié)議的基礎(chǔ)上進(jìn)行了修補(bǔ)和擴(kuò)展,主要的變化是用ETRN指令代替了TURN指令,并引入了發(fā)信認(rèn)證體系。主要包括EHLO

35、(代替SMTP中的HELO指令),ETRN,AUTH(認(rèn)證),DSN等。目前支持的認(rèn)證方式主要有:PLAIN文本形式的用戶名和密碼認(rèn)證, LOGIN采用BASE64編碼方式認(rèn)證,這是被絕大多數(shù)SMTP軟件支持的認(rèn)證方式,其他還有MD-5加密認(rèn)證和摘要認(rèn)證,KERBEROS-V4、GSSAPI等認(rèn)證方式。當(dāng)今的大多數(shù)S M T P服務(wù)器都已經(jīng)升級(jí)到了ESMTP協(xié)議,也就是說(shuō),發(fā)信必須通過(guò)認(rèn)證,以前那種隨便什么SMTP服務(wù)器都可以轉(zhuǎn)發(fā)的缺陷被彌補(bǔ)了。SMTP是工作在兩種情況下:一是電子郵件從客戶機(jī)傳輸?shù)椒?wù)器;二是從某一個(gè)服務(wù)器傳輸?shù)搅硪粋€(gè)服務(wù)器。SMTP是個(gè)請(qǐng)求/響應(yīng)協(xié)議,命令和響應(yīng)都是基于AS

36、CII 文本,并以CR和LF符結(jié)束。響應(yīng)包括一個(gè)表示返回狀態(tài)的三位數(shù)字代碼: 1、SMTP在TCP協(xié)議25號(hào)端口監(jiān)聽(tīng)連接請(qǐng)求; 2、連接和發(fā)送過(guò)程: (1)建立TCP連接,客戶端發(fā)送HELO命令以標(biāo)識(shí)發(fā)件人自己的身份,然后客戶端發(fā)送MAIL命令服務(wù)器端正希望以O(shè)K作為響應(yīng); (2)表明準(zhǔn)備接收,客戶端發(fā)送RCPT命令,以標(biāo)識(shí)該電子郵件的計(jì)劃接收人,可以有多個(gè)RCPT行服務(wù)器端則表示是否愿意為收件人接受郵件協(xié)商結(jié)束,發(fā)送郵件, 用命令DATA發(fā)送,以 . 表示結(jié)束輸入內(nèi)容一起發(fā)送出去結(jié)束此次發(fā)送,用QUIT命令退出。另外,VRFY-用于驗(yàn)證給定的用戶郵箱是否存在,以及接收關(guān)于該用戶的詳細(xì)信息,E

37、XPN-用于擴(kuò)充郵件列表。 SMTP服務(wù)器基于域名服務(wù)DNS中計(jì)劃收件人的域名來(lái)路由電子郵件。SMTP服務(wù)器基于DNS中的MX記錄來(lái)路由電子郵件,MX記錄注冊(cè)了域名和相關(guān)的SMTP中繼主機(jī),屬于該域的電子郵件都應(yīng)向該主機(jī)發(fā)送。若SMTP服務(wù)器收到一封信要發(fā)到shuser:,Sendmail請(qǐng)求DNS給出主機(jī)的CNAME記錄,如有,假若CNAME到,則再次請(qǐng)求的CNAME記錄,直到?jīng)]有為止。假定被CNAME到,然后sendmail請(qǐng)求域的DNS給出的MX記錄shmailMX5 、,Sendmail最后請(qǐng)求DNS給出的A記錄,即IP地址,若返回值為,Sendmail與連

38、接,傳送這封給shuser的信到這臺(tái)服務(wù)器的SMTP后臺(tái)程序。2.3.2 POP3協(xié)議 POP3協(xié)議:即郵件協(xié)議第3版。RFC1939詳細(xì)描述了其規(guī)范和命令與SMTP協(xié)議相對(duì)應(yīng),POP3協(xié)議用于收取電子郵件。與SMTP不同,POP3使用固定的端口號(hào)110進(jìn)行郵件的收取。POP3服務(wù)器一直監(jiān)聽(tīng)I(yíng)10端口,等持用戶連接。如果用戶需要接收電子郵件,他就與POP3服務(wù)器連接。然后,會(huì)話進(jìn)入驗(yàn)證狀態(tài),這時(shí)用戶輸入自己的身份口令傳給POP3服務(wù)器進(jìn)行驗(yàn)證。驗(yàn)證通過(guò)后,會(huì)話進(jìn)入傳輸狀態(tài)。這時(shí)用戶與POP3服務(wù)器交互,獲取想要獲取的郵件,直至關(guān)閉車次連接;最后,服務(wù)器進(jìn)入更新?tīng)顟B(tài),釋放本次會(huì)話占

39、用的資源。 對(duì)于在網(wǎng)絡(luò)上的比較小的結(jié)點(diǎn),支持消息傳輸系統(tǒng)(mts)是不實(shí)際的。例如,一臺(tái)工作站可能不具有充足的資源允許smtp服務(wù)器和相當(dāng)?shù)谋镜剜]件傳送系統(tǒng)保持序駐留,并持續(xù)運(yùn)行。同樣的,將一臺(tái)個(gè)人計(jì)算機(jī)長(zhǎng)時(shí)間連接在ip類型網(wǎng)絡(luò)上的費(fèi)用也是可觀的(結(jié)點(diǎn)缺少的資源被稱為"聯(lián)絡(luò)性")。雖然如此,在這樣的小結(jié)點(diǎn)上允許管理郵件是十分有用的,并且這些結(jié)點(diǎn)經(jīng)常支持一個(gè)用戶代理來(lái)管理郵件。為解決這一問(wèn)題,能夠支持mts的結(jié)點(diǎn)就為這些不能支持的結(jié)點(diǎn)提供了郵件存儲(chǔ)功能。郵局協(xié)議-版本3就是使這樣的工作站可以用一種比較實(shí)用的方法來(lái)訪問(wèn)存儲(chǔ)于服務(wù)器上的儲(chǔ)存郵件。通常,這意味著工作站可以從服務(wù)器上

40、取得郵件,而服務(wù)器為它暫時(shí)保存郵件。在本文中,客戶主機(jī)指的是利用pop3服務(wù)的主機(jī),而服務(wù)器主機(jī)指的是提供pop3服務(wù)的主機(jī)。 當(dāng)用戶代理需要將信息送到傳送系統(tǒng)時(shí),它在接力主機(jī)上建立Smtp連接(這些接力主機(jī)可以是pop3主機(jī),也可以不是)。初始時(shí),服務(wù)器通過(guò)偵聽(tīng)Top端口110開(kāi)始pop3服務(wù)。當(dāng)客戶主機(jī)需要使用服務(wù)時(shí),它將與服務(wù)器主機(jī)建立Top連接。當(dāng)連接建立后,pop3發(fā)送確認(rèn)消息。客戶和pop3服務(wù)器相互(分別)交換命令和響應(yīng),這一過(guò)程一直要持續(xù)到連接終止pop3命令由一個(gè)命令和一些參數(shù)組成。所有命令以一個(gè)calf對(duì)結(jié)束。命令和參數(shù)由可打印的ascidia字符組成,它們之間由空格間隔。

41、命令一般是三到四個(gè)字母,每個(gè)參數(shù)卻可達(dá)40個(gè)字符長(zhǎng)。 pop3響應(yīng)由一個(gè)狀態(tài)碼和一個(gè)可能跟有附加信息的命令組成。所有響應(yīng)也是由calf對(duì)結(jié)束。現(xiàn)在有兩種狀態(tài)碼,"確定" ("+ok")和"失敗" ("-err")。對(duì)于特定命令的響應(yīng)是由許多字符組成的。在這些情況中,下面一一表述:在發(fā)送第一行響應(yīng)和一個(gè)calf之后,任何的附加信息行發(fā)送,他們也由calf對(duì)結(jié)束。當(dāng)所有信息發(fā)送結(jié)束時(shí),發(fā)送最后一行,包括一個(gè)結(jié)束字符(十進(jìn)制碼46,也就是".")和一個(gè)calf對(duì)。如果信息中的任何一行以結(jié)束字符開(kāi)始,此

42、行就是通過(guò)在那一行預(yù)先裝入結(jié)束而進(jìn)行字符填充的。因此,多行響應(yīng)由五個(gè)crlf.crlf 結(jié)束。當(dāng)檢測(cè)多行響應(yīng)時(shí),客戶檢測(cè)以確認(rèn)此行是否以結(jié)束字符開(kāi)始。如果是的,而且其后的字符不是calf,此行的第一個(gè)字符(結(jié)束字符)將被拋棄;如果其后緊跟calf,從pop服務(wù)器來(lái)的響應(yīng)終止,包括.calf 的行也不被認(rèn)為是多行響應(yīng)的一部分了。 在生命周期中,pop3會(huì)話有幾個(gè)不同的狀態(tài)。一旦top連接被打開(kāi),而且pop3服務(wù)器發(fā)送了確認(rèn)信息,此過(guò)程就進(jìn)入了"確認(rèn)"狀態(tài)。在此狀態(tài)中,客戶必須向pop3服務(wù)器確認(rèn)自己是其的客戶。一旦確認(rèn)成功,服務(wù)器就獲取與客戶郵件相關(guān)的資源,此時(shí)這一過(guò)程進(jìn)入了

43、"操作"狀態(tài)。在此狀態(tài)中,客戶提出服務(wù),當(dāng)客戶發(fā)出quit命令時(shí),此過(guò)程進(jìn)入了"更新"狀態(tài)。在此狀態(tài)中,pop3服務(wù)器釋放在"操作"狀態(tài)中取得的資源,并發(fā)送消息,終止連接。 pop3服務(wù)器可以擁有一個(gè)自動(dòng)退出登錄的記時(shí)器。此記時(shí)器必須至少可以記錄10分鐘。這樣從客戶發(fā)送的消息才可能刷新此記時(shí)器。當(dāng)記時(shí)器失效時(shí),pop3會(huì)話并不進(jìn)入"更新"狀態(tài),而是關(guān)閉top連接,而且不刪除任何消息,不向客戶發(fā)送任響應(yīng)"確認(rèn)"狀態(tài),一時(shí)top連接由pop3客戶打開(kāi),pop3服務(wù)器發(fā)送一個(gè)單行的確認(rèn)。這個(gè)消息可以是

44、由calf結(jié)束的任何字符。例如,它可以是: s: +ok pop3 server ready 注意:這個(gè)消息是一個(gè)pop3應(yīng)答。pop3服務(wù)器應(yīng)該給出一個(gè)"確定"響應(yīng)作為確認(rèn)。 此時(shí)pop3會(huì)話就進(jìn)入了"確認(rèn)"狀態(tài)。此時(shí),客戶必須向服務(wù)器證明它的身份。在文檔中介紹兩種可能的處理機(jī)制,一種是user和pass命令,另一種是在后面要介紹的atop命令。用user和pass命令進(jìn)行確認(rèn)過(guò)程,客戶必須首先發(fā)送user命令,如果pop3服務(wù)器以"確認(rèn)"狀態(tài)碼響應(yīng),客戶就可以發(fā)送pass命令以完成確認(rèn),或者發(fā)送quit命令終止pop3會(huì)話。如果p

45、op3服務(wù)器返回"失敗"狀態(tài)碼,客戶可以再發(fā)送確認(rèn)命令,或者發(fā)送quit命令。當(dāng)客戶發(fā)送了pass命令后,服務(wù)器根據(jù)user和pass命令的附加信息決定是否允許訪問(wèn)相應(yīng)的存儲(chǔ)郵件。一旦服務(wù)器通過(guò)這些數(shù)據(jù)決定允許客戶訪問(wèn)儲(chǔ)存郵件,服務(wù)器會(huì)在郵件上加上排它鎖,以防止在進(jìn)入"更新"狀態(tài)前對(duì)郵件的改變。如果成功獲得了排它鎖,服務(wù)器返回一個(gè)"確認(rèn)"狀態(tài)碼。會(huì)話進(jìn)入"操作狀態(tài)",同時(shí)沒(méi)有任何郵件被標(biāo)記為刪除。如果郵件因?yàn)槟撤N原因不能打開(kāi)(例如,排它鎖不能獲得,客戶不能訪問(wèn)相應(yīng)的郵件或者郵件不能進(jìn)行語(yǔ)法分析),服務(wù)器將返回&qu

46、ot;失敗"狀態(tài)碼。在返回"失敗"狀態(tài)碼后,服務(wù)器會(huì)關(guān)閉連接。如果服務(wù)器沒(méi)有關(guān)閉連接,客戶可以重新發(fā)送確認(rèn)命令,重新開(kāi)始,或者發(fā)送quit命令。 在服務(wù)器打開(kāi)郵件后,它為每個(gè)消息指定一個(gè)消息號(hào),并以八進(jìn)制表示每個(gè)消息的長(zhǎng)度。第一個(gè)消息被指定為1,第二個(gè)消息被指定為2,以此類推,第n個(gè)消息被指定為n。在pop3命令和響應(yīng)中,所以的消息號(hào)和長(zhǎng)度以十進(jìn)制表示。表2.3-1:POP3狀態(tài)命令對(duì)照表。狀態(tài)可用命令對(duì)照集驗(yàn)證態(tài)USER、PASS、APOP、QUIT傳輸態(tài)STAT、LIST、RETR、DELE、NOOP、RSET、QUIT、TOP、UIDL更新態(tài)QCIT2.3.

47、3 IMAP協(xié)議 IMAP是Internet Message Access Protocol的縮寫,顧名思義,主要提供的是通過(guò)Internet獲取信息的一種協(xié)議。IMAP4是IMAP協(xié)議的第4個(gè)版本,正如POP3是POP協(xié)議的第3個(gè)版本一樣。在郵件系統(tǒng)內(nèi),IMAP是一種強(qiáng)有力的郵箱訪問(wèn)方式,和POP3的區(qū)別是由于很多用戶都對(duì)POP3非常熟悉。POP3提供了快捷的郵件下載服務(wù),用戶可以利用POP3把郵箱里的信下載到PC上進(jìn)行離線閱讀。一旦郵件進(jìn)入PC的本地硬盤,就可以選擇把郵件從服務(wù)器上刪除,然后脫離與Internet的連接并選擇在任何時(shí)候閱讀已經(jīng)下載的郵件。 IMAP同樣提供了方便的郵件下載服

48、務(wù),讓用戶能進(jìn)行離線閱讀,但I(xiàn)MAP能完成的卻遠(yuǎn)遠(yuǎn)不只這些。首先,IMAP提供的摘要瀏覽功能可以讓你在閱讀完所有的郵件到達(dá)時(shí)間、主題、發(fā)件人、大小等信息后才出是否下載的決定。也就是說(shuō),你不必等所有的郵件都下載完畢后才知道究竟郵件里都有些什么。如果你根據(jù)摘要信息就可以決定某些郵件對(duì)你毫無(wú)用處,你就可以直接在服務(wù)器上把這些郵件刪除掉,而不必浪費(fèi)你寶貴的上網(wǎng)時(shí)間。 如果你的IMAP客戶端軟件完整支持IMAP4rev1的話(如Netscape 4.5),則你還可以享受選擇性下載附件的服務(wù)。舉例來(lái)說(shuō),假如一封郵件里含有大大小小共個(gè)附件,而其中只有2個(gè)附件是你需要的,你就可以只下載那兩個(gè)附件,節(jié)省了下載其

49、余3個(gè)的時(shí)間。和WebMail的比較也有很多用戶喜歡通過(guò)Web來(lái)聯(lián)機(jī)收發(fā)郵件,其中一個(gè)很重要的原因是這些用戶希望把他的郵件都留在服務(wù)器上,并且通過(guò)WebMail服務(wù)建立多個(gè)文件夾,然后分類歸檔地管理自己的郵件。這樣,WebMail的用戶就可以不分時(shí)間地點(diǎn),只要有一個(gè)瀏覽器就可以馬上從服務(wù)器上獲得自己的郵件,不管是剛收到的還是已經(jīng)存放了很久,也不必?fù)?dān)心客戶端的PC重新安裝了操作系統(tǒng)或換了一臺(tái)電腦以后郵件全部丟失了的問(wèn)題。IMAP同樣滿足了WebMail用戶的需要。IMAP與POP3不同的地方關(guān)鍵是在支持離線閱讀的同時(shí)也鼓勵(lì)用戶把郵件存儲(chǔ)和組織在服務(wù)器上。和WebMail一樣,通過(guò)IMAP,允許用

50、戶在服務(wù)器上建立任意層次結(jié)構(gòu)的文件夾,并且可以靈活地在文件夾之間移動(dòng)郵件,隨心所欲地組織你的郵箱(這些顯然是通過(guò)POP3做不到的)。只要你的郵件存儲(chǔ)在服務(wù)器上,任何時(shí)候通過(guò)一個(gè)IMAP的客戶端軟件都可以立即聯(lián)機(jī)獲得你的郵件,這一點(diǎn)與WebMail保持一致,但是,IMAP的以下優(yōu)點(diǎn)足以把WebMail用戶吸引過(guò)來(lái):凡是WebMail的用戶都必需無(wú)奈地閱讀頁(yè)面上的廣告,都必需花費(fèi)寶貴的時(shí)間和帶寬來(lái)下載頁(yè)面上的圖面,修飾字符等等;IMAP則忠實(shí)地只為你的Email服務(wù),不讓你的資源有絲毫的浪費(fèi)。IMAP協(xié)議還允許你方便地利用你的郵箱作為信息存儲(chǔ)工具,一般的IMAP4客戶軟件都支持郵件在本地文件夾間和

51、服務(wù)器文件夾間的隨意拖動(dòng),讓你得心應(yīng)手地把本地硬盤上的文件存放到服務(wù)器上,然后在你需要的時(shí)候同樣方便地取回來(lái),所有的功能僅需要一次鼠標(biāo)拖放的操作來(lái)實(shí)現(xiàn)。2.4 多用途Internet郵件擴(kuò)展(Multipurpose Internet Mail Extensions) 2.4.1 Base64編碼 在Internet中Email是我們應(yīng)用最廣一種聯(lián)絡(luò)或信息交換的一種手段,在Email傳輸中最常用的就是MIME協(xié)議。MIME是一種Internet協(xié)議,全稱為“Multipurpose Intermit Mail Extensions”,中文名稱為“多用途互聯(lián)網(wǎng)郵展”。其實(shí),它的應(yīng)用并不局限于收發(fā)

52、Internet郵件它已經(jīng)成為Internet上傳輸多媒體信息的基本協(xié)議之一。MIME編碼的原理就是把8bit的內(nèi)容轉(zhuǎn)換成7bit的形式以能正確傳輸,在接收方收到之后,再將其還原成8bit的內(nèi)容。對(duì)郵件進(jìn)行編碼最初的原因是因?yàn)镮nternet上的很多網(wǎng)關(guān)不能正確傳輸8bit內(nèi)碼的字符,比如漢字、圖像、程序數(shù)據(jù)等。MIME編碼共有Base64、Quotedprintable、7bit、8bit和Binary等幾種。在現(xiàn)在的Email系統(tǒng)中應(yīng)用最廣的為Base64和QuotedPrintable。Base64和QuotedPrintable都屬于MIME多部分(multipa t)、多媒體電子郵件

53、和www 超文本的一種編碼標(biāo)準(zhǔn),用于傳送諸如圖形、聲音和傳真等非文本數(shù)據(jù)。MIME定義在RFC1341中。Base64算法將輸入的字符串或一段數(shù)據(jù)編碼成只含有“A”-“Z”, “a”-“z”,“0”-“9”, “+”,“/” 這64個(gè)字符的串,“=”用于填充。其編碼的方法是,將輸人數(shù)據(jù)流每次取6bit,用此6bit的值(063)作為索引去查表,輸出相應(yīng)字符。這樣,每3個(gè)字節(jié)將編碼為4個(gè)字符(3x8->4x6):不滿4個(gè)字符的以”=”填充(表2.4-1:Base編碼表)。ValueEncodingValueEncodingValueEncodingValueEncodingValueEnc

54、oding0A13N26a39n5201B14O27b40o5312C15P28c41p5423D16Q29d42q5534E17R30e43r5645F18S31f44s5756G19T32g45t5867H20U33h46u5978I21V34i47v6089J22W35j48w61910K23X36k49x62011L24Y37l50y63/12M25Z38m51z(Pad)=Base64編碼的方式是把8位的字節(jié)連成一串,然后每次順序選6個(gè)出來(lái),之后再把這6二進(jìn)制數(shù)前面再添加兩個(gè)0,就成了一個(gè)新的字節(jié)。之后再選出6個(gè)來(lái),再添加O,依此類推。我們以字符串“張3”為例。表2.4-2 Base

55、64編碼演示表字符串“張 3”張31 10101011100010100110011轉(zhuǎn)換6bit00110101000111000001010000110011十進(jìn)制53十進(jìn)制34十進(jìn)制20十進(jìn)制51字符“l(fā)”字符“i”字符“U”字符“z”從這里我們可以了解到Base64名稱的由來(lái)。字符串”張3”經(jīng)過(guò)編碼后就成了字符串”liUz”了。Base64將3個(gè)字節(jié)轉(zhuǎn)變?yōu)?個(gè)字節(jié),因此,編碼后的代碼量(以字節(jié)為單位)約比編碼前的代碼量多了13。之所以說(shuō)是“約”,是因?yàn)槿绻a量正好是3的整數(shù)倍,那么自然是多了13。但如果不是呢?在The Base64 Alphabet中的最后一個(gè)有一個(gè)(pad)=字符,

56、這個(gè)字符的目的就是用來(lái)處理這個(gè)問(wèn)題的。當(dāng)代碼量不是3的整數(shù)倍時(shí),代碼量,3的余數(shù)自然就是2或者1。轉(zhuǎn)換的時(shí)候,結(jié)果不夠6位的用O來(lái)補(bǔ)上相應(yīng)的位置,之后再在6位的前面補(bǔ)兩個(gè)O。轉(zhuǎn)換完空出的結(jié)果就用就用”=”來(lái)補(bǔ)位。 2.4.2 Base64編碼/解碼的算法實(shí)現(xiàn) 用更接近于編程的思維來(lái)說(shuō),編碼的過(guò)程是這樣的:(1)第一個(gè)字符通過(guò)右移2位獲得第一個(gè)目標(biāo)字符的Base64表位置,根據(jù)這個(gè)數(shù)值取到表上相應(yīng)的字符,就是第一個(gè)目標(biāo)字符。(2)然后將第一個(gè)字符左移4位加上第二個(gè)字符右移4位,即獲得第二個(gè)目標(biāo)字符。(3)再將第二個(gè)字符左移2位加上第三個(gè)字符右移6位,獲得第三個(gè)目標(biāo)字符。(4)最后取第三個(gè)字符的右6位即獲得第四個(gè)目標(biāo)字符。在以上的每一個(gè)步

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論