基于大數(shù)據(jù)技術(shù)下的高校輿情監(jiān)測(cè)與分_第1頁(yè)
基于大數(shù)據(jù)技術(shù)下的高校輿情監(jiān)測(cè)與分_第2頁(yè)
基于大數(shù)據(jù)技術(shù)下的高校輿情監(jiān)測(cè)與分_第3頁(yè)
基于大數(shù)據(jù)技術(shù)下的高校輿情監(jiān)測(cè)與分_第4頁(yè)
基于大數(shù)據(jù)技術(shù)下的高校輿情監(jiān)測(cè)與分_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

摘要隨著科技的日新月異,通訊手段與交流方式不斷更新,網(wǎng)絡(luò)作為信息通訊的重要媒介,成為了高校學(xué)生溝通交流、發(fā)表觀(guān)點(diǎn)的重要平臺(tái)。高校學(xué)生通過(guò)利用網(wǎng)絡(luò)公民自發(fā)形成的輿論圈,交流更為便捷,傳播更為多元,使得高校輿情具有了隨意性、直接性、偏差性、突發(fā)性四大特征,對(duì)社會(huì)中的輿情傳播產(chǎn)生的影響不可小覷,所以高校需要及時(shí)掌握學(xué)生輿情的發(fā)展動(dòng)態(tài),可以及時(shí)做出有效的監(jiān)管和正確的引導(dǎo)。通過(guò)對(duì)高校網(wǎng)絡(luò)輿情監(jiān)測(cè)的實(shí)際需求分析和概要分析,本文在現(xiàn)有國(guó)內(nèi)外輿情監(jiān)測(cè)的基礎(chǔ)上,構(gòu)建了以python爬蟲(chóng)技術(shù)為基礎(chǔ)的高校輿情監(jiān)測(cè)與分析系統(tǒng),并且根據(jù)高校管理人員的實(shí)際需求對(duì)系統(tǒng)做了詳細(xì)的分析與設(shè)計(jì),通過(guò)網(wǎng)絡(luò)討論平臺(tái)獲取大量輿情數(shù)據(jù)進(jìn)行整合分析,從而實(shí)現(xiàn)多態(tài)勢(shì)輿情的實(shí)時(shí)監(jiān)控和輿情數(shù)據(jù)分析的可視化,其中包含媒體分析、熱度分析、受眾分析等。輿情監(jiān)測(cè)與分析系統(tǒng)包括了四個(gè)模塊:輿情關(guān)鍵字管理模塊、輿情分析模塊、輿情結(jié)果可視化模塊、輿情報(bào)告模塊。從輿情關(guān)鍵詞建立到輿情報(bào)告的展示,高校輿情監(jiān)測(cè)與分析系統(tǒng)將為高校管理人員提供準(zhǔn)確高效的輿情發(fā)展態(tài)勢(shì),輔助高校了解學(xué)生內(nèi)心動(dòng)態(tài),及時(shí)發(fā)展輿情的產(chǎn)生,調(diào)整高校的管理政策,促進(jìn)學(xué)生的健康成長(zhǎng)和高校的穩(wěn)健發(fā)展。關(guān)鍵詞:高校輿情;網(wǎng)絡(luò)爬蟲(chóng);輿情監(jiān)測(cè);輿情分析

AbstractAstechnologychangeswitheachpassingday,communicationmeansandwaysofcommunicationareconstantlyupdated.Asanimportantmediumofinformationcommunication,networkhasbecomeanimportantplatformforcollegestudentstocommunicateandexpresstheirviews.BymakinguseofthecircleofpublicopinionformedspontaneouslybyInternetcitizens,collegestudentscancommunicatemoreconvenientlyandspreadmorediversified,whichmakescollegepublicopinionhavefourmajorcharacteristics:arbitrariness,directness,deviationandsuddenness,therefore,collegesanduniversitiesneedtograspthedevelopmentofopinionintime,andcanmakeeffectivesupervisionandcorrectguidanceintime.BasedontheanalysisoftheactualdemandandsummaryofpublicopinionmonitoringontheInternetincollegesanduniversities,thispaperconstructsapublicopinionmonitoringandanalysissystemincollegesanduniversities,whichisbasedonPythoncrawlertechnology,andaccordingtotheactualneedsofuniversityadministrators,thesystemhasbeenanalyzedanddesignedindetail,andalargenumberofpublicopiniondatahavebeenobtainedthroughthenetworkdiscussionplatformforintegrationanalysis,thusreal-timemonitoringofmulti-situationpublicopinionandvisualizationofpublicopiniondataanalysis,includingmediaanalysis,heatanalysis,audienceanalysisandsoon.PublicOpinionMonitoringandanalysissystemincludesfourmodules:PublicOpinionKeywordManagementModule,PublicOpinionAnalysisModule,publicopinionresultvisualizationmodule,publicopinionreportmodule.Fromtheestablishmentofkeywordsofpublicopiniontothedisplayofpublicopinionreports,themonitoringandanalysissystemofpublicopinionincollegesanduniversitieswillprovidetheadministratorsofcollegesanduniversitieswithaccurateandefficientpublicopiniondevelopmenttrends,andassistcollegesanduniversitiesinunderstandingtheinnerdynamicofstudentsanddevelopingtheproductionofpublicopinionintime,adjustthemanagementpolicyofcollegesanduniversitiestopromotethehealthygrowthofstudentsandthesteadydevelopmentofcollegesanduniversities.Keywords:Collegesentiment;Webspider;Publicopinionmonitoring;PublicOpinionAnalysis

第1章緒論當(dāng)互聯(lián)網(wǎng)技術(shù)逐漸滲透進(jìn)入社會(huì)的各種領(lǐng)域,已然成為社會(huì)中不可或缺的一部分。人們獲取信息的途徑以及日常交流也逐漸由線(xiàn)下轉(zhuǎn)為線(xiàn)上,使得信息的傳播速度呈指數(shù)式增長(zhǎng),同時(shí)隨著生活條件的提升和互聯(lián)網(wǎng)工具的普及,網(wǎng)民數(shù)量急劇增長(zhǎng),年齡趨于年輕化。其中作為生活得到初步自由的高校學(xué)生,他們是在網(wǎng)絡(luò)上發(fā)表意見(jiàn)和關(guān)注社會(huì)熱點(diǎn)的重要群體,因而高校學(xué)生對(duì)于網(wǎng)絡(luò)輿情的爆發(fā)和推動(dòng)起到關(guān)鍵性作用。由于高校學(xué)生涉世未深,長(zhǎng)期處于校園生活,對(duì)社會(huì)熱點(diǎn)的看法容易受到蠱惑和欺騙,從而在網(wǎng)絡(luò)上肆意表達(dá)自己的情緒,對(duì)社會(huì)和學(xué)校造成嚴(yán)重的后果。隨著大數(shù)據(jù)時(shí)代的到來(lái),應(yīng)用大數(shù)據(jù)技術(shù)分析網(wǎng)絡(luò)輿情發(fā)展走向,遏制輿情的產(chǎn)生,是高校管理部門(mén)對(duì)輿情監(jiān)測(cè)與分析的研究方向。研究背景與意義隨著信息時(shí)代的崛起,網(wǎng)絡(luò)對(duì)人們的作用越來(lái)越大。幾年之間,信息的傳播還依靠傳統(tǒng)的報(bào)紙、廣播等方式傳播,現(xiàn)如今網(wǎng)絡(luò)時(shí)代的快速發(fā)展使得互聯(lián)網(wǎng)成為信息最主流的傳播途徑。截止2019年6月,我國(guó)的網(wǎng)民規(guī)模高達(dá)8.54億。人們可以通過(guò)網(wǎng)絡(luò)平臺(tái)及時(shí)獲取信息,并且快速對(duì)信息做出反饋輿情在網(wǎng)絡(luò)中產(chǎn)生的方式,就是人們通過(guò)網(wǎng)絡(luò)平臺(tái)針對(duì)社會(huì)熱點(diǎn)問(wèn)題發(fā)表自己的看法和宣泄情緒的過(guò)程。網(wǎng)絡(luò)輿情的要素包括:互聯(lián)網(wǎng)、網(wǎng)民、熱點(diǎn)事件、互動(dòng)傳播、情感。互聯(lián)網(wǎng)輿情信息以公共媒體、自媒體為載體,圍繞某個(gè)社會(huì)熱點(diǎn)事件,通過(guò)網(wǎng)絡(luò)傳播的迅速性大量聚集情感信息,對(duì)相關(guān)管理部門(mén)產(chǎn)生一定的影響。網(wǎng)絡(luò)媒體具有極強(qiáng)的自由性,目前網(wǎng)絡(luò)監(jiān)管機(jī)制尚不完善,網(wǎng)民利用網(wǎng)絡(luò)自由和可匿名的特點(diǎn),肆意的在網(wǎng)絡(luò)平臺(tái)發(fā)表觀(guān)點(diǎn)、宣泄情緒,使得網(wǎng)民的表達(dá)增加真實(shí)、順暢。對(duì)于傳統(tǒng)的信件報(bào)紙而言,網(wǎng)絡(luò)可以直觀(guān)的、迅速的看到社會(huì)問(wèn)題,表達(dá)人們的心聲,分享他人的意見(jiàn)。同時(shí),網(wǎng)絡(luò)又具有極強(qiáng)的交互性,網(wǎng)民通過(guò)參與社會(huì)熱點(diǎn)問(wèn)題的討論或者向有關(guān)部門(mén)的反映,網(wǎng)民在交流互動(dòng)的過(guò)程中,難免有時(shí)無(wú)法控制住自己的情緒,導(dǎo)致網(wǎng)絡(luò)暴力事件頻發(fā),成為網(wǎng)絡(luò)安全的一大隱患。由于消息是由網(wǎng)民自發(fā)性傳播擴(kuò)散,其中摻雜著濃厚的感情色彩,在傳播的過(guò)程中背離信息原有的真實(shí)性,甚至有些為了達(dá)到目的故意歪曲事實(shí),隨著傳播過(guò)程的積累,往往會(huì)形成強(qiáng)大的輿論,對(duì)社會(huì)甚至國(guó)家產(chǎn)生重大的影響,從而如何利用好網(wǎng)絡(luò)弘揚(yáng)社會(huì)正氣,完善輿情監(jiān)測(cè)分析系統(tǒng),對(duì)輿情的產(chǎn)生提早發(fā)現(xiàn),管理人員及時(shí)制定相應(yīng)的解決方案,是新時(shí)代下國(guó)家的重點(diǎn)任務(wù)。對(duì)于高校來(lái)說(shuō),第一時(shí)間監(jiān)測(cè)到輿情發(fā)展動(dòng)向,是高校掌握學(xué)生動(dòng)態(tài)的重要因素,也是對(duì)學(xué)生的心理需求進(jìn)行相應(yīng)的疏導(dǎo)的首要前提。國(guó)內(nèi)外研究現(xiàn)狀通過(guò)對(duì)大量文獻(xiàn)的閱讀理解,輿情的研究已經(jīng)到了基于大數(shù)據(jù)網(wǎng)絡(luò)輿情的研究階段,在此之前的兩個(gè)階段分別為:輿情的傳統(tǒng)研究階段,主要用于社會(huì)熱點(diǎn)事件、政策的反響、法律法規(guī)領(lǐng)域。網(wǎng)絡(luò)研究階段分為早中期的統(tǒng)計(jì)方法輿情研究理論和如今的大數(shù)據(jù)輿情研究。一系列的網(wǎng)絡(luò)交流平臺(tái)的出現(xiàn),推動(dòng)了基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情的研究,例如Ceron法國(guó)選舉的研究方法。在輿情的研究?jī)?nèi)容中可分為三個(gè)方面:一是網(wǎng)絡(luò)數(shù)據(jù)的抓取,對(duì)數(shù)據(jù)信息進(jìn)行摘要、聚類(lèi)、分類(lèi),通過(guò)算法的實(shí)現(xiàn),對(duì)抓取的數(shù)據(jù)進(jìn)行清洗排重。二是主題跟蹤,在海量的輿情信息中,選定有價(jià)值的主題進(jìn)行深度分析。三是輿情的情感分析,通過(guò)制定有關(guān)的情感詞對(duì)感情傾向性進(jìn)行研究,例如Dave研究的ReviewSeer理論。在國(guó)內(nèi),目前的主流方法是利用正則表達(dá)式,建立爬蟲(chóng)系統(tǒng)進(jìn)行網(wǎng)絡(luò)輿情數(shù)據(jù)的采集,鄭魁等人在中國(guó)科學(xué)院發(fā)明了網(wǎng)絡(luò)輿情熱點(diǎn)數(shù)據(jù)發(fā)現(xiàn)分詞法,主要使用聚類(lèi)、情感檢測(cè)、話(huà)題跟蹤技術(shù)。面對(duì)大數(shù)據(jù)下輿情分析的困滿(mǎn),我國(guó)多位科學(xué)家向此發(fā)出了挑戰(zhàn),李希光、李彪等人在輿情檢測(cè)、預(yù)警上獲得了理論上的成果,李金海等人提出了一套完整的文本挖掘模型,喻國(guó)明等人則是利用分詞技術(shù)對(duì)熱點(diǎn)問(wèn)題分析中取得了進(jìn)步。在美國(guó),最知名的于情監(jiān)測(cè)與分析系統(tǒng)是TDT,該系統(tǒng)面向精準(zhǔn)的用戶(hù),提供專(zhuān)業(yè)的輿情分析業(yè)務(wù),他通過(guò)分析客戶(hù)使用商品時(shí)反饋的意見(jiàn),并通過(guò)品牌的認(rèn)知程度和交易數(shù)據(jù),計(jì)算出客戶(hù)對(duì)此商品的認(rèn)知度。通過(guò)對(duì)結(jié)果的分析,把相應(yīng)的決策數(shù)據(jù)推薦給用戶(hù),對(duì)于公司來(lái)說(shuō),不僅增長(zhǎng)了客戶(hù)的黏性,還使得公司在競(jìng)爭(zhēng)中始終處于領(lǐng)先狀態(tài)。另外,尼爾森公司的核心業(yè)務(wù)為意見(jiàn)挖掘分析服務(wù),他是一個(gè)世界性的是以服務(wù)企業(yè),在報(bào)紙、展覽、出版界的業(yè)務(wù)中均有涉及。尼爾森公司對(duì)服務(wù)對(duì)象公司以往數(shù)據(jù)的調(diào)查,對(duì)公司的意見(jiàn)評(píng)論、線(xiàn)上傳播行為展開(kāi)深度分析,使得公司在競(jìng)爭(zhēng)中占據(jù)有利位置。尼爾森公司的服務(wù)對(duì)象包括微軟、索尼等大型知名公司。就目前而言,大部分公司、企業(yè)都有一套針對(duì)自己的輿情監(jiān)測(cè)與分析系統(tǒng)。通過(guò)收集客戶(hù)對(duì)于產(chǎn)品的建議和反饋,監(jiān)測(cè)分析出產(chǎn)品的運(yùn)營(yíng)情況,從而及時(shí)的制定相關(guān)決策,提高產(chǎn)品質(zhì)量,保持企業(yè)在業(yè)內(nèi)所占據(jù)的優(yōu)勢(shì)。而一些大型的官方媒體,也建有自己的輿情檢測(cè)與分析系統(tǒng),并且配備強(qiáng)硬的技術(shù)團(tuán)隊(duì),全天不間斷的對(duì)網(wǎng)站進(jìn)行監(jiān)控,協(xié)助社會(huì)監(jiān)控輿情的走向,在此方面做得較好的網(wǎng)站為人民網(wǎng)。公司如此,高校亦然。高校作為青少年的聚集地,對(duì)新鮮事物始終保持高漲的態(tài)度,一點(diǎn)風(fēng)吹草動(dòng)就會(huì)引起輿情的發(fā)生,所以對(duì)于高校來(lái)說(shuō),建立一套完善的輿情監(jiān)測(cè)與分析系統(tǒng)顯得尤為重要,高??梢约皶r(shí)掌握學(xué)生的思想行為動(dòng)態(tài),對(duì)高校目前所處的政治思想教育工作疲勞狀態(tài)起到轉(zhuǎn)折的作用。目前,哈爾濱工業(yè)大學(xué)構(gòu)建的“基于論壇的輿情監(jiān)測(cè)系統(tǒng)”和解放軍外國(guó)語(yǔ)學(xué)院的“基于微博的輿情監(jiān)測(cè)與分析系統(tǒng)”為高校輿情系統(tǒng)的典型代表。研究?jī)?nèi)容高校學(xué)生作為信息爆炸時(shí)代輿情產(chǎn)生和傳播的主力軍,對(duì)輿情的走向起到關(guān)鍵性作用,所以建立高校輿情監(jiān)測(cè)與分析系統(tǒng)成為當(dāng)下首要的任務(wù),尤其是在當(dāng)下信息多元化的時(shí)代。因此本文針對(duì)以上問(wèn)題,設(shè)計(jì)一個(gè)高校的輿情監(jiān)測(cè)與分析系統(tǒng)的模型和框架,并對(duì)模塊和組件之間的關(guān)系完善了其主要功能。本文完成的工作包含以下內(nèi)容:1.通過(guò)對(duì)多所高校的管理人員的詢(xún)問(wèn)調(diào)查,在圖書(shū)館翻閱相關(guān)書(shū)籍,對(duì)高校輿情監(jiān)測(cè)與分析系統(tǒng)的需求做出了分析,建立了一套高校輿情監(jiān)測(cè)的系統(tǒng)框架,并且使用信息系統(tǒng)中常見(jiàn)的模塊化思想對(duì)系統(tǒng)做出設(shè)計(jì)。2.根據(jù)需求分析,對(duì)高校輿情監(jiān)測(cè)與分析系統(tǒng)作了詳細(xì)設(shè)計(jì),對(duì)數(shù)據(jù)采集模塊和數(shù)據(jù)分析模塊做了詳細(xì)的設(shè)計(jì)。3.通過(guò)對(duì)高校學(xué)生的了解,貼吧是學(xué)生討論、發(fā)表觀(guān)點(diǎn)最集中的平臺(tái),對(duì)高校貼吧論壇進(jìn)行帖子的規(guī)模爬取,得到數(shù)據(jù)分析所需要的數(shù)據(jù)。4.對(duì)所得的數(shù)據(jù)進(jìn)行敏感詞分析,得到關(guān)鍵詞在貼吧中的出現(xiàn)頻率,進(jìn)而反應(yīng)某些輿情的出現(xiàn)。本文的整體結(jié)構(gòu)安排由五章構(gòu)成,各章節(jié)安排如下。第一章:緒論,闡述高校輿情監(jiān)測(cè)與分析研究的背景,網(wǎng)絡(luò)輿情中高校學(xué)生所占據(jù)的重要性,并闡述了輿情監(jiān)測(cè)與分析國(guó)內(nèi)外的研究現(xiàn)狀。第二章:高校輿情監(jiān)測(cè)與分析的相關(guān)介紹,并對(duì)相關(guān)技術(shù)以及算法進(jìn)行了介紹。如爬蟲(chóng)架構(gòu)scrapy等。第三章:系統(tǒng)需求分析與系統(tǒng)架構(gòu),通過(guò)對(duì)需求的分析和架構(gòu)的設(shè)計(jì),明確了系統(tǒng)的模塊構(gòu)成。然后對(duì)各個(gè)模塊進(jìn)行了介紹。第四章:根據(jù)高校輿情監(jiān)測(cè)與分析系統(tǒng),對(duì)高校輿情檢測(cè)結(jié)果的分析,展示了高校輿情監(jiān)測(cè)與分析系統(tǒng)的部分界面。第五章:結(jié)語(yǔ)。表述了系統(tǒng)在設(shè)計(jì)的過(guò)程中遇到的一些困難,以及在今后的工作和學(xué)習(xí)中對(duì)該系統(tǒng)的改進(jìn)。第2章輿情監(jiān)測(cè)與分析的關(guān)鍵技術(shù)當(dāng)今社會(huì)的輿情監(jiān)測(cè)分析正從網(wǎng)絡(luò)分析階段向大數(shù)據(jù)輿情分析階段過(guò)渡。兩者的不同之處在于數(shù)據(jù)的處理模式上,目前一個(gè)完善的大數(shù)據(jù)輿情分析系統(tǒng)囊括了許多處理模式。本文將通過(guò)已有資料的基礎(chǔ)上,綜合輿情分析的關(guān)鍵技術(shù),在高校輿情規(guī)模不大的情況下,分析本系統(tǒng)用到的一些關(guān)鍵技術(shù)。2.1系統(tǒng)對(duì)robot協(xié)議的應(yīng)用通過(guò)利用robot協(xié)議可以分析爬取的目標(biāo)網(wǎng)站中哪些數(shù)據(jù)是對(duì)外開(kāi)放,可以進(jìn)行爬取的,他可以有效的排除掉不允許爬取的數(shù)據(jù)。將網(wǎng)站視作交通信號(hào)的話(huà),robots.txt則是某些路口的紅綠燈“紅燈禁行”或“綠燈可行”的信號(hào),爬蟲(chóng)就是通過(guò)路口的汽車(chē),根據(jù)信號(hào)燈的指示通行。在國(guó)際上,robot協(xié)議沒(méi)有明確的規(guī)定,他是一種道德類(lèi)型的行業(yè)內(nèi)協(xié)議,在爬蟲(chóng)的過(guò)程中,他用來(lái)抵制進(jìn)行惡意爬取而用作非法行為。他是爬蟲(chóng)技術(shù)人員在道德層面進(jìn)行遵守的一桿旗幟,目前幾乎所有的行業(yè)內(nèi)部人員不會(huì)惡意觸碰這個(gè)道德標(biāo)桿。在此設(shè)計(jì)中,百度貼吧的網(wǎng)站內(nèi)有些是robot協(xié)議禁止爬取的,但是本設(shè)計(jì)只是用作高校的輿情監(jiān)測(cè),保護(hù)高校學(xué)生的身體安全和心理健康,所以此設(shè)計(jì)需要在某些地方跨過(guò)robot協(xié)議,對(duì)正常的數(shù)據(jù)進(jìn)行爬取。2.2爬蟲(chóng)技術(shù)2.2.1爬蟲(chóng)原理爬蟲(chóng)是通過(guò)向目標(biāo)網(wǎng)站發(fā)出爬取請(qǐng)求,并得到目標(biāo)網(wǎng)站回應(yīng)的過(guò)程。爬蟲(chóng)通過(guò)對(duì)先前預(yù)設(shè)好的爬取規(guī)則不斷向目標(biāo)網(wǎng)站獲取數(shù)據(jù)存儲(chǔ)到本機(jī),在爬蟲(chóng)的過(guò)程中需要對(duì)網(wǎng)站進(jìn)行解析,其可以主要運(yùn)行依托于以下幾種技術(shù)。URL(UniversalResourceIdentifier):通用資源標(biāo)識(shí)符,網(wǎng)絡(luò)中每個(gè)資源都是由一個(gè)唯一的URL確定,根據(jù)URL也可以定位到網(wǎng)絡(luò)中的唯一一個(gè)資源。HTTP協(xié)議:超文本傳輸協(xié)議,此協(xié)議是網(wǎng)絡(luò)中應(yīng)用最為常見(jiàn)的一種協(xié)議,HTTP協(xié)議提供了發(fā)布與接收HTML頁(yè)面的方法,由HTML語(yǔ)言編寫(xiě)的網(wǎng)頁(yè)代碼可由瀏覽器渲染成結(jié)構(gòu)清晰的頁(yè)面。2.2.2爬蟲(chóng)流程爬蟲(chóng)通過(guò)URL對(duì)目標(biāo)網(wǎng)站進(jìn)行數(shù)據(jù)請(qǐng)求,當(dāng)目標(biāo)網(wǎng)站接收爬蟲(chóng)的請(qǐng)求之后就開(kāi)始對(duì)網(wǎng)頁(yè)進(jìn)行分析,爬蟲(chóng)將按照之前設(shè)定好的爬蟲(chóng)順序?qū)W(wǎng)頁(yè)依次進(jìn)行URL的請(qǐng)求,目標(biāo)網(wǎng)站不斷處理爬蟲(chóng)請(qǐng)求,并將爬蟲(chóng)程序設(shè)定的需要進(jìn)行爬取的數(shù)據(jù)依次存儲(chǔ)到接口內(nèi)的數(shù)據(jù)庫(kù)中,最終目標(biāo)網(wǎng)站將所有的請(qǐng)求處理完畢之后爬蟲(chóng)結(jié)束。2.2.3爬取方式爬蟲(chóng)的爬取方式包括:橫向、縱向,也可以稱(chēng)為深度優(yōu)先算法與廣度優(yōu)先算法。橫向爬蟲(chóng)抓取是圖算法中最常見(jiàn)的也是最重要的,更是許多其他圖處理的重要途徑。橫向爬取在爬取的設(shè)計(jì)中最為常見(jiàn),設(shè)計(jì)也比較容易,橫向爬取是從系統(tǒng)設(shè)定的最初URL開(kāi)始向目標(biāo)網(wǎng)頁(yè)發(fā)送請(qǐng)求,然后再此URL的基礎(chǔ)上將周?chē)罱腢RL設(shè)為下一個(gè)請(qǐng)求的對(duì)象。在本系統(tǒng)中,以百度貼吧為例,橫向爬蟲(chóng)抓取是從列表第一頁(yè)開(kāi)始,根據(jù)輸入的爬取頁(yè)數(shù)不斷地的向后翻頁(yè),把下一頁(yè)的URL加入到等待爬取的隊(duì)列當(dāng)中。縱向爬蟲(chóng)抓取的策略與橫向爬蟲(chóng)抓取相反,其從起始頁(yè)開(kāi)始,層層深入,一直尋找到?jīng)]有更深的節(jié)點(diǎn),再通過(guò)層層遞歸返回起始頁(yè),搜索完畢所有的節(jié)點(diǎn)。在本系統(tǒng)中,縱向爬蟲(chóng)抓取即指從列表的第一頁(yè)開(kāi)始,獲取所設(shè)定的頁(yè)數(shù)詳情頁(yè)的URL,加入到待爬取隊(duì)列中等待抓取。由于百度貼吧的網(wǎng)頁(yè)特性,從一個(gè)詳情頁(yè)無(wú)法直接到達(dá)另外一個(gè)詳情頁(yè),故此縱向深度為2。此設(shè)計(jì)使用橫向爬取方法,在規(guī)模不大的情況下,可以將系統(tǒng)的性能大范圍提升,將設(shè)定好目標(biāo)貼吧和頁(yè)數(shù)以后逐頁(yè)進(jìn)行數(shù)據(jù)爬取并存儲(chǔ)。2.3scrapy架構(gòu)2.3.1scrapy框架性能優(yōu)勢(shì)scrapy框架作為Python語(yǔ)言中開(kāi)源的第三方庫(kù),他在爬蟲(chóng)的過(guò)程中,對(duì)目標(biāo)網(wǎng)站的數(shù)據(jù)爬取速度快、編寫(xiě)語(yǔ)言簡(jiǎn)潔、適用性強(qiáng)等優(yōu)勢(shì),在特定網(wǎng)站中爬取制定的數(shù)據(jù)結(jié)構(gòu)類(lèi)型,同時(shí)scrapy框架可以根據(jù)開(kāi)發(fā)者不同的開(kāi)發(fā)需求,對(duì)此框架進(jìn)行相應(yīng)的改進(jìn)。本系統(tǒng)采用scrapy框架的原因如下:1.scrapy是基于Twisted的一種框架。Twisted框架是一個(gè)異步IO框架。由于Twisted具有特性,scrapy框架內(nèi)置實(shí)現(xiàn)了單機(jī)多線(xiàn)程,十分有效的提升了性能。應(yīng)用此框架,程序的執(zhí)行流將被外部事件所影響。由于他的此種特性,scrapy不支持分布式爬蟲(chóng),如要實(shí)現(xiàn)分布式,需要使用其他的庫(kù)。2.scrapy的擴(kuò)展功能非常多。在他的框架中包含了眾多的模塊,幾乎包含爬蟲(chóng)技術(shù)需要處理的問(wèn)題,多數(shù)擴(kuò)展的功能都可以在下載第三方庫(kù)中實(shí)現(xiàn),開(kāi)發(fā)效率極高。3.scrapy包含了兩種定位方式css和XPath,可以使爬取到的頁(yè)面進(jìn)行元素的定位,可以對(duì)網(wǎng)頁(yè)的解析效率提升很多。4.scrapy框架開(kāi)發(fā)容易。使用Scrapy框架完成一個(gè)爬蟲(chóng)系統(tǒng)的工作量可以小很多,他其中包含了眾多的第三方庫(kù),每個(gè)庫(kù)的相互協(xié)作使得該框架的性能十分突出。2.3.2scrapy的結(jié)構(gòu)組成Scrapy框架結(jié)構(gòu)嚴(yán)謹(jǐn),功能完善,他的結(jié)構(gòu)組成如圖2.1所示。圖2.1scrapy的結(jié)構(gòu)組成Scrapy框架作為Python爬蟲(chóng)最關(guān)鍵的技術(shù),他是一個(gè)較高層級(jí)的網(wǎng)頁(yè)爬取工具,在目標(biāo)網(wǎng)頁(yè)中將數(shù)據(jù)以特定的結(jié)構(gòu)抓取下來(lái),使用范圍非常廣泛,是輿情監(jiān)測(cè)、輿情分析必不可少的工具。他的中控系統(tǒng)為Engine(中心引擎),他將管道、下載器、爬蟲(chóng)、調(diào)度器連接到一起,通過(guò)中心引擎進(jìn)行數(shù)據(jù)之間的傳遞與交流。調(diào)度器將中心引擎的請(qǐng)求命令進(jìn)行歸類(lèi)操作,按照預(yù)定進(jìn)行排序,然后將有序的請(qǐng)求命令返回中心引擎,相當(dāng)于中心引擎的“加工車(chē)間”。下載器將中心引擎的請(qǐng)求交付于網(wǎng)頁(yè),并且接受網(wǎng)頁(yè)的回應(yīng)交付給中心引擎。爬蟲(chóng)將從網(wǎng)頁(yè)的回應(yīng)中提取其中有用的數(shù)據(jù),然后將下一步需要請(qǐng)求的URL交付給中心引擎,調(diào)度器往返之前的操作,實(shí)現(xiàn)爬蟲(chóng)的自動(dòng)化。管道將爬蟲(chóng)得到的Item(項(xiàng)目)進(jìn)行一系列的操作。2.3.3爬蟲(chóng)模式介紹爬蟲(chóng)技術(shù)下的Scrapy框架,每個(gè)scrapy爬蟲(chóng)框架提供的爬蟲(chóng)類(lèi)都需要被相應(yīng)的Spider所繼承,下面介紹Scrapy框架下的兩種繼承類(lèi)。第一個(gè)類(lèi)是Spider爬蟲(chóng)類(lèi)。他是Scrapy框架中最重要的類(lèi),也是最核心的類(lèi),他可以定義目標(biāo)網(wǎng)站內(nèi)的數(shù)據(jù)被用怎樣的爬取操作來(lái)獲得,將目標(biāo)網(wǎng)站中的數(shù)據(jù)以特定的結(jié)構(gòu)存儲(chǔ)在數(shù)據(jù)庫(kù)中。Spider類(lèi)的操作流程與結(jié)構(gòu)的定義:1.通過(guò)Scrapy框架中最初請(qǐng)求的URLs進(jìn)行網(wǎng)頁(yè)的爬取,然后在下載響應(yīng)的時(shí)候選擇回調(diào)函數(shù)的調(diào)用,start_requests()方法生成特定的請(qǐng)求和回調(diào)函數(shù)。同時(shí)使用BeautifulSoup4庫(kù)和lxml庫(kù)對(duì)目標(biāo)網(wǎng)站進(jìn)行解析,將其轉(zhuǎn)變?yōu)樘囟?xiàng)。最后通過(guò)管道將數(shù)據(jù)存入到數(shù)據(jù)庫(kù)中。2.name屬性用來(lái)是標(biāo)識(shí)爬蟲(chóng)程序的,必須要保證name屬性不能有重復(fù)的出現(xiàn)。allowed_domains是記錄spider可以進(jìn)行爬蟲(chóng)的屬性。start_urls定義了爬蟲(chóng)程序開(kāi)始爬蟲(chóng)的爬取的地方。Logger用來(lái)發(fā)送消息。start_requests()用來(lái)定義網(wǎng)頁(yè)的響應(yīng),在程序執(zhí)行時(shí)只能被調(diào)用一次。第二個(gè)類(lèi)是CrawlSpider爬蟲(chóng)類(lèi)。CrawlSpider對(duì)所有的爬蟲(chóng)類(lèi)進(jìn)行了繼承,他對(duì)網(wǎng)頁(yè)中的link可以定義相應(yīng)的規(guī)則機(jī)制。Spider類(lèi)的結(jié)構(gòu)定義:allow用來(lái)選擇接受一個(gè)表達(dá)式還是一整個(gè)列表,當(dāng)此屬性的參數(shù)為空時(shí),則系統(tǒng)默認(rèn)爬取整個(gè)網(wǎng)頁(yè)鏈接。deny的屬性與allow屬性正好相反,用來(lái)排除url和正則表達(dá)式鏈接。因?yàn)樵撓到y(tǒng)需要爬取的數(shù)據(jù)規(guī)模不大,只需要選擇其中爬取的頁(yè)數(shù)就可以實(shí)現(xiàn)該系統(tǒng)的需求。所以該系統(tǒng)選擇使用了Spider爬蟲(chóng)類(lèi),通過(guò)start_urls使爬蟲(chóng)從網(wǎng)頁(yè)的第一列表頁(yè)開(kāi)始向后爬取選擇的頁(yè)數(shù),同時(shí)使用Spider爬蟲(chóng)類(lèi),編寫(xiě)系統(tǒng)代碼的工作量會(huì)輕松很多,方便后期對(duì)程序的完善。第3章需求分析和系統(tǒng)總體架構(gòu)3.1可行性分析技術(shù)可行性。本系統(tǒng)使用PyCharm作為開(kāi)發(fā)工具,以Python作為開(kāi)發(fā)語(yǔ)言,Scrapy爬蟲(chóng)框架進(jìn)行數(shù)據(jù)的收集,Mysql作為數(shù)據(jù)存儲(chǔ)庫(kù),Jieba進(jìn)行分詞,Pandas、Matplotlib、Numpy進(jìn)行數(shù)據(jù)可視化處理,所以系統(tǒng)在技術(shù)上是可行的。經(jīng)濟(jì)可行性。本系統(tǒng)所使用的PyCharm是官方免費(fèi)版軟件,涉及到的開(kāi)發(fā)技術(shù)、包都為開(kāi)源免費(fèi)的。所使用數(shù)據(jù)庫(kù)也為免費(fèi)的,系統(tǒng)的維護(hù)成本微乎其微,所以本系統(tǒng)在經(jīng)濟(jì)上是可行的。法律可行性。本系統(tǒng)所使用的軟件、數(shù)據(jù)庫(kù)、技術(shù)都為開(kāi)源免費(fèi)的,在使用過(guò)程中不涉及版權(quán)問(wèn)題,對(duì)于數(shù)據(jù)爬取網(wǎng)站來(lái)說(shuō),本系統(tǒng)在嚴(yán)格遵循網(wǎng)站的robot協(xié)議的前提,爬取過(guò)程不會(huì)涉及違法行為,得到的數(shù)據(jù)均為網(wǎng)頁(yè)公開(kāi)數(shù)據(jù),所以本系統(tǒng)在法律上是可行的。3.2系統(tǒng)需求分析3.2.1業(yè)務(wù)需求分析本文以高校貼吧作為信息源進(jìn)行分析研究,以爬取到貼吧內(nèi)容作為系統(tǒng)的初步目標(biāo),由于貼吧內(nèi)容繁雜,反爬蟲(chóng)機(jī)制健全,無(wú)法通過(guò)短時(shí)間內(nèi)獲取到一定規(guī)模的有效信息,故本系統(tǒng)可以根據(jù)需求任意選擇爬取的貼吧名字和爬取的頁(yè)數(shù),根據(jù)輿情發(fā)展時(shí)間和熱度的高低設(shè)定貼吧爬取范圍。主要工作放在信息分析方面,通過(guò)數(shù)據(jù)展示出高校學(xué)生最為關(guān)心的問(wèn)題,從而提前預(yù)知高校輿情的走向。由于本系統(tǒng)的主要實(shí)現(xiàn)功能是圍繞高校輿情監(jiān)測(cè)與分析展開(kāi),所以本系統(tǒng)應(yīng)該完成的關(guān)鍵功能包括以下方面的內(nèi)容:高校貼吧的帖子信息該系統(tǒng)本身不會(huì)生成數(shù)據(jù)信息,系統(tǒng)所需的數(shù)據(jù)信息來(lái)源于高校貼吧中學(xué)生的發(fā)帖與評(píng)論。但是由于貼吧的數(shù)據(jù)庫(kù)并不向用戶(hù)開(kāi)放,所以要想得到所需要的數(shù)據(jù)需要利用爬蟲(chóng)技術(shù)對(duì)高校貼吧中的原始數(shù)據(jù)進(jìn)行爬取,為系統(tǒng)進(jìn)行數(shù)據(jù)分析創(chuàng)造條件。根據(jù)輿情監(jiān)測(cè)者的需求選擇爬取的貼吧名字與爬取帖子的頁(yè)數(shù)。數(shù)據(jù)進(jìn)行分析并且將數(shù)據(jù)可視化3.2.2功能性需求分析系統(tǒng)通過(guò)對(duì)于貼吧數(shù)據(jù)的水平廣度爬取。其中水平爬取是將貼吧網(wǎng)頁(yè)進(jìn)行廣度優(yōu)先爬取操作,可以實(shí)現(xiàn)在網(wǎng)頁(yè)的第一層就可獲得所需要的數(shù)據(jù),很大程度上提升了數(shù)據(jù)爬取的效率。由于百度貼吧對(duì)反爬蟲(chóng)機(jī)制做得相對(duì)完善,反爬蟲(chóng)機(jī)制對(duì)于一個(gè)主機(jī)IP頻繁訪(fǎng)問(wèn)和流量訪(fǎng)問(wèn)進(jìn)行監(jiān)控,從而達(dá)到對(duì)爬蟲(chóng)的限制,一旦對(duì)本機(jī)IP進(jìn)行封鎖后,此IP將不能繼續(xù)進(jìn)行數(shù)據(jù)的爬取,所以此系統(tǒng)必須要克服反爬蟲(chóng)機(jī)制的限制,具備在反爬蟲(chóng)機(jī)制下爬取數(shù)據(jù)的能力。圖3.1數(shù)據(jù)爬取功能系統(tǒng)分析數(shù)據(jù)功能是指將爬取數(shù)據(jù)得到的帖子以及評(píng)論信息進(jìn)行處理,實(shí)現(xiàn)數(shù)據(jù)的可視化功能。數(shù)據(jù)處理首先除去數(shù)據(jù)中無(wú)效的數(shù)據(jù),將有效的數(shù)據(jù)按照類(lèi)別特征轉(zhuǎn)化為相應(yīng)的特征數(shù)值,篩選掉冗余的數(shù)據(jù)。其次處理干凈的數(shù)據(jù)通過(guò)圖表的形式,將貼吧中有效的信息進(jìn)行挖掘,從而達(dá)到用戶(hù)可讀的可視化效果,給予用戶(hù)提供參考依據(jù)。圖3.2數(shù)據(jù)分析功能3.3系統(tǒng)總體架構(gòu)系統(tǒng)的整體架構(gòu)如下:1.安裝PyCharm編程軟件,MySQL數(shù)據(jù)庫(kù),scarpy、jieba等第三方庫(kù),為系統(tǒng)的運(yùn)行搭建前期環(huán)境。2.根據(jù)百度貼吧的網(wǎng)頁(yè)結(jié)構(gòu),制定相應(yīng)的爬蟲(chóng)方式,從而實(shí)現(xiàn)對(duì)貼吧貼子以及評(píng)論的爬取,再通過(guò)數(shù)據(jù)的封裝、清洗,在數(shù)據(jù)中提取到有價(jià)值的信息,并將信息存入到數(shù)據(jù)庫(kù)中。3.有效利用反爬蟲(chóng)技術(shù),避開(kāi)貼吧對(duì)爬蟲(chóng)的限制。4.通過(guò)對(duì)提取出的信息進(jìn)行分析處理,實(shí)現(xiàn)數(shù)據(jù)的可視化操作。3.3.1爬取對(duì)象分析該系統(tǒng)以爬取高校貼吧帖子和評(píng)論為目標(biāo),其貼吧帖子和評(píng)論格式較為固定,因此數(shù)據(jù)庫(kù)的設(shè)定相對(duì)簡(jiǎn)單。本次將爬取貼吧中的標(biāo)題、帖子內(nèi)容、評(píng)論等內(nèi)容。表3.1為爬取的目標(biāo)網(wǎng)站以及網(wǎng)站的分析。表3.1目標(biāo)網(wǎng)站分析目標(biāo)網(wǎng)站反爬能力爬取方式百度貼吧強(qiáng)Scarpy列表頁(yè)爬取“百度貼吧”作為高校學(xué)生發(fā)表評(píng)論、分享觀(guān)點(diǎn)最密集的地方,其中含有大量的學(xué)生生活動(dòng)態(tài)和內(nèi)心活動(dòng)。由于高校學(xué)生在百度貼吧中相對(duì)活躍,人員相對(duì)集中,在一定程度上反映出了高校學(xué)生內(nèi)心的真實(shí)動(dòng)態(tài),將百度貼吧作為輿情監(jiān)測(cè)的目標(biāo)網(wǎng)站,可以有效的分析出輿情的產(chǎn)生于發(fā)展方向,符合本論文的研究方向。3.3.2模塊設(shè)計(jì)該校輿情監(jiān)測(cè)與分析系統(tǒng)主要由爬蟲(chóng)模塊、數(shù)據(jù)庫(kù)模塊、數(shù)據(jù)分析模塊構(gòu)成。圖3.3系統(tǒng)模塊構(gòu)成爬蟲(chóng)模塊是該系統(tǒng)設(shè)計(jì)的關(guān)鍵,通過(guò)第三方庫(kù)scarpy實(shí)現(xiàn)對(duì)百度貼吧網(wǎng)頁(yè)的解析,將網(wǎng)頁(yè)每一項(xiàng)div中的數(shù)據(jù)進(jìn)行歸類(lèi),實(shí)現(xiàn)對(duì)數(shù)據(jù)的爬取,并且將爬取到的數(shù)據(jù)存儲(chǔ)到后臺(tái)的MySQL數(shù)據(jù)庫(kù)中,爬蟲(chóng)模塊中的子模塊名以及介紹如表3.2所示。表3.2子模塊功能描述模塊名介紹爬蟲(chóng)準(zhǔn)備模塊在系統(tǒng)爬取數(shù)據(jù)之前,完成對(duì)爬蟲(chóng)所需要的第三方庫(kù)的下載和相關(guān)環(huán)境的配置,對(duì)百度貼吧網(wǎng)頁(yè)的結(jié)構(gòu)進(jìn)行分析,保證數(shù)據(jù)歸類(lèi)存儲(chǔ)到數(shù)據(jù)庫(kù)內(nèi)數(shù)據(jù)爬取模塊數(shù)據(jù)爬取的關(guān)鍵之處就是對(duì)百度貼吧網(wǎng)頁(yè)結(jié)構(gòu)的解析,通過(guò)分析需要獲取的標(biāo)題、內(nèi)容、作者等有關(guān)數(shù)據(jù),利用scarpy將數(shù)據(jù)進(jìn)行爬取。數(shù)據(jù)庫(kù)存儲(chǔ)模塊數(shù)據(jù)庫(kù)是一個(gè)系統(tǒng)后臺(tái)最為關(guān)鍵的部分,連接MySQL數(shù)據(jù)庫(kù)接口,將數(shù)據(jù)一一的存入到baidu庫(kù)的相應(yīng)表中反爬蟲(chóng)模塊由于百度貼吧的對(duì)惡意爬取的限制十分嚴(yán)格,為了保證將數(shù)據(jù)爬取下來(lái),本系統(tǒng)利用了scarpy庫(kù)中的反爬蟲(chóng)技術(shù)

第四章高校輿情監(jiān)測(cè)與分析系統(tǒng)實(shí)現(xiàn)爬蟲(chóng)模塊4.1.1爬蟲(chóng)框架的搭建本系統(tǒng)使用到的開(kāi)發(fā)程序?yàn)镻ycharm,他是JetBrains設(shè)計(jì)開(kāi)發(fā)的一款由python語(yǔ)言進(jìn)行編程的軟件。Pycharm開(kāi)發(fā)軟件中可以自定義第三方的庫(kù),下載scrapy框架庫(kù)和該庫(kù)需要并行的第三方庫(kù),配置所有庫(kù)所需要的運(yùn)行環(huán)境,將存儲(chǔ)接口連接到數(shù)據(jù)庫(kù),就可以通過(guò)解析網(wǎng)頁(yè)實(shí)現(xiàn)對(duì)數(shù)據(jù)爬取并且存儲(chǔ)。本系統(tǒng)使用到的第三方庫(kù)如圖4.1所示。圖4.1PyCharm第三方庫(kù)在此系統(tǒng)的爬取功能設(shè)置完畢后,所使用的scrapy框架結(jié)構(gòu)如圖4.2中Baidutieba文件夾中所示。圖4.2scrapy文件框架框架中的重要文件及功能介紹如表4.1。表4.1scrapy主要文件介紹文件名功能settings.py此模塊設(shè)定了對(duì)爬取方式,遵循的協(xié)議和使用的功能。init.py此模塊定義了鏈接到的Mysql數(shù)據(jù)庫(kù)4.1.2系統(tǒng)爬取用戶(hù)通過(guò)系統(tǒng)輸入任何一個(gè)合法貼吧名字,然后根據(jù)輿情預(yù)測(cè)規(guī)模大小和結(jié)合高校自身情況選擇需要爬取貼吧網(wǎng)站的頁(yè)數(shù)(每頁(yè)的爬取時(shí)間在4秒鐘左右)。圖4.3數(shù)據(jù)爬取頁(yè)面獲取頁(yè)面信息,并用xpath解析內(nèi)容,通過(guò)頁(yè)面分析可知道每一個(gè)帖子都是一個(gè)li。循環(huán)遍歷取出內(nèi)容,并拼接帖子url,進(jìn)入帖子詳情頁(yè)面通過(guò)html分析獲得一樓文本。系統(tǒng)會(huì)自動(dòng)翻頁(yè)爬取貼吧的標(biāo)題、作者、發(fā)布時(shí)間、鏈接、回復(fù)數(shù)量、帖子內(nèi)容。將爬取到的數(shù)據(jù)存儲(chǔ)到Mysql數(shù)據(jù)庫(kù)的baidu庫(kù)下。系統(tǒng)通過(guò)解析數(shù)據(jù)庫(kù),從數(shù)據(jù)庫(kù)讀取bordered表中數(shù)據(jù)以表格的形式展示到系統(tǒng)的html頁(yè)面上tableclass="tabletable-bordered">。如下圖所示。圖4.4數(shù)據(jù)可視化頁(yè)面用戶(hù)可以根據(jù)數(shù)據(jù)的可視化完整的看到目標(biāo)網(wǎng)站的所有帖子內(nèi)容,根據(jù)標(biāo)題、內(nèi)容、回復(fù)數(shù)量直觀(guān)的了解每一個(gè)話(huà)題的內(nèi)容和關(guān)注程度。細(xì)致的掌握每一個(gè)話(huà)題的動(dòng)向。數(shù)據(jù)分析模塊系統(tǒng)根據(jù)爬蟲(chóng)系統(tǒng)對(duì)貼吧網(wǎng)頁(yè)的數(shù)據(jù)進(jìn)行一定規(guī)模的爬取后,對(duì)目標(biāo)數(shù)據(jù)進(jìn)行重新審核檢查和校驗(yàn),將重復(fù)的數(shù)據(jù)信息進(jìn)行刪減,改正格式不正確,最終保證數(shù)據(jù)的獨(dú)立性和統(tǒng)一性,完成系統(tǒng)可以將數(shù)據(jù)進(jìn)行批處理的歸一化。通過(guò)對(duì)初始臟數(shù)據(jù)的預(yù)處理,得到干凈的、連續(xù)的、標(biāo)準(zhǔn)的可進(jìn)行Python庫(kù)可視化操作的數(shù)據(jù)。為系統(tǒng)進(jìn)一步的模型建立提供準(zhǔn)確性。通過(guò)使用duplicated()函數(shù)和pandas函數(shù),集中進(jìn)行檢測(cè)是否存在數(shù)據(jù)重復(fù),將重復(fù)的數(shù)據(jù)利用drop_duplicates()函數(shù)進(jìn)行刪除。利用第三方Jieba庫(kù),導(dǎo)入自定義詞典,獲取停用詞list,然后刪除jieba空格、刪除停止詞后的分詞,使用reverse降序排序字典,最后得到關(guān)鍵詞以及關(guān)鍵詞出現(xiàn)的次數(shù),完成分詞操作,對(duì)后面數(shù)據(jù)分析創(chuàng)造條件。數(shù)據(jù)可視化模塊詞云展示Python語(yǔ)言中pyecharts庫(kù)是一個(gè)開(kāi)源的完成詞云繪制的關(guān)鍵庫(kù)。首先引入pandas庫(kù)和numpy庫(kù)對(duì)數(shù)據(jù)進(jìn)行分析,通過(guò)pandas庫(kù)中的read-csv進(jìn)行文件的讀取,再通過(guò)文件的具體類(lèi)型進(jìn)行sep參數(shù)的設(shè)置,利用字符串join方法,使列表轉(zhuǎn)化為字符串。第二,引入collection庫(kù)中的counter方法,返回詞匯出現(xiàn)頻率的統(tǒng)計(jì)。第三,使用sorted方法和lambda函數(shù)得到分詞關(guān)鍵詞,choices_number=50取出關(guān)鍵詞出現(xiàn)頻率排名在前50的關(guān)鍵詞。最后,通過(guò)pyecharts庫(kù),設(shè)置wordcloud.add參數(shù)字體、顏色、大小、傾斜度,得到詞云如下圖所示。圖4.5詞云展示為了使高校輿情信息的及時(shí)發(fā)現(xiàn)處理。詞云是高校輿情管理人員發(fā)現(xiàn)學(xué)生動(dòng)態(tài)異常、掌握學(xué)生近期關(guān)注話(huà)題最直接的方式。詞云通過(guò)詞匯的形式展示學(xué)生近期最佳關(guān)注的話(huà)題,詞匯區(qū)分顏色大小位置,將出現(xiàn)次數(shù)最多的詞匯放到圖形的中心并且增加字號(hào),系統(tǒng)管理人員可以第一時(shí)間發(fā)現(xiàn)高校內(nèi)的熱點(diǎn)話(huà)題,如果話(huà)題內(nèi)容為負(fù)面詞匯,高??梢缘谝粫r(shí)間掌控信息,扭轉(zhuǎn)輿情的爆發(fā)。熱點(diǎn)話(huà)題詞頻通過(guò)引入jieba庫(kù)中的anasyle方法,收集數(shù)據(jù)中每個(gè)關(guān)鍵詞匯以及每個(gè)關(guān)鍵詞出現(xiàn)的頻率。對(duì)詞頻前20名的詞匯出現(xiàn)頻率以柱狀圖的形式展示出來(lái),可以使得高校輿情管理人員掌握學(xué)生對(duì)熱點(diǎn)話(huà)題的關(guān)注人數(shù),了解輿情的規(guī)模大小。關(guān)鍵詞頻率可視化如下圖。圖4.6高頻詞統(tǒng)計(jì)通過(guò)后臺(tái)對(duì)高頻詞的分析,表4.2對(duì)有效、重要的高頻詞進(jìn)行了統(tǒng)計(jì),可以明顯的看出關(guān)鍵詞考研出現(xiàn)的頻率最高,說(shuō)明考研是山東管理學(xué)院最受關(guān)注的話(huà)題,足以說(shuō)明學(xué)習(xí)氛圍的濃郁。其次,開(kāi)學(xué)、成績(jī)、專(zhuān)升本、資料等關(guān)鍵詞出現(xiàn)頻率也都排名在前列并且差距不大,這些關(guān)鍵詞都為正面話(huà)題。當(dāng)某一種關(guān)鍵詞的出現(xiàn)頻率遠(yuǎn)高于其他關(guān)鍵詞或者有負(fù)面關(guān)鍵詞出現(xiàn)時(shí),則會(huì)有輿情爆發(fā)的風(fēng)險(xiǎn),管理人員應(yīng)隨時(shí)關(guān)注,及時(shí)作出相應(yīng)的決策。表4.2重要高頻詞次數(shù)統(tǒng)計(jì)高頻排名重要高頻詞數(shù)量統(tǒng)計(jì)(次)1考研202學(xué)校193開(kāi)學(xué)134成績(jī)125專(zhuān)升本96資料67時(shí)間68畢業(yè)69學(xué)長(zhǎng)610考試511專(zhuān)業(yè)5通過(guò)詞云與熱點(diǎn)主題詞匯出現(xiàn)的頻率,使得高校輿情管理人員掌握學(xué)生對(duì)熱點(diǎn)話(huà)題的關(guān)注人數(shù),了解輿情的規(guī)模大小。針對(duì)不同程度,不同情感的輿情,高??梢约皶r(shí)作出相應(yīng)的決策。貼吧評(píng)論數(shù)量區(qū)間通過(guò)統(tǒng)計(jì)貼吧不同樓層范圍內(nèi)的回復(fù)數(shù)量,將20層設(shè)為分界點(diǎn)。統(tǒng)計(jì)數(shù)據(jù)中20層以上的樓層如果占比越大,說(shuō)明此時(shí)間段內(nèi)可能會(huì)出現(xiàn)熱點(diǎn)話(huà)題討論高潮,意味著將會(huì)有輿情的發(fā)生,所以用戶(hù)根據(jù)實(shí)時(shí)監(jiān)控樓層回復(fù)數(shù)量的占比,可以有效的預(yù)測(cè)輿情的發(fā)生,詞云和排名前20的關(guān)鍵詞分析出輿情的主題,從而高校輿情管理人員及時(shí)的做出決策,避免負(fù)面輿情的發(fā)展。貼吧評(píng)論數(shù)量區(qū)間扇形圖和柱狀圖如下所示。圖4.7樓層回復(fù)數(shù)量統(tǒng)計(jì)

結(jié)語(yǔ)本文通過(guò)使用python語(yǔ)言按照前期開(kāi)題報(bào)告要求實(shí)現(xiàn)了一個(gè)高校輿情監(jiān)測(cè)與分析系統(tǒng),功能基本完善,對(duì)高校貼吧的監(jiān)測(cè)具有一定的效果。隨著大數(shù)據(jù)時(shí)代的前進(jìn),高校學(xué)生作為新時(shí)代下的接班人,對(duì)網(wǎng)絡(luò)的依賴(lài)性與迷茫性很高,此系統(tǒng)將高校學(xué)生在網(wǎng)絡(luò)中的言行舉止記錄下來(lái),關(guān)注他們?cè)谏钪械牧硪环N狀態(tài),使得高校在一定程度上幫助學(xué)生調(diào)整心態(tài),避免輿情的大面積爆發(fā),具有一定的實(shí)現(xiàn)意義。在本系統(tǒng)的設(shè)計(jì)開(kāi)發(fā)中,我學(xué)習(xí)使用了scrapy框架對(duì)網(wǎng)頁(yè)進(jìn)行數(shù)據(jù)的爬取,將爬取的工作量降到最低。Python中的第三方庫(kù)是完成此系統(tǒng)的關(guān)鍵,通過(guò)開(kāi)源的第三方庫(kù),Jieba庫(kù)實(shí)現(xiàn)了對(duì)數(shù)據(jù)的分詞,pandas庫(kù)和numpy庫(kù)對(duì)數(shù)據(jù)進(jìn)行分析,pyecharts庫(kù)是一個(gè)開(kāi)源的完成詞云繪制的關(guān)鍵庫(kù)。對(duì)第三方庫(kù)的綜合利用,發(fā)現(xiàn)數(shù)據(jù)分析技術(shù)已經(jīng)逐漸滲透到我們的工作生活當(dāng)中,使得我們擺脫傳統(tǒng)的手工統(tǒng)計(jì)工作,以最高的效率得到我們想要的統(tǒng)計(jì)結(jié)果。但是本系統(tǒng)還有很大的優(yōu)化空間,現(xiàn)在數(shù)據(jù)分析操作較為簡(jiǎn)單,距離市面上的高級(jí)輿情監(jiān)測(cè)與分析系統(tǒng)仍具有很大差距,通過(guò)今后工作和學(xué)習(xí)中對(duì)相關(guān)技術(shù)的深入了解,不斷高校輿情監(jiān)測(cè)與分析系統(tǒng)。

電腦不啟動(dòng)故障診治了解電腦啟動(dòng)的過(guò)程在諸多電腦故障中,無(wú)法正常啟動(dòng)是最令用戶(hù)頭痛的事了。筆者長(zhǎng)期從事維護(hù)電腦的工作,在這個(gè)方面積累了一些經(jīng)驗(yàn),現(xiàn)在就將這些經(jīng)驗(yàn)整理歸納出來(lái)與朋友們分享。本文將以家用電腦和windows98操作系統(tǒng)為基礎(chǔ),介紹電腦無(wú)法正常啟動(dòng)故障的診治。要想準(zhǔn)確地診斷電腦不啟動(dòng)故障,首先要了解的起動(dòng)過(guò)程,當(dāng)我們按下電源開(kāi)關(guān)時(shí),電源就開(kāi)始向主板和其它設(shè)備供電,此時(shí)電壓還沒(méi)有完全穩(wěn)定,主板控制芯片組會(huì)根據(jù)CMOS中的CPU主頻設(shè)置向CPU發(fā)出一個(gè)Reset(重置)信號(hào),讓CPU初始化,電壓完全穩(wěn)定后,芯片組會(huì)撤去Reset信號(hào),CPU馬上從地址FFFF0H處執(zhí)行一條跳轉(zhuǎn)指令,跳到系統(tǒng)BIOS中真正的啟動(dòng)代碼處。系統(tǒng)BIOS首先要做的事情就是進(jìn)行POST(PowerOnSelfTest,加電自檢)。POST的主要任務(wù)是檢測(cè)系統(tǒng)中的一些關(guān)鍵設(shè)備(電源、CPU芯片、BIOS芯片、定時(shí)器芯片、數(shù)據(jù)收發(fā)邏輯電路、DMA控制器、中斷控制器以及基本的64K內(nèi)存和內(nèi)存刷新電路等)是否存在和能否正常工作,如內(nèi)存和顯卡等。自檢通過(guò)后,系統(tǒng)BIOS將查找顯示卡的BIOS,由顯卡BIOS來(lái)完成顯示卡的初始化,顯示器開(kāi)始有顯示,自此,系統(tǒng)就具備了最基本的運(yùn)行條件,可以對(duì)主板上的其它部分進(jìn)行診斷和測(cè)試,再發(fā)現(xiàn)故障時(shí),屏幕上會(huì)有提示,但一般不死機(jī),接著系統(tǒng)BIOS將檢測(cè)CPU的類(lèi)型和工作頻率,然后開(kāi)始測(cè)試主機(jī)所有的內(nèi)存容量,內(nèi)存測(cè)試通過(guò)之后,系統(tǒng)BIOS將開(kāi)始檢測(cè)系統(tǒng)中安裝的一些標(biāo)準(zhǔn)硬件設(shè)備,這些設(shè)備包括:硬盤(pán)、CD-ROM、軟驅(qū)、串行接口和并行接口等連接的設(shè)備,大多數(shù)新版本的系統(tǒng)BIOS在這一過(guò)程中還要自動(dòng)檢測(cè)和設(shè)置內(nèi)存的相關(guān)參數(shù)、硬盤(pán)參數(shù)和訪(fǎng)問(wèn)模式等。標(biāo)準(zhǔn)設(shè)備檢測(cè)完畢后,系統(tǒng)BIOS內(nèi)部的支持即插即用的代碼將開(kāi)始檢測(cè)和配置系統(tǒng)中已安裝的即插即用設(shè)備。每找到一個(gè)設(shè)備之后,系統(tǒng)BIOS都會(huì)在屏幕上顯示出設(shè)備的名稱(chēng)和型號(hào)等信息,同時(shí)為該設(shè)備分配中斷、DMA通道和I/O端口等資源。最后系統(tǒng)BIOS將更新ESCD(ExtendedSystemConfigurationData,擴(kuò)展系統(tǒng)配置數(shù)據(jù))。ESCD數(shù)據(jù)更新完畢后,系統(tǒng)BIOS的啟動(dòng)代碼將進(jìn)行它的最后一項(xiàng)工作,即根據(jù)用戶(hù)指定的啟動(dòng)順序從軟盤(pán)、硬盤(pán)或光驅(qū)啟動(dòng)。以從C盤(pán)啟動(dòng)為例,系統(tǒng)BIOS將讀取并執(zhí)行硬盤(pán)上的主引導(dǎo)記錄,主引導(dǎo)記錄接著從分區(qū)表中找到第一個(gè)活動(dòng)分區(qū),然后讀取并執(zhí)行這個(gè)活動(dòng)分區(qū)的分區(qū)引導(dǎo)記錄,而分區(qū)引導(dǎo)記錄將負(fù)責(zé)讀取并執(zhí)行IO.SYS,這是Windows最基本的系統(tǒng)文件。IO.SYS首先要初始化一些重要的系統(tǒng)數(shù)據(jù),然后就顯示出我們熟悉的藍(lán)天白云,在這幅畫(huà)面之下,Windows將繼續(xù)進(jìn)行DOS部分和GUI(圖形用戶(hù)界面)部分的引導(dǎo)和初始化工作,一切順利結(jié)束,電腦正常啟動(dòng)。根據(jù)故障現(xiàn)象診治了解電腦啟動(dòng)的過(guò)程,故障就好判斷了,下面我們就根據(jù)故障現(xiàn)象開(kāi)始診治了:現(xiàn)象一:系統(tǒng)完全不能啟動(dòng),見(jiàn)不到電源指示燈亮,也聽(tīng)不到冷卻風(fēng)扇的聲音。這時(shí),基本可以認(rèn)定是電源部分故障,檢查:電源線(xiàn)和插座是否有電、主板電源插頭是否連好,UPS是否正常供電,再確認(rèn)電源是否有故障,最簡(jiǎn)單的就是替換法,但一般用戶(hù)家中不可能備有電源等備件,這時(shí)可以嘗試使用下面的方法(注意:要慎重):先把硬盤(pán),CPU風(fēng)扇,或者CDROM連好,然后把ATX主板電源插頭用一根導(dǎo)線(xiàn)連接兩個(gè)插腳(把插頭的一側(cè)突起對(duì)著自己,上層插腳從左數(shù)第4個(gè)和下層插腳從右數(shù)第3個(gè),方向一定要正確),然后把ATX電源的開(kāi)關(guān)打開(kāi),如果電源風(fēng)扇轉(zhuǎn)動(dòng),說(shuō)明電源正常,否則電源損壞。如果電源沒(méi)問(wèn)題直接短接主板上電源開(kāi)關(guān)的跳線(xiàn),如果正常,說(shuō)明機(jī)箱面板的電源開(kāi)關(guān)損壞?,F(xiàn)象二:電源批示燈亮,風(fēng)扇轉(zhuǎn),但沒(méi)有明顯的系統(tǒng)動(dòng)作。這種情況如果出現(xiàn)在新組裝電腦上應(yīng)該首先檢查CPU是否插牢或更換CPU,而正在使用的電腦的CPU損壞的情況比較少見(jiàn)(人為損壞除外),損壞時(shí)一般多帶有焦糊味,如果剛剛升級(jí)了BIOS或者遭遇了CIH病毒攻擊,這要考慮BIOS損壞問(wèn)題(BIOS莫名其妙的損壞也是有的),修復(fù)BIOS的方法很多雜志都介紹過(guò)就不重復(fù)了;確認(rèn)CPU和BIOS沒(méi)問(wèn)題后,就要考慮CMOS設(shè)置問(wèn)題,如果CPU主頻設(shè)置不正確也會(huì)出現(xiàn)這種故障,解決方法就是將CMOS信息清除,既要將CMOS放電,一般主板上都有一個(gè)CMOS放電的跳線(xiàn),如果找不到這個(gè)跳線(xiàn)可以將CMOS電池取下來(lái),放電時(shí)間不要低于5分鐘,然后將跳線(xiàn)恢復(fù)原狀或重新安裝好電池即可;如果CPU、BIOS和CMOS都沒(méi)問(wèn)題還要考慮電源問(wèn)題:PC機(jī)電源有一個(gè)特殊的輸出信號(hào),稱(chēng)為POWERGOOD(PG)信號(hào),如果PG信號(hào)的低電平持續(xù)時(shí)間不夠或沒(méi)有低電平時(shí)間,PC機(jī)將無(wú)法啟動(dòng)。如果PG信號(hào)一直為低電平,則PC機(jī)系統(tǒng)始終處于復(fù)位狀態(tài)。這時(shí)PC機(jī)也出現(xiàn)黑屏、無(wú)聲響等死機(jī)現(xiàn)象。但這需要專(zhuān)業(yè)的維修工具外加一些維修經(jīng)驗(yàn),因此,建議采用替換法;電源沒(méi)有問(wèn)題就要檢查是否有短路,確保主板表面不和金屬(特別是機(jī)箱的安裝固定點(diǎn))接觸。把主板和電源拿出機(jī)箱,放在絕緣體表面,如果能啟動(dòng),說(shuō)明主板有短路現(xiàn)象;如果還是不能啟動(dòng)則要考慮主板問(wèn)題,主板故障較為復(fù)雜,可以使用替換法確認(rèn),然后更換主板?,F(xiàn)象三:電源指示燈亮,系統(tǒng)能啟動(dòng),但系統(tǒng)在初始化時(shí)停住了,而且可以聽(tīng)到嗽叭的鳴叫聲(沒(méi)有視頻):根據(jù)峰鳴代碼可以判斷出故障的部位。ccid_page/AwardBIOS1短聲:說(shuō)明系統(tǒng)正常啟動(dòng)。表明機(jī)器沒(méi)有問(wèn)題。2短聲:說(shuō)明CMOS設(shè)置錯(cuò)誤,重新設(shè)置不正確選項(xiàng)。1長(zhǎng)1短:說(shuō)明內(nèi)存或主板出錯(cuò),換一個(gè)內(nèi)存條試試。1長(zhǎng)2短:說(shuō)明顯示器或顯示卡存在錯(cuò)誤。檢查顯卡和顯示器插頭等部位是否接觸良好或用替換法確定顯卡和顯示器是否損壞。1長(zhǎng)3短:說(shuō)明鍵盤(pán)控制器錯(cuò)誤,應(yīng)檢查主板。1長(zhǎng)9短:說(shuō)明主板FlashRAM、EPROM錯(cuò)誤或BIOS損壞,更換FlashRAM。重復(fù)短響:說(shuō)明主板電源有問(wèn)題。不間斷的長(zhǎng)聲:說(shuō)明系統(tǒng)檢測(cè)到內(nèi)存條有問(wèn)題,重新安裝內(nèi)存條或更換新內(nèi)存條重試。AMIBIOS1短:說(shuō)明內(nèi)存刷新失敗。更換內(nèi)存條。2短:說(shuō)明內(nèi)存ECC較驗(yàn)錯(cuò)誤。在CMOS中將內(nèi)存ECC校驗(yàn)的選項(xiàng)設(shè)為Disabled或更換內(nèi)存。3短:說(shuō)明系統(tǒng)基本內(nèi)存檢查失敗。換內(nèi)存。4短:說(shuō)明系統(tǒng)時(shí)鐘出錯(cuò)。更換芯片或CMOS電池。5短:說(shuō)明CPU出現(xiàn)錯(cuò)誤。檢查CPU是否插好。6短:說(shuō)明鍵盤(pán)控制器錯(cuò)誤。應(yīng)檢查主板。7短:說(shuō)明系統(tǒng)實(shí)模式錯(cuò)誤,不能切換到保護(hù)模式。8短:說(shuō)明顯示內(nèi)存錯(cuò)誤。顯示內(nèi)存有問(wèn)題,更換顯卡試試。9短:說(shuō)明BIOS芯片檢驗(yàn)和錯(cuò)誤。1長(zhǎng)3短:說(shuō)明內(nèi)存錯(cuò)誤。內(nèi)存損壞,更換。1長(zhǎng)8短:說(shuō)明顯示測(cè)試錯(cuò)誤。顯示器數(shù)據(jù)線(xiàn)沒(méi)插好或顯示卡沒(méi)插牢?,F(xiàn)象四:系統(tǒng)能啟動(dòng),有視頻,出現(xiàn)故障提示,這時(shí)可以根據(jù)提示來(lái)判斷故障部位。下面就是一些常見(jiàn)的故障提示的判斷:一、提示“CMOSBatteryStateLow”原因:CMOS參數(shù)丟失,有時(shí)可以啟動(dòng),使用一段時(shí)間后死機(jī),這種現(xiàn)象大多是CMOS供電不足引起的。對(duì)于不同的CMOS供電方式,采取不同的措施:1.焊接式電池:用電烙鐵重新焊上一顆新電池即可;2.鈕扣式電池:直接更換;3.芯片式:更換此芯片,最好采用相同型號(hào)芯片替換。如果更換電池后時(shí)間不長(zhǎng)又出現(xiàn)同樣現(xiàn)象的話(huà),很可能是主板漏電,可檢查主板上的二極管或電容是否損壞,也可以跳線(xiàn)使用外接電池,不過(guò)這些都需要有一定的硬件維修基礎(chǔ)才能完成。二、提示“CMOSChecksumFailure”CMOS中的BIOS檢驗(yàn)和讀出錯(cuò);提示“CMOSSystemOptionNotSet”,CMOS系統(tǒng)未設(shè)置;提示“CMOSDisplayTypeMismatch”,CMOS中顯示類(lèi)型的設(shè)置與實(shí)測(cè)不一致;提示“CMOSMemorySizeMismatch”,主板上的主存儲(chǔ)器與CMOS中設(shè)置的不一樣;提示“CMOSTime&DateNotSet”,CMOS中的時(shí)間和日期沒(méi)有設(shè)置。這些都需要對(duì)CMOS重新設(shè)置。三、提示“KeyboardInterfaceError”后死機(jī)原因:主板上鍵盤(pán)接口不能使用,拔下鍵盤(pán),重新插入后又能正常啟動(dòng)系統(tǒng),使用一段時(shí)間后鍵盤(pán)無(wú)反應(yīng),這種現(xiàn)象主要是多次拔插鍵盤(pán)引起主板鍵盤(pán)接口松動(dòng),拆下主板用電烙鐵重新焊接好即可;也可能是帶電拔插鍵盤(pán),引起主板上一個(gè)保險(xiǎn)電阻斷了(在主板上標(biāo)記為Fn的東西),換上一個(gè)1歐姆/0.5瓦的電阻即可。四、自檢過(guò)程中斷在xxxKCache處這表示主板上Cache損壞,可以在CMOS設(shè)置中將“ExternalCache”項(xiàng)設(shè)為“Disable”故障即可排除。同理,在自檢主板部件時(shí)出現(xiàn)中斷,則可以認(rèn)為該部件損壞,解決方法一般可以在CMOS中將其屏蔽,如果不能屏蔽該部件最好更換主板。五、提示“FDDControllerFailure”BIOS不能與軟盤(pán)驅(qū)動(dòng)器交換信息;提示“HDDControllerFailure”,BIOS不能與硬盤(pán)驅(qū)動(dòng)器交換信息。應(yīng)檢查FDD(HDD)控制卡及電纜。六、提示“8042GateA20Error”8042芯片壞;提示“DMAError”,DMA控制器壞。這種故障需要更換。七、提示“DisplaySwitchNotProper”主板上的顯示模式跳線(xiàn)設(shè)置錯(cuò)誤,重新跳線(xiàn)。八、提示“KeyboardisLock...Unlockit”鍵盤(pán)被鎖住,打開(kāi)鎖后重新引導(dǎo)系統(tǒng)。九、IDE接口設(shè)備檢測(cè)信息為:“DetectingPrimary(或Secondary)Master(或Slave)...None”表示該IDE接口都沒(méi)有找到硬盤(pán),如果該IDE口確實(shí)接有硬盤(pán)的話(huà),則說(shuō)明硬盤(pán)沒(méi)接上或硬盤(pán)有故障,可以從以下幾方面檢查:1、硬盤(pán)電源線(xiàn)和數(shù)據(jù)線(xiàn)是否接觸不良,或換一根線(xiàn)試試;2、CMOS設(shè)置有無(wú)錯(cuò)誤,進(jìn)入CMOS將“PrimaryMaster”、“PrimarySlave”、“SecondaryMaster”三項(xiàng)的的“TYPE”都設(shè)置成“Auto”;3、替換法確認(rèn)硬盤(pán)本身有故障。十、IDE接口設(shè)備檢測(cè)信息下面顯示“Floppydisk(s)fail(40)”出錯(cuò)信息表示CMOS所指定的軟盤(pán)驅(qū)動(dòng)器有問(wèn)題。判斷和解決的方法與硬盤(pán)相似?,F(xiàn)象五:系統(tǒng)不能引導(dǎo)。這種故障一般都不是嚴(yán)重問(wèn)題,只是系統(tǒng)在找到的用于引導(dǎo)的驅(qū)動(dòng)器中找不到引導(dǎo)文件,比如:BIOS的引導(dǎo)驅(qū)動(dòng)器設(shè)置中將軟驅(qū)排在了硬盤(pán)驅(qū)動(dòng)的前面,而軟驅(qū)中又放有沒(méi)有引導(dǎo)系統(tǒng)的軟盤(pán)或者BIOS的引導(dǎo)驅(qū)動(dòng)器設(shè)置中將光驅(qū)排在了硬盤(pán)驅(qū)動(dòng)的前面,而光驅(qū)中又放有沒(méi)有引導(dǎo)系統(tǒng)的光盤(pán),這個(gè)都很簡(jiǎn)單,將光盤(pán)或軟盤(pán)取出就可以了,實(shí)際應(yīng)用中遇到“DiskBootFailure,InsertSystemDiskAndPressEnter”的提示,多數(shù)都是這個(gè)原因。如果是硬盤(pán)不能引導(dǎo)的話(huà)一般有兩種情況:一種是硬盤(pán)數(shù)據(jù)線(xiàn)沒(méi)有插好,另一種就是硬盤(pán)數(shù)據(jù)損壞。前者一般多會(huì)出現(xiàn)硬盤(pán)容量檢測(cè)不正確和引導(dǎo)時(shí)出現(xiàn)死機(jī)的現(xiàn)象;后者則是干脆找不到引導(dǎo)文件或提示文件損壞。前者只需重新連接好數(shù)據(jù)線(xiàn)即可;后者則需要用win98的啟動(dòng)軟盤(pán)或啟動(dòng)光盤(pán)啟動(dòng),根據(jù)實(shí)際情況來(lái)定:一、提示“Invalidpartitiontable”或“NotFoundany[activepartition]inHDDDiskBootFailure,InsertSystemDiskAndPressEnter”,這說(shuō)明找不到硬盤(pán)活動(dòng)分區(qū),需要對(duì)硬盤(pán)重新分區(qū)。二、提示“Missoperationsyste”,說(shuō)明硬盤(pán)活動(dòng)分區(qū)需要重新格式化(formatc:/s)。三、提示“InvalidsystemdiskReplacethedisk,andthenpressanykey”或顯示“StartingWindows98…”時(shí)出現(xiàn)死機(jī),說(shuō)明硬盤(pán)上的系統(tǒng)文件丟失了或損壞,使用“sysc:”,命令傳遞系統(tǒng)文件給c盤(pán),再將C拷貝給c盤(pán)?,F(xiàn)象六:硬盤(pán)可以引導(dǎo),但Windows不能正常啟動(dòng),也不能進(jìn)入安全模式。這種情況表明Windows98出現(xiàn)了嚴(yán)重的錯(cuò)誤,首先,用殺毒軟件查殺病毒,看是不是病毒造成的,如果沒(méi)有發(fā)現(xiàn)病毒可以用以下方法試一試。一、直接將接口卡與各個(gè)外設(shè)都撥去,再插回去,并調(diào)整接口卡上的設(shè)置(如果可以的話(huà))來(lái)檢查是否是硬件沖突造成,開(kāi)機(jī)看看是否可正常進(jìn)入Windows。二、檢查CMOS中的設(shè)置是否有不正確的地方,若不清楚,可選擇LoadBiosDefault項(xiàng)目,然后重開(kāi)機(jī),開(kāi)機(jī)看是否可正常進(jìn)入Windows。三、在啟動(dòng)時(shí)按下F8鍵,一般會(huì)出現(xiàn)6個(gè)選項(xiàng)(如果安裝了DOS6.22則出現(xiàn)7個(gè)選項(xiàng))選擇第4項(xiàng)“step-by-stepconfirmation”進(jìn)入單步運(yùn)行方式,按照出現(xiàn)死機(jī)的命令選擇處理方法:1、執(zhí)行“Processthesystemregistry

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論