《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分_第1頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分_第2頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分_第3頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分_第4頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

單元3分析電影評(píng)論評(píng)分項(xiàng)目介紹項(xiàng)目一:影評(píng)數(shù)據(jù)分析與可視化本項(xiàng)目從某電影網(wǎng)站采集了電影《流浪地球》的部分評(píng)論數(shù)據(jù),包括城市、影評(píng)內(nèi)容、評(píng)分、評(píng)論時(shí)間、評(píng)論點(diǎn)贊數(shù)等,根據(jù)采集的數(shù)據(jù)對(duì)電影評(píng)論的數(shù)量、點(diǎn)贊數(shù)和評(píng)分三個(gè)方面進(jìn)行分析,完成數(shù)據(jù)分析可視化,給對(duì)科幻電影感興趣的觀影者、電影投資者提供一些參考。01準(zhǔn)備活動(dòng)點(diǎn)名、復(fù)習(xí)本次課學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)介紹學(xué)習(xí)內(nèi)容任務(wù)三分析電影評(píng)論評(píng)分本任務(wù)從評(píng)論評(píng)分與城市名稱、評(píng)分等級(jí)三個(gè)方面來(lái)分析電影評(píng)論評(píng)分。通過(guò)繪制面積圖、折線圖和詞云圖對(duì)電影評(píng)論評(píng)分情況進(jìn)行分布分析、對(duì)比分析,以便全面挖掘該電影的口碑、觀影熱度、觀眾對(duì)電影的理解等信息,為觀眾提供觀影參考任務(wù)分解:子任務(wù)1評(píng)論評(píng)分與城市的關(guān)系分析(面積圖)子任務(wù)2評(píng)論評(píng)分好評(píng)與差評(píng)的關(guān)鍵信息分析(詞云圖)學(xué)習(xí)目標(biāo)1、知識(shí)(1)掌握matplotlib面積圖的繪制方法(2)掌握jieba分詞

(3)掌握pandas統(tǒng)計(jì)詞頻的方法

(4)掌握matplotlib詞云的繪制方法2、技能(1)能使用jieba分詞處理文本(2)能使用matplotlib子庫(kù)plotlib根據(jù)數(shù)據(jù)繪制面積圖和詞云圖3、素養(yǎng)(1)嚴(yán)謹(jǐn)認(rèn)真、代碼規(guī)范;(2)數(shù)據(jù)安全、愛(ài)國(guó)精神;(3)信息檢索能力02發(fā)展活動(dòng)任務(wù)分析、任務(wù)資訊、任務(wù)實(shí)施子任務(wù)1評(píng)論評(píng)分與城市的關(guān)系分析(面積圖)任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評(píng)論評(píng)分字段scores和城市名稱字段citys數(shù)據(jù)統(tǒng)計(jì)出不同評(píng)分及對(duì)應(yīng)城市的評(píng)論數(shù)量。根據(jù)統(tǒng)計(jì)出的不同評(píng)分及對(duì)應(yīng)城市的評(píng)論數(shù)量,取出前五名城市的數(shù)據(jù),使用Matplotlib繪制折線圖和面積圖,要求橫軸為評(píng)分,縱軸為評(píng)論數(shù)量,顯示不同評(píng)分、不同城市的評(píng)論數(shù)據(jù)變化趨勢(shì)。1.面積圖任務(wù)資訊面積圖對(duì)軸和線之間的區(qū)域著色,不僅能夠強(qiáng)調(diào)峰和谷,還能夠強(qiáng)調(diào)高點(diǎn)和低點(diǎn)的持續(xù)時(shí)間。高點(diǎn)持續(xù)時(shí)間越長(zhǎng),線下面積越大。pyplot模塊可以使用fill_between()函數(shù)和stackplot()函數(shù)繪制面積圖。fill_between()函數(shù)語(yǔ)法格式如下:1.面積圖任務(wù)資訊stackplot()函數(shù)語(yǔ)法格式如下1.面積圖任務(wù)資訊示例:顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過(guò)fill_between()函數(shù)繪制面積圖,代碼如下:以上代碼設(shè)置alpha為0.5(半透明),同時(shí)繪制了兩條折線圖,能顯示出面積圖的上邊緣,運(yùn)行結(jié)果如圖1-3-2所示1.面積圖任務(wù)資訊示例::顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過(guò)stackplot()函數(shù)繪制堆疊面積圖,代碼如下:以上代碼繪制了一個(gè)堆疊面積圖,堆疊面積圖有兩個(gè)顏色的面積,分別對(duì)應(yīng)2022年和2021年的銷售情況,運(yùn)行結(jié)果如圖1-3-3所示。任務(wù)實(shí)施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評(píng)論數(shù)據(jù),設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:統(tǒng)計(jì)不同評(píng)分各城市的評(píng)分?jǐn)?shù)量。根據(jù)處理評(píng)分字段scores和城市名稱字段citys數(shù)據(jù),統(tǒng)計(jì)不同評(píng)分及對(duì)應(yīng)城市的評(píng)分?jǐn)?shù)量,取出評(píng)論數(shù)量最多的五個(gè)城市的數(shù)據(jù)用于繪圖步驟3:繪制折線圖和面積圖。繪制5條折線圖和5個(gè)面積圖,橫軸為評(píng)分,縱軸為評(píng)論數(shù)量,顯示不同評(píng)分、不同城市的評(píng)論數(shù)據(jù)變化趨勢(shì)。子任務(wù)2評(píng)論評(píng)分好評(píng)與差評(píng)的關(guān)鍵信息分析任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評(píng)論評(píng)分字段scores,按照好評(píng)差評(píng)標(biāo)準(zhǔn)進(jìn)行分類。對(duì)分類的數(shù)據(jù)做jieba分詞后使用WordCloud()繪制好評(píng)和差評(píng)留言的詞云圖,顯示好評(píng)和差評(píng)關(guān)鍵字信息。1.詞云圖任務(wù)資訊詞云圖,也叫文字云,即對(duì)輸入的一段文字計(jì)算詞匯出現(xiàn)的頻率(詞頻),然后根據(jù)詞頻集中顯示高頻詞,簡(jiǎn)潔、直觀、高效。詞云圖使人們可以快速感知最突出的文字,迅速抓住重點(diǎn),了解主旨。制作詞云圖的方法有很多,可以借助第三方網(wǎng)站的在線詞云圖工具,也可以基于Python。這里使用WordCloud制作詞云圖,制作流程如下:1)準(zhǔn)備一段文字。2)使用jieba分詞。3)準(zhǔn)備停用詞。4)WordCloud生成詞云圖示例:簡(jiǎn)單分詞,代碼如下:1.詞云圖任務(wù)資訊示例:制作朱自清《春》的詞云圖1.詞云圖任務(wù)資訊修改示例:制作朱自清《春》的詞云圖任務(wù)實(shí)施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:準(zhǔn)備停用詞。定義stop_words()函數(shù),讀取提供的停用詞文件數(shù)據(jù),按需求定義停用詞。步驟3:定義函數(shù)douban_word_cloud(data_after,title),繪制詞云圖,參數(shù)data_after表示生成詞云圖的文本數(shù)據(jù),參數(shù)title表示生成詞云圖的標(biāo)題步驟4:定義主函數(shù)run(),從文件CommentInfo.csv讀取數(shù)據(jù),根據(jù)評(píng)判標(biāo)準(zhǔn)(評(píng)分大于等于30的為好評(píng),評(píng)分小于30的為差評(píng))把電影評(píng)論分為好評(píng)和差評(píng),再分別調(diào)用步驟3定義的函數(shù)douban_word_cloud(data_after,title),繪制詞云圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論