


VIP免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
操作題根據(jù)教材中的說明和代碼,調(diào)試環(huán)境,實踐項目實施流程,最后輸出圖9-4,驗證書中的結(jié)論。(略)2.項目總結(jié)中提出此工程改進的角度。文本轉(zhuǎn)換為數(shù)值時,可以增加轉(zhuǎn)換維度,以增大計算量為代價,換取分類性能的提升。請修改food_security_check.py,定位到以下代碼:#訓練集文檔向量化:利用get_corpus_vectors函數(shù)對訓練集進行向量化n=3window=30model_train_words_str,corpus_vectors_train_words_str\=get_corpus_vectors(list_train_words_str,n,window)其中n參數(shù)就表示轉(zhuǎn)換的維度。教材為了便于可視化,采用了3維視角的變換。請修改n為5,10,20。觀察分類性能是否得到了提升。答:原來代碼n=3,F(xiàn)1分數(shù)為0.918當n=5時,F(xiàn)1分數(shù)為0.95當n=10時,F(xiàn)1分數(shù)為0.942當n=20時,F(xiàn)1分數(shù)為0.942可見當n=5時f1分數(shù)有所提升,分類性能變好。但是當n=10時,f1有所下降,分類性能略微下降,n繼續(xù)變大時f1維持在恒定值,分類性能保持不變。3.上述代碼中的window參數(shù),表示一個詞與前后多少詞存在相關(guān)性。Window越大,關(guān)聯(lián)窗口越大;window越小,關(guān)聯(lián)窗口越小。在維持n=3不變的情況下,改變window。分析算法性能的改變情況。答:window=10,f1分數(shù)為0.929window=20,f1分數(shù)為0.947window=30,f1分數(shù)為0.948window=40,f1分數(shù)為0.937window=50,f1分數(shù)為0.947說明window存在一個上限,大約是30左右,達到上限之前,增大window可以使分類性能變好。達到上限以后,繼續(xù)增大,沒有明顯改變。4.教材中采用了支持向量機算法進行分類識別。請采用logistics回歸算法分類,并比較2種算法的性能差異。答:在n=3,window=30的情況下進行二者對比。Logistics算法修改代碼為:fromsklearn.linear_modelimportLogisticRegression#整理數(shù)據(jù)格式,準備訓練樣本x=dfA.iloc[::n].values.tolist()y=dfA.iloc[:nl.values.tolist()print("x:\n".x)print("y:\n".y)#開始訓練clf=LogisticRegression(solver='liblinear')clf.fit(x,y)結(jié)果:f1分數(shù)為0.938原來的代碼,f1分數(shù)為0.938,二者沒有明顯區(qū)別習題10操作題根據(jù)教材中的說明和代碼,調(diào)試環(huán)境,實踐項目實施流程,驗證書中的結(jié)論。略2.在test數(shù)據(jù)庫中,新創(chuàng)建customerRecommendation01表和productRecommendation01表。修改bbb04_06.scala,進行top5商品推薦,并將推薦結(jié)果寫入customerRecommendation01表和productRecommendation01表。答:關(guān)鍵代碼修改://向所有用戶推薦排名前五的商品,show的false參數(shù)可以顯示較長字段valdf04=model.recommendForAllUsers(numItems=5)//向所有的商品推薦排名前五的用戶valdf07=model.recommendForAllItems(numUsers=5)3.在數(shù)據(jù)規(guī)模不大的情況下,可以考慮不用數(shù)據(jù)倉庫,直接用Spark處理MySQL中的消費記錄,并把結(jié)果寫入MySQL。新創(chuàng)建associationRules01表。修改bbb04_05.scala,實現(xiàn)直接用Spark讀取MySQL中的消費記錄,進行關(guān)聯(lián)規(guī)則分析,并把結(jié)果寫入associationRules01表。答:直接連接數(shù)據(jù)庫:valdf0l=spark.read.jdbc(url="idbc:mysql://192.168.152.210:3306/test",table="shopping",properties)df01.cache()最后處理的結(jié)果直接保存入數(shù)據(jù)庫:df06.coalesce(1).wri
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財務(wù)會計成本控制與預(yù)算編制測試卷
- 社區(qū)農(nóng)產(chǎn)品供應(yīng)鏈管理與銷售協(xié)議
- 片石擋土墻施工承包合同模板
- 班隊計劃專業(yè)資料
- 北師大版小學五年級下冊數(shù)學期末試卷及答案-北師大版五年級下冊數(shù)學期末試卷
- GPS測量的誤差分析
- 領(lǐng)導力培訓如何打造優(yōu) 秀團隊
- 音樂節(jié)慶中的快速響應(yīng)跑腿策略
- 顧客體驗設(shè)計在新零售戰(zhàn)略中的重要性
- 項目監(jiān)控與評估中的數(shù)據(jù)可視化應(yīng)用
- 高新技術(shù)企業(yè)人才流失問題研究-以H公司為例
- 醫(yī)院護工服務(wù)病人及家屬滿意度調(diào)查表
- 單位食堂食品中毒應(yīng)急預(yù)案
- 家庭教育指導能力提升研究課題
- DMG五軸數(shù)控加工中心工作臺設(shè)計
- 飯店服務(wù)標準化與飯店人行為通則課件
- 辭職報告模板6篇
- -高考英語語法復(fù)習-將來完成時-課件
- 2023重慶商場總結(jié)
- 鍋爐安裝調(diào)試總體驗收簽證單
- 承認外國離婚判決申請書
評論
0/150
提交評論