




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
2023年廣西職業(yè)院校技能大賽
高職組《Python程序開發(fā)》賽項
競賽樣題
【時量:240分鐘】
賽題說明
一、注意事項
1.請根據(jù)大賽所提供的競賽環(huán)境,檢查所列的硬件設備、軟件清
單、材料清單是否齊全,計算機設備是否能正常。
2.競賽結束前,在競賽平臺提供的虛擬機中,根據(jù)賽題將各試題
代碼進行完善整合,并運行;根據(jù)競賽平臺左側的答題區(qū)進行答題,
根據(jù)題目對運行代碼及結果進行截圖。
3.競賽結束時,請將答題區(qū)的答卷進行提交操作,答卷在競賽結
束前可重復提交。
二、競賽環(huán)境
1.PC機:系統(tǒng)已安裝Python相關環(huán)境、MySQL數(shù)據(jù)庫,用戶名
密碼分別為:root/123456。
2.根據(jù)考題說明,從競賽平臺虛擬機桌面獲取程序開發(fā)項目工程
代碼包。桌面的工程代碼可以直接使用虛擬機中的Pycharm導入、編
譯、運行和發(fā)布。
三、賽題說明
本套賽題包括三個模塊:數(shù)據(jù)清洗、數(shù)據(jù)分析與可視化、機器學
習。競賽時長240分鐘。
四、賽題
模塊一:數(shù)據(jù)清洗(30分)
第1題:藥品銷售數(shù)據(jù)清洗
【任務說明】
數(shù)據(jù)清洗是數(shù)據(jù)分析過程中很重要的一個環(huán)節(jié),沒有高質(zhì)量的數(shù)
據(jù)清洗就沒有高質(zhì)量的數(shù)據(jù)分析。在不準確的數(shù)據(jù)基礎上做出的分析,
結論將變得毫無價值和意義。
現(xiàn)有一份某醫(yī)療機構的藥品銷售數(shù)據(jù),請根據(jù)任務要求完成數(shù)據(jù)
清洗功能。
【任務要求】
數(shù)據(jù)集中有購藥時間、社??ㄌ枴⑸唐肪幋a、商品名稱、銷售數(shù)
量、應收金額、實收金額幾個字段,請你使用NumPy和Pandas按如
下要求對數(shù)據(jù)進行清洗:
1.購藥時間就是銷售時間,為了后續(xù)分析更好的理解字段,將"購
藥時間"改為"銷售時間";
2.任何一條數(shù)據(jù)中只要有一個缺失值就刪除該條數(shù)據(jù);
3.將銷售數(shù)量、應收金額、實收金額三列的數(shù)據(jù)類型轉(zhuǎn)換為
float64;
4.銷售時間中包含日期和星期幾,要求數(shù)據(jù)最終只保留日期,并
把銷售日期從字符串類型轉(zhuǎn)換為日期數(shù)據(jù)類型;
5.轉(zhuǎn)換日期過程中不符合日期格式的數(shù)值會被轉(zhuǎn)換為空值,需要
刪除列(銷售時間,社保卡號)中為空的行;
6.按銷售日期進行升序排列,排序后的索引已被打亂,需要修改
成從0到N按順序的索引值;
7.將有異常值(如銷售數(shù)量、應付金額、實付金額為負數(shù))的數(shù)
據(jù)進行刪除。
8.將清洗后的數(shù)據(jù)保存為CSV文件。
【工程代碼】
獲取桌面“賽題/01_數(shù)據(jù)清洗/”路徑下“01_醫(yī)療機構銷售數(shù)據(jù)
清洗”文件夾中獲取相關資料,結果保存至桌面“提交文檔/01”
文件夾中。
模塊二:數(shù)據(jù)分析及可視化(40分)
第2題:藥品消費趨勢分析
【任務說明】
現(xiàn)有某醫(yī)療機構10年的藥品銷售數(shù)據(jù),請根據(jù)任務要求完成數(shù)
據(jù)分析。
【任務要求】
讀取所需數(shù)據(jù)集后對數(shù)據(jù)進行必要的清洗,分析中成藥和西藥在
這10年中銷售占比以及銷售額的變化情況,繪制出堆疊面積圖并用
Django框架渲染到前端頁面,繪圖要求如下:
1.使用PyEcharts庫繪制堆疊面積圖;
2.使用Django框架在前端頁面中渲染展示堆疊面積圖;
3.示意圖如下:
圖1:堆疊面積示意圖
【工程代碼】
獲取桌面“賽題/02_數(shù)據(jù)分析及可視化/”路徑下“02_藥品消費
趨勢分析”文件夾中獲取相關資料,結果保存至桌面“提交文檔/02”
文件夾中。
第3題:感冒高發(fā)期分析
【任務說明】
感冒是一種常見的急性上呼吸道病毒性感染性疾病,多由鼻病毒、
副流感病毒、呼吸道合胞病毒、埃可病毒、柯薩奇病毒、冠狀病毒、
腺病毒等引起。臨床表現(xiàn)為鼻塞、噴嚏、流涕、發(fā)熱、咳嗽、頭痛等,
多呈自限性。
現(xiàn)有某一醫(yī)療機構10年的患者診斷數(shù)據(jù),請你根據(jù)診斷結果進
行感冒高發(fā)期分析。
【任務要求】
讀取所需數(shù)據(jù)集后,對數(shù)據(jù)進行必要的清洗,繪制出感冒高發(fā)期
熱力圖,分析感冒高發(fā)期在每一年中的什么時候,并出具分析報告。
繪圖要求如下:
1.使用PyEcharts庫繪制熱力圖;
2.熱力圖橫軸為年份,縱軸為月份;
3.使用Django框架在前端頁面中渲染展示熱力圖;
4.示意圖如下:
圖2:熱力示意圖
【工程代碼】
獲取桌面“賽題/02數(shù)據(jù)分析及可視化/”路徑下“03_感冒高發(fā)
期分析”文件夾中獲取相關資料,結果保存至桌面“提交文檔/02”
文件夾中。
模塊三:機器學習(30分)
第4題:藥品銷量預測
【任務說明】
現(xiàn)有一醫(yī)療機構多年來的藥品銷售數(shù)據(jù),基于該數(shù)據(jù),選擇合適
的算法訓練模型,并對該機構的藥品銷量進行預測。
【任務要求】
1.讀取藥品銷售數(shù)據(jù);
2.提取合適的特征;
3.對數(shù)據(jù)進行編碼等預處理;
4.劃分訓練集和測試集;
5.構建機器學習模型;
6.編寫模型訓練相關代碼,完成模型訓練;
7.將訓練好的模型進行保存;
8.使用模型進行預測。
【工程代碼】
獲取桌面“賽題/03_機器學習/”路徑下“04_藥品銷量預測”文
件夾中獲取相關資料,結果保存至桌面“提交文檔/03”文件夾中。
第5題:疾病輔助診斷
【任務說明】
現(xiàn)有一醫(yī)療機構十余年來的患者病例數(shù)據(jù),數(shù)據(jù)中包含每個患者
的癥狀,比如咳嗽、發(fā)燒、流鼻涕等,以及最后的診斷結果,現(xiàn)要基
于該數(shù)據(jù)集構建機器學習模型,用于疾病的輔助診斷。
【任務要求】
1.讀取患者病例數(shù)據(jù);
2.對數(shù)據(jù)進行清洗以及預處理;
3.特征提取以及特征工程;
4.劃分訓練集及測試集;
5.選取合適的機器學習模型;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專題2.10 函數(shù)的綜合應用(解析版)-2024年高考數(shù)學一輪復習精講精練寶典(新高考專用)
- 車間地基施工方案
- 景觀塔施工方案
- 互聯(lián)網(wǎng)電商知識培訓課件
- 印刷制作設計合同范例
- 吉首售房合同范例
- 2025年英語 英語五官標準課件
- 壓手續(xù)不押車合同范例
- 腦疝的護理診斷及護理問題
- 豐富多樣的幼兒園節(jié)日慶典計劃
- BRC+Food+Safety+Standard+2024年培訓課件全攻略
- 人類同種異體組織市場發(fā)展預測和趨勢分析
- 《公路橋梁掛籃設計與施工技術指南》
- 建筑工地安全風險分級管控方案
- 2024年福建省公務員錄用考試《行測》試題及答案解析
- 供熱管網(wǎng)維保服務方案
- 現(xiàn)代家政導論-課件 4.1.1認識家政教育及意義
- 浙江省【高等職業(yè)技術教育招生考試】-商業(yè)類(電子商務)-職業(yè)技能理論知識(一)(答案版)
- 人教版小學六年級下冊音樂教案全冊
- DBJT 13-460-2024 既有多層住宅建筑增設電梯工程技術標準
- 2024年資格考試-WSET二級認證考試近5年真題附答案
評論
0/150
提交評論