版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、習(xí)題一習(xí)題一假定用于分析的數(shù)據(jù)包含屬性age.數(shù)據(jù)元組age值(以遞增序)是:13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.(a) 運用min-max規(guī)范化將age值35變換到0.0,1.0區(qū)間。(b) 運用z-score規(guī)范化變換age值35,其中age的規(guī)范差為12.94歲。(c) 運用小數(shù)定標規(guī)范化變換age值35。(d) 對于給定的數(shù)據(jù),他情愿運用哪種方法?陳說他的理由。解答一解答一(a) 運用min-max規(guī)范化將ag
2、e值35變換到0.0,1.0區(qū)間。 minA=13,maxA=70,new_minA=0.0,new_maxA=1.0,而v=35,(b) 運用z-score規(guī)范化變換age值35,其中age的規(guī)范差為12.94歲。3860. 00 . 00 . 00 . 113701335 min_min_max_minmaxminAAAAAAnewnewnewvv963.2927809 2770524645403635433230 2725422221202191621513A39. 03892. 09421.12037. 59421.12963.2935AssAvv解答一解答一( (續(xù)續(xù)) )(c) 運
3、用小數(shù)定標規(guī)范化變換age值35。 由于最大的絕對值為70,所以j=2。(d) 對于給定的數(shù)據(jù),他情愿運用哪種方法?陳說他的理由。 答:更傾向于選擇小數(shù)定標規(guī)范化。由于小數(shù)定標規(guī)范化會堅持數(shù)據(jù)的分布,這種變換更直觀并容易解釋 35. 01035102jvv習(xí)題二習(xí)題二2.14 假設(shè)12個銷售價錢記錄組曾經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215。運用如下每種方法將其劃分成三個箱。(a) 等頻等深劃分。(b) 等寬劃分。解答二解答二(a) 等頻等深劃分。(b) 等寬劃分。 每個區(qū)間的寬度是:(215-5)/3=70bin15,10,11,13bin115
4、,35,50,55bin172,91,204,215bin15,10,11,13,15,35,50,55,72bin191bin1204,215習(xí)題三習(xí)題三3假定BigUniversity的數(shù)據(jù)倉庫包含如下4個維:student(student_name, area_id, major, status, university),course(course_name, department),semester(semester, year)和instructor(dept, rank);2個度量:count和avg_grade。在最低概念層,度量avg_grade存放學(xué)生的實踐課程成果。在較高概
5、念層,avg_grade存放給定組合的平均成果。(a)為該數(shù)據(jù)倉庫畫出雪花形方式圖。(b)由根本方體student, course, semester, instructor開場,為列出BigUniversity每個學(xué)生的CS課程的平均成果,該當運用哪些特殊的OLAP操作。(c)假設(shè)每維有5層包括all,如“studentmajorstatusuniversityall,該立方體包含多少方體?解答三解答三解答三解答三b)由根本方體student, course, semester, instructor開場,為列出BigUniversity每個學(xué)生的CS課程的平均成果,該當運用哪些特殊的OLA
6、P操作。 這些特殊的聯(lián)機分析處置OLAP操作有:沿課程course維從course_id“上卷到department。沿學(xué)生student維從student_id“上卷到university。取department=“CS和university=“Big University,沿課程course維和學(xué)生student維切塊。沿學(xué)生student維從university下鉆到student_name。c)假設(shè)每維有5層包括all,如“studentmajorstatusuniversityall,該立方體包含多少方體?這個立方體將包含54=625個方體。習(xí)題四習(xí)題四4 假定數(shù)據(jù)倉庫包含4個維:
7、date(day, month, quarter, year), spectator(spectator_name, status, phone, address), location(location_name, phone#, street, city, province, country)和game(game_name, description, description, producer);2個度量: count和charge。其中, charge是觀眾在給定的日期觀看節(jié)目的付費。觀眾可以是學(xué)生、成年人或老人,每類觀眾有不同的收費規(guī)范。 (a) 畫出該數(shù)據(jù)倉庫的星形方式圖。 (b) 由
8、根本方體 date, spectator, location, game開場,為列出2019 年學(xué)生觀眾在GM-Place 的總代價,該當執(zhí)行哪些OLAP 操作? 解答四解答四解答四解答四(b)由根本方體 date, spectator, location, game開場,為列出2019 年學(xué)生觀眾在GM-Place 的總代價,該當執(zhí)行哪些OLAP 操作? 這些特殊的聯(lián)機分析處置OLAP操作有: 沿date維從date id “上卷到y(tǒng)ear沿game維從game id “上卷到all沿location維從location id “上卷到location name沿spectator維從spe
9、ctator id “上卷到status取status=“students,location name=“GM Place和year=2019切塊習(xí)題五習(xí)題五5給定兩個對象,分別表示為22,1,42,10,20,0,36,8:(a)計算兩個對象之間的歐幾里得間隔(b)計算兩個對象之間的曼哈頓間隔(c)計算兩個對象之間的明考斯基間隔,p=3習(xí)題六習(xí)題六假設(shè)數(shù)據(jù)發(fā)掘的義務(wù)是將如下 8個點(用(x,y)代表位置)聚類為3個簇: A1(2,10), A2(2,5),A3(8,4), B1(5,8),B2(7,5), B3(6,4), C1(1,2), C2(4,9)間隔函數(shù)是歐幾里德間隔.假設(shè)初始選擇
10、A1, B1,C1為每個聚類的中心.用k-平均算法來給出(a) 在第一次循環(huán)執(zhí)行后的三個聚類中心(b) 最后的三個簇解答六解答六(a) (2,10),(6,6),(1.5,3.5)(b) A1 B1 C2A3 B2 C3A2 C1d2A1A2A3B1B2B3C1C2102536+369+425+2516+361+644+129+49+99+1604+91+1616+361+131+641+95316+364529058第一次迭代: 中心為1: A1(2,10), 2: B1(5,8), 3: C1(1,2)因此:1: A1 (2,10)2:A3, B1,B2, B3, C2 (6, 6)3:
11、A2, C1 (1.5,3.5)d2A1A2A3B1B2B3C1C2102536+369+425+2516+361+644+123217852441133.52+6.52.52+1.526.52+0.523.52+4.525.52+1.524.52+0.520.52+1.522.52+5.52第二次迭代: 中心為1: (2,10), 2: (6,6), 3: (1.5,3.5)1: A1, C2 (3.5,9.5)2:A3, B1,B2, B3 (6.5, 5.25)3: A2, C1 (1.5,3.5)d2A1A2A3B1B2B3C1C211+.521+4.5252+5.5222+1.524
12、2+4.5232+5.5222+7.5212+.5224.52+7.524.52+0.2521.52+1.2521.52+2.752.52+0.252.52+1.2525.52+3.2522.52+3.7523.52+6.52.52+1.526.52+0.523.52+4.525.52+1.524.52+0.520.52+1.522.52+5.52第三次迭代: 中心為1: (3.5,9.5 ), 2: (6.5,5.25), 3: (1.5,3.5)1: A1, B1,C2 (11/3,9)2:A3, B2, B3 (7, 13/3)3: A2, C1 (1.5,3.5)d2A1A2A3B1B2B
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 娛樂行業(yè)招聘策略總結(jié)
- 2025年全球及中國螺旋藻蝦青素行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國合成生物學(xué)智造平臺行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球輕型柴油發(fā)動機行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球反流檢測設(shè)備行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球裝飾金屬板光纖激光切割機行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球降膜式風(fēng)冷螺旋式冷水機組行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國無塑工業(yè)軟包涂層紙行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國聚合物氫氣分離膜行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國搖擺式生物工藝容器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 搞笑小品劇本《大城小事》臺詞完整版
- 物業(yè)服務(wù)和后勤運輸保障服務(wù)總體服務(wù)方案
- 人大代表小組活動計劃人大代表活動方案
- 《大模型原理與技術(shù)》全套教學(xué)課件
- 2023年護理人員分層培訓(xùn)、考核計劃表
- 《銷售培訓(xùn)實例》課件
- 2025年四川省新高考八省適應(yīng)性聯(lián)考模擬演練(二)地理試卷(含答案詳解)
- 【經(jīng)典文獻】《矛盾論》全文
- Vue3系統(tǒng)入門與項目實戰(zhàn)
- 2024年寧夏回族自治區(qū)中考英語試題含解析
- 光伏發(fā)電項目試驗檢測計劃
評論
0/150
提交評論