Python數據可視化(微課版) 課件 第5章 Python關系數據可視化_第1頁
Python數據可視化(微課版) 課件 第5章 Python關系數據可視化_第2頁
Python數據可視化(微課版) 課件 第5章 Python關系數據可視化_第3頁
Python數據可視化(微課版) 課件 第5章 Python關系數據可視化_第4頁
Python數據可視化(微課版) 課件 第5章 Python關系數據可視化_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

主講人:AiPPT時間:20XX.XXPOWERPOINTDESIGN202XPowerPointDesign------------------Python關系數據可視化目錄CONTENTS01關系數據在大數據中的應用02數據分布性的可視化03習題04實訓:Seaborn繪圖與主題更改--------------PowerPointDesign關系數據在大數據中的應用01PARTPOWERPOINTDESIGN關系數據價值關系數據在大數據中用于找到變量間聯系,發(fā)掘事物背后因果關系。通過探索變量相關性,進而探索隱藏的因果關系。分析數據時,可從整體觀察,也可關注數據分布,如數據間是否存在重疊或毫不相干,以及各分布數據的相關關系。數據可視化后,圖表所表達的意義至關重要。關系數據具有關聯性和分布性。關聯性指數據間相互聯系和影響,如股市中不同股票之間的相關性;分布性指數據在一個或多個維度上的分布情況,如通過直方圖展示單個變量的分布情況。關系數據特性大數據挖掘與變量關聯散點圖散點圖用于展示兩個變量之間的關系,通過點的分布判斷相關性。一般有三種關系:正相關、負相關和不相關。正相關時,橫軸數據和縱軸數據變化趨勢相同;負相關時,變化趨勢相反;不相關時散點排列雜亂無章。使用散點圖時要注意:當要在不考慮時間的情況下比較大量數據點時,常使用散點圖;即便自變量為連續(xù)性變量,仍然可以使用散點圖;如果在散點圖中有多個序列,考慮將每個點的標記形狀更改為方形、三角形、菱形或其他形狀;散點圖中包含的數據越多,比較的效果就越好。散點圖矩陣散點圖矩陣借助兩變量散點圖的作圖方法,是一個大的圖形方陣,其每一個非主對角元素的位置上是對應行的變量與對應列的變量的散點圖,而主對角元素位置上是各變量名。借助散點圖矩陣可以清晰地看到所研究多個變量兩兩之間的相關關系。氣泡圖氣泡圖和散點圖相比,多了一個維度的數據。氣泡圖就是將散點圖中沒有大小的“點“變成有大小的“圓”,圓的大小就可以用來表示多出的那一維數據的大小。氣泡圖讓我們可以同時比較三個變量。一個具體的例子是二手車的價格由車齡和里程來決定,可以看出,兩個指標越小,氣泡越大,代表價格越高,反之則反。如果使用Python繪制氣泡圖,只需要在散點圖的代碼上進行一些簡單的修改。數據關聯性的可視化--------------PowerPointDesign數據分布性的可視化02PARTPOWERPOINTDESIGN莖葉圖定義與優(yōu)點莖葉圖又稱“枝葉圖”,是由20世紀早期的英國統(tǒng)計學家阿瑟·鮑利(ArthurBowley)設計。莖葉圖的思路是將數組中的數按位數進行比較,將數的大小基本不變或變化不大的位作為一主干(莖),將變化大的位的數作為分枝(葉),列在主干的后面。莖葉圖的優(yōu)點是統(tǒng)計圖上沒有原始數據信息的損失,所有數據信息都可以從莖葉圖中得到。莖葉圖中的數據還可以隨時記錄,隨時添加,方便記錄與表示。莖葉圖缺點與繪制莖葉圖的缺點是只便于表示個位之前相差不大的數據,而且莖葉圖只方便記錄兩組的數據。莖葉圖十分直觀且簡單,可以使用Excel方便的進行繪制。莖葉圖直方圖又稱質量分布圖,是數值數據分布的精確圖形表示。直方圖中的柱形高度表示的是數值頻率,柱形的寬度是取值區(qū)間。水平軸和垂直軸與一般的柱形圖不同,它是連續(xù)的;一般的柱形圖的水平軸是分離的。我們可以使用seaborn庫來進行直方圖的繪制,相關代碼如下。繪制得到的圖表如圖5-8所示。直方圖定義與繪制直方圖密度圖可用它對分布的細節(jié)變化進行可視化處理。當直方圖分段變多時,分段之間的組距就會縮短,此時依著直方圖畫出的折線就會逐漸變成一條光滑的曲線,這條曲線就稱為總體的密度分布曲線。這條曲線可以反映數據分布的密度情況。01我們可以使用seaborn庫來進行密度圖的繪制,相關代碼如下。繪制得到的圖表如圖5-10所示。02密度圖定義與繪制密度圖--------------PowerPointDesign習題03PARTPOWERPOINTDESIGNB.關聯性大數據分析中,探索變量的哪種關系是挖掘背后可能隱藏因果關系的重要一步?D.維度關系選擇題內容C.分布性A.時間序列關系在數據關聯性可視化中,使用哪種圖可以展示兩個變量之間的關系?選擇題氣泡圖是在散點圖基礎上增加了一個維度的數據表示。()散點圖不能用于表示兩個以上的變量之間的關系。()莖葉圖在顯示數據分布時,會丟失原始數據信息。()判斷題內容關系數據在大數據中的應用主要不包括數據的時間序列分析。()直方圖的柱形高度表示的是數值的頻率。()判斷題大數據的一個重要價值是可以幫助我們找到變量之間的________。散點圖可以用于發(fā)現數據和________之間的關聯關系。莖葉圖最初是由________設計的。在使用Python繪制氣泡圖時,可以通過設置s參數來調整________的大小。密度圖可以反映數據分布的________情況。填空題內容填空題描述數據關聯性可視化的目的是什么?問答題內容散點圖矩陣的基本框架是怎樣的?如何使用Python繪制氣泡圖?直方圖在數據分布性可視化中起到什么作用?密度圖與直方圖有什么不同,它們分別適用于什么場景?問答題請設計一個實驗,使用莖葉圖和直方圖分別展示同一數據集,比較它們在表示數據分布特性時的優(yōu)勢和不足。給定一組數據,如何使用散點圖判斷兩個變量之間是否存在相關性?應用題內容應用題--------------PowerPointDesign實訓:Seaborn繪圖與主題更改04PARTPOWERPOINTDESIGN01在Python環(huán)境中使用Seaborn庫創(chuàng)建多種類型的圖表,并嘗試應用不同的主題和樣式來改變圖表的外觀。目標是熟悉Seaborn的基本繪圖功能和主題更改選項,從而提高數據可視化的表達力。需求說明內容需求說明(3)主題應用:探索并應用Seaborn的不同主題(如dark,whitegrid等),觀察和比較這些主題對圖表外觀的影響。(4)樣式自定義:嘗試調整圖表的更多樣式選項,如顏色、字體大小和圖表元素的布局。(1)環(huán)境準備:確保Python環(huán)境已正確安裝,并通過pip安裝Seaborn庫。(2)基本繪圖:按照Seaborn的文檔,創(chuàng)建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論