《Python從入門到數(shù)據(jù)分析應用》 思政課件 第11章 Seaborn-2_第1頁
《Python從入門到數(shù)據(jù)分析應用》 思政課件 第11章 Seaborn-2_第2頁
《Python從入門到數(shù)據(jù)分析應用》 思政課件 第11章 Seaborn-2_第3頁
《Python從入門到數(shù)據(jù)分析應用》 思政課件 第11章 Seaborn-2_第4頁
《Python從入門到數(shù)據(jù)分析應用》 思政課件 第11章 Seaborn-2_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Python程序設計——從入門到數(shù)據(jù)分析PYTHON第十一章seaborn11.6seaborn簡介11.7seaborn基本繪圖11.7.1統(tǒng)計關系可視化11.7.2分類數(shù)據(jù)可視化11.7.3分布數(shù)據(jù)可視化11.7.4可視化線性關系11.8例題11.6seaborn簡介

Matplotlib:參數(shù)多;seaborn:

基于Matplotlib核心庫進行了更高級的API封裝,seaborn能簡化復雜繪圖,用簡單的語句輕松地畫出更美觀的圖形。seaborn是一個基于

matplotlib

,數(shù)據(jù)結構與

pandas

統(tǒng)一的統(tǒng)計圖制作庫。11.6

seaborn功能與特點11.6

常見圖形種類5.核密度圖6.直方圖7.點對圖8.回歸圖1.散點圖2.盒圖3.小提琴圖4.柱狀圖11.7seaborn基本繪圖

11.7.1可視化統(tǒng)計關系

統(tǒng)計分析是了解數(shù)據(jù)集中的變量如何相互關聯(lián)以及這些關系如何依賴于其他變量的過程。常用的三個函數(shù)如下:11.7

11.7.1可視化統(tǒng)計關系11.7

11.7.1可視化統(tǒng)計關系11.7

autofmt_xdate():改變x軸坐標的顯示方式,可以傾斜顯示11.7.1可視化統(tǒng)計關系11.7

cumsum()這個函數(shù)的功能是返回給定axis上的累計和函數(shù)的原型cumsum()11.7.1可視化統(tǒng)計關系11.7

11.7.2分類數(shù)據(jù)繪圖catplot()(1)分類散點圖catplot(kind=“strip”),默認catplot(kind=“swarm”)#蜂群圖(2)分類觀測分布圖catplot(kind=“box”)catplot(kind=“violin”)(3)分類統(tǒng)計估計圖catplot(kind=“bar”)catplot(kind=“count”)展示每個分類下觀測值的數(shù)量11.7

(1)分類散點圖11.7

盒圖

箱線圖(boxplot):也叫盒圖,用于顯示數(shù)據(jù)的離散分布情況,它由五個數(shù)值點組成:最小值(min),下四分位數(shù)(Q1),中位數(shù)(median),上四分位數(shù)(Q3),最大值(max)。由于真實數(shù)據(jù)中存在“離群點”,為了避免數(shù)據(jù)的整體特征受個別離群點影響而偏移,則將離群點單獨繪出。在盒圖中,兩端的胡須分別表示最小觀測值與最大觀測值。最大(最小)觀測值設置為四分位數(shù)值間距離IQR的1.5倍。箱線圖結構如圖4所示。(2)分類觀測分布圖11.7(1)盒圖seaborn的主題:darkgrid黑色網格(默認)whitegrid白色網格dark黑色背景white白色背景小提琴圖將盒圖與核密度圖相結合。sns.violinplot(x=tips["total_bill"])(2)小提琴圖(2)分類觀測分布圖11.7

(2)分類觀測分布圖

11.7

(2)分類觀測分布圖11.7

(3)分類統(tǒng)計估計圖11.7

11.7.3分布數(shù)據(jù)可視化(1)單變量分布

在seaborn中,單變量分布的常用displot()函數(shù)。默認情況下,該方法將繪制直方圖histogram并擬合內核密度估計kerneldensityestimate(KDE)。(2)繪制二元分布可視化兩個變量的二元分布。在seaborn中,簡單的方法是使用jointplot()函數(shù),它顯示了兩個變量之間的二元(或聯(lián)合)關系,以及每個變量在單獨軸上的一元(或邊際)分布。11.7(1)單變量分布——displot()11.7.3分布數(shù)據(jù)可視化11.7

11.7.3分布數(shù)據(jù)可視化(1)繪制二元分布11.7

11.7.3分布數(shù)據(jù)可視化雙變量核密度圖sns.kdeplot(x=tips["total_bill"],y=tips['tip'])11.7

11.7.4可視化線性關系regplot()與lmplot()11.7

可視化線性關系,可以用regplot()和implot()函數(shù)。regplot()中的x,y參數(shù)接受numpy數(shù)組、pandas序列(Series)等多種數(shù)據(jù)類型,還可以將pandasDataFrame傳遞給data參數(shù)。lmplot()的data參數(shù)是不能為空的,同時x和y參數(shù)必須以字符串形式指定。regplot()僅提供了lmplot()特性的一部分。regplot()與lmplot()11.7.4可視化線性關系11.711.7.4可視化線性關系【例題11.1】讀入tips數(shù)據(jù)集,查看total_bill和tip兩字段的線性關系。知識點總結11.8【例11.2】房價數(shù)據(jù)分析對數(shù)據(jù)集boston_house_prices.csv中的字段進行分析,并做出散點圖、直方圖、盒圖、柱狀圖以及核密度圖。字段的含義如表1所示。表1房價數(shù)據(jù)字段seaborn11.8字段名含義CRIM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論