本文關鍵闡述了python大數據可視化制作趨勢線和界限統計圖表,python制作趨勢線,呈現2個自變量的關系,當數據信息包括多個時,應用不一樣顏色形狀區別
一、制作趨勢線
實現方案:
python制作趨勢線,呈現2個自變量的關系,當數據信息包括多個時,應用不一樣顏色形狀區別。
實現代碼:
import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings(action='once') plt.style.use('seaborn-whitegrid') sns.set_style("whitegrid") print(mpl.__version__) print(sns.__version__) def draw_scatter(file): #Import dataset midwest=pd.read_csv(file) #Prepare Data #Create as many colors as there are unique midwest['category'] categories=np.unique(midwest['category']) colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))] #Draw Plot for Each Category plt.figure(figsize=(10,6),dpi=100,facecolor='w',edgecolor='k') for i,category in enumerate(categories): plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s=20,c=colors<i>,label=str(category)) #Decorations plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),) plt.xticks(fontsize=10) plt.yticks(fontsize=10) plt.xlabel('Area',fontdict={'fontsize':10}) plt.ylabel('Population',fontdict={'fontsize':10}) plt.title("Scatterplot of Midwest Area vs Population",fontsize=12) plt.legend(fontsize=10) plt.show() draw_scatter("F:數據雜壇datasetsmidwest_filter.csv")
實現效果:
二、繪制邊界氣泡圖
實現功能:
氣泡圖是散點圖中的一種類型,可以展現三個數值變量之間的關系,之前的文章介紹過一般的散點圖都是反映兩個數值型變量的關系,所以如果還想通過散點圖添加第三個數值型變量的信息,一般可以使用氣泡圖。氣泡圖的實質就是通過第三個數值型變量控制每個散點的大小,點越大,代表的第三維數值越高,反之亦然。而邊界氣泡圖則是在氣泡圖添加第四個類別型變量的信息,將一些重要的點選出來并連接。
實現代碼:
import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns import warnings from scipy.spatial import ConvexHull warnings.filterwarnings(action='once') plt.style.use('seaborn-whitegrid') sns.set_style("whitegrid") print(mpl.__version__) print(sns.__version__) def draw_scatter(file): #Step 1:Prepare Data midwest=pd.read_csv(file) #As many colors as there are unique midwest['category'] categories=np.unique(midwest['category']) colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))] #Step 2:Draw Scatterplot with unique color for each category fig=plt.figure(figsize=(10,6),dpi=80,facecolor='w',edgecolor='k') for i,category in enumerate(categories): plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s='dot_size',c=colors<i>,label=str(category),edgecolors='black',linewidths=.5) #Step 3:Encircling #https://stackoverflow.com/questions/44575681/how-do-i-encircle-different-data-sets-in-scatter-plot def encircle(x,y,ax=None,**kw):#定義encircle函數,圈出重點關注的點 if not ax:ax=plt.gca() p=np.c_[x,y] hull=ConvexHull(p) poly=plt.Polygon(p[hull.vertices,:],**kw) ax.add_patch(poly) #Select data to be encircled midwest_encircle_data1=midwest.loc[midwest.state=='IN',:] encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="pink",fc="#74C476",alpha=0.3) encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="g",fc="none",linewidth=1.5) midwest_encircle_data6=midwest.loc[midwest.state=='WI',:] encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="pink",fc="black",alpha=0.3) encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="black",fc="none",linewidth=1.5,linestyle='--') #Step 4:Decorations plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),) plt.xticks(fontsize=12) plt.yticks(fontsize=12) plt.xlabel('Area',fontdict={'fontsize':14}) plt.ylabel('Population',fontdict={'fontsize':14}) plt.title("Bubble Plot with Encircling",fontsize=14) plt.legend(fontsize=10) plt.show() draw_scatter("F:數據雜壇datasetsmidwest_filter.csv")
實現效果:
綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家帶來幫助。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/130271.html
摘要:俗話說,不會使用工具來完成任務的都是進化不完全的表現,大數據時代,可視化已經深深鉆進我們的生活,使用可視化工具也變的相當普遍,今天我們來總結下當下可視化工具都有哪些。是一個地圖庫,主要面向數據可視化用戶。 俗話說,不會使用工具來完成任務的都是進化不完全的表現,大數據時代,可視化已經深深鉆進我們的生活,使用可視化工具也變的相當普遍,今天我們來總結下當下可視化工具都有哪些。 showImg...
摘要:這些功能和詞匯聽起來非常復雜,似乎對業務人員要求很高,但像網易有數這樣的敏捷可視化分析工具不僅具備這樣的能力,而且易學易用,業務人員只需簡單拖拽,就能輕松制作出兼具敏捷分析與精美展示的報告。 歡迎訪問網易云社區,了解更多網易技術產品運營經驗。 在回答小企業是否需要數據分析這個問題之前,不妨先想想下面兩個問題: 你在電腦上建過表格嗎? 你基于表格中的數據畫過柱形圖、餅狀圖、折線圖嗎? 可...
摘要:下面,作者介紹了八種在中實現的可視化工具包,其中有些包還能用在其它語言中。當提到這些可視化工具時,我想到三個詞探索數據分析。還可以選擇樣式,它模擬了像和等很流行的美化工具。有很多數據可視化的包,但沒法說哪個是最好的。 showImg(https://segmentfault.com/img/remote/1460000019029121); 作者:Aaron Frederick 喜歡用...
閱讀 910·2023-01-14 11:38
閱讀 877·2023-01-14 11:04
閱讀 740·2023-01-14 10:48
閱讀 1981·2023-01-14 10:34
閱讀 942·2023-01-14 10:24
閱讀 818·2023-01-14 10:18
閱讀 498·2023-01-14 10:09
閱讀 572·2023-01-14 10:02