摘要:保存打開執(zhí)行打開的時候要先加載一個包第二節(jié)畫個圖的方法風格面向?qū)ο螽媹D第節(jié)簡易線型圖先設(shè)置。是一個可以裝圖形文字的容器是帶有刻度和標簽的矩形。
第 4 章是講用matplotlib畫圖
期待已久的內(nèi)容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時候先畫個圖會清晰不少,下面進入正題:
數(shù)據(jù)源:當然是上一章最后一節(jié)的提取了小時的sougou數(shù)據(jù)
第一節(jié):保存
就是教你怎么保存畫的圖,然后再打開它。
保存:fig.savefig("myfigure.png")
打開:Image("myfigure.png") 執(zhí)行打開的時候要先加載一個包: from IPython.display import Image
第二節(jié):畫2個圖的方法
-- matlab風格plt.figure()
plt.subplot(2,1,1)
plt.plot(df.ranks,df.numbers)
plt.subplot(2,1,2)
plt.plot(df.numbers, df.ranks)
fig,ax = plt.subplots(2)
ax[0].plot(df["rank"],df.hours)
ax[1].plot(df["number"],df.hours)
第 3 節(jié):簡易線型圖
先設(shè)置fig, ax。 fig是一個可以裝圖形、文字的容器;ax是帶有刻度和標簽的矩形。設(shè)置好之后再用ax.plot畫圖
fig = plt.figure() ax = plt.axes() ax.plot(df["number"],df["rank"])-- 穿插一個小插曲:在用sogou數(shù)據(jù)畫圖的時候,出現(xiàn)這個提示:
ValueError: x and y must have same first dimension, but have shapes (1,) and (823818,) 用df.rank查看數(shù)據(jù)時,出現(xiàn)的是多列數(shù)據(jù),而不是一列,所以畫圖的時候出現(xiàn)了x,y沒有相同的坐標。
晚上問的大神,他說你先用df["rank"]試下能不能正常顯示,結(jié)果是正常的。那可能是df.rank是調(diào)用了內(nèi)置函數(shù),以后用中括號就可以了。
color = "" 顏色支持英文、代碼、灰度、16進制、RGB、HTML顏色
linestyle = "" 線條的樣式,比如---.:等
df.groupby("hours")["hours"].count().plot(color = "g",linestyle = ":")-- 設(shè)置坐標軸上下限
有兩種方法,效果是一樣的
#設(shè)置 x, y 軸的起始值 df.groupby("hours")["hours"].count().plot(color = "g",linestyle = ":") plt.xlim(0,30) #只能設(shè)置范圍,不能規(guī)定跨度 plt.ylim(10000,100000) #方法2: df.groupby("hours")["hours"].count().plot(color = "g",linestyle = ":") plt.axis([0,25,0,120000]) # plt.axis("")有很其他的功能,可以查看文檔顯示圖例
圖例是label,設(shè)置好圖例后要用plt.legend()才能打印圖例
df.groupby("hours")["rank"].sum().plot(color = "r",linestyle = ":",label="The red data") df.groupby("hours")["hours"].count().plot(color = "g",label = "search/hour") plt.legend() # legend(lable = ["",""], loc = "") label是圖例的名稱,同上;loc是圖例的位置
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/45003.html
摘要:一周沒寫文了,之前干什么去了呢本周前半部分卡在畫圖了,然后的時間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機器學習上一個重大的障礙,處理各種報錯各種不適合,等我學會了和你再來堵我呀 一周沒寫文了,之前干什么去了呢?本周前半部分卡在畫圖了,然后1/3的時間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機器學習上一個重大的障礙,python處理各種報錯各種不適合,等我學會了kettle和spark你再來堵...
摘要:時間序列,日期格式處理原以為本章是講怎么用處理時間格式,比如提取年月之類的。新增一列日期,不要時分新增兩列年,月,以便后續(xù)分析。這個方法太復雜,而且處理時間可能會更長,看下面的簡單方法新增月份年。 時間序列,日期格式處理 原以為本章是講怎么用python處理時間格式,比如提取年月之類的。 但本節(jié)寫的是時間格式已經(jīng)工整后的事,暫時不是我想學的,所以跳過,就沒有寫公式了。 下面的函數(shù)時之前...
摘要:主成分分析就是降維,通過線性組合,把多個原始變量合并成若干個主成分,這樣每個主成分都變成原始變量的線性組合。相關(guān)系數(shù)系數(shù)為為為。從結(jié)果看,這個數(shù)據(jù)可能不太適合用來分析,因為降到維后的代筆性不足。 這兩天用學了主成分分析,用的是PCA。主成分分析就是降維,通過線性組合,把多個原始變量合并成若干個主成分,這樣每個主成分都變成原始變量的線性組合。所以你想看具體哪個特征對結(jié)果的影響大,通過PC...
今天開始學習《數(shù)據(jù)科學手冊》,主要學習3-5章,其他的選修。 -- 先連接數(shù)據(jù)庫加載數(shù)據(jù): 用sqlalchemy 的create_engine連接: 注意:代碼里mysql+pymysql: 這部分不能加空格,否則會報錯 import pymysql import pandas as pd from sqlalchemy import create_engine sql = select...
摘要:貢獻者飛龍版本最近總是有人問我,把這些資料看完一遍要用多長時間,如果你一本書一本書看的話,的確要用很長時間。為了方便大家,我就把每本書的章節(jié)拆開,再按照知識點合并,手動整理了這個知識樹。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 貢獻者:飛龍版...
閱讀 866·2021-11-15 11:37
閱讀 3604·2021-11-11 16:55
閱讀 3270·2021-11-11 11:01
閱讀 999·2019-08-30 15:43
閱讀 2743·2019-08-30 14:12
閱讀 681·2019-08-30 12:58
閱讀 3389·2019-08-29 15:19
閱讀 2025·2019-08-29 13:59