摘要:有一些表示常見(jiàn)圖形的對(duì)象稱(chēng)為塊,完整的集合位于。中的繪圖函數(shù)在中,有行標(biāo)簽列標(biāo)簽分組信息。密度圖通過(guò)計(jì)算可能會(huì)產(chǎn)生觀測(cè)數(shù)據(jù)的連續(xù)概率分布的估計(jì)而產(chǎn)生的。在探索式數(shù)據(jù)分析工作中,同時(shí)觀察一組變量的散布圖是很有意義的。
我們?cè)谏弦黄榻B了 pandas,本篇介紹 matplotlib。
一個(gè)用于創(chuàng)建出版質(zhì)量圖表的桌面繪圖包。
Matplotlib API入門(mén)Figure 和 Subplot
matplotlib的圖像都位于Figure對(duì)象中。
帶有三個(gè)subplot的Figure:
這些由fig.add_subplot所返回的對(duì)象是AxesSubplot對(duì)象,直接調(diào)用它們的實(shí)例方法就可以在其它空著的格子里畫(huà)圖了。
這時(shí)發(fā)出一條繪圖命令,matplotlib就會(huì)在最后一個(gè)用過(guò)的subplot上進(jìn)行繪制(如果沒(méi)有會(huì)創(chuàng)建一個(gè)):
K--:一個(gè)線型選項(xiàng),用于告訴matplotlib繪制黑色虛線圖。
依次畫(huà)出虛線、直方圖、散點(diǎn)圖。
根據(jù)特定布局創(chuàng)建Figure和subplot的簡(jiǎn)便方法:plt.subplots, 它可以創(chuàng)建一個(gè)新的Figure,并返回一個(gè)含有已創(chuàng)建的subplot對(duì)象的NumPy數(shù)組:
可以對(duì) axes數(shù)組進(jìn)行索引,就像是一個(gè)二維數(shù)組一樣:
還可以通過(guò)sharex和sharey指定subplot應(yīng)該具有相同的X軸或Y軸(刻度),在比較相同范圍的數(shù)據(jù)時(shí)用,否則matplotlib會(huì)自動(dòng)縮放各圖表的界限。
調(diào)整subplot周?chē)拈g距
默認(rèn)情況下,matplotlib會(huì)在subplot外圍留下一定的邊距,在subplot之間留下一定的間距。間距跟圖像的高度和寬度有關(guān)。
利用Figure的subplots_adjust方法修改間距。
下面的例子間距收縮到 0:
軸標(biāo)簽重疊了,matplotlib不會(huì)檢查標(biāo)簽是否重疊,這時(shí)要自己設(shè)定刻度位置和刻度標(biāo)簽。
可以在matplotlib的文檔中找到各種圖表類(lèi)型。
顏色、標(biāo)記和線型
完整的linestyle列表參見(jiàn)plot的文檔。
ax.plot(x, y, "g--") #根據(jù)x, y繪制綠色虛線 ax.plot(x, y, linestyle="--", color="g") #更明確的方式,和上面一樣的效果
要使用其他任意顏色可以通過(guò)指定其 RGB 值的形式(如 #CECECE)
matplotlib創(chuàng)建的是連續(xù)的線型圖,即點(diǎn)與點(diǎn)之間插值,非實(shí)際數(shù)據(jù)點(diǎn)默認(rèn)是按線性方式插值的,可以通過(guò)drawstyle選項(xiàng)修改:
線型圖可以加上一些標(biāo)記,以強(qiáng)調(diào)實(shí)際的數(shù)據(jù)點(diǎn):
標(biāo)記類(lèi)型和線型必須放在顏色后面。
簡(jiǎn)化的寫(xiě)法:
刻度、標(biāo)簽和圖例
過(guò)程型的pyplot接口
交互式使用,有xlim, xticks, xticklabels之類(lèi)的方法,它們分別控制圖表的范圍,刻度位置,刻度標(biāo)簽等。
調(diào)用時(shí)不帶參數(shù),如plt.xlim()返回當(dāng)前的X軸繪圖范圍。
調(diào)用時(shí)帶參數(shù),如plt.xlim([0, 10])會(huì)將X軸的范圍設(shè)置為 0 到 10。
更為面向?qū)ο蟮脑?b>matplotlib API。
設(shè)置標(biāo)題、軸標(biāo)簽、刻度以及刻度標(biāo)簽
繪制一段隨機(jī)漫步:
修改X軸刻度:set_xticks(數(shù)值),set_xticklabels(其他任何的值用作刻度)。
添加圖例(legend)
添加圖例的方式:添加subplot的時(shí)候傳入label參數(shù)。
調(diào)用 ax.legend() 或 plt.legend() 來(lái)自動(dòng)創(chuàng)建圖例。
loc告訴matplotlib要將圖例放在哪,best選擇最不礙事的位置。
去除圖例:不傳入label或傳入label="_nolegend_"(注意有兩個(gè)下劃線)。
注釋以及在Subplot上繪圖
注釋?zhuān)和ㄟ^(guò) text, arrow, annotate 等函數(shù)進(jìn)行添加。
matplotlib有一些表示常見(jiàn)圖形的對(duì)象:稱(chēng)為塊(patch),完整的集合位于matplotlib.patches。
創(chuàng)建一個(gè)塊對(duì)象shp,然后通過(guò)ax.add_patch(shp)將其添加到subplot中:
圖表對(duì)象:它們其實(shí)就是由塊組裝而成的。
將圖表保存到文件
利用 plt.savefig 可以將當(dāng)前圖表保存到文件。(該方法相當(dāng)于 Figure 對(duì)象的實(shí)例方法 savefig)。
如要將圖表保存為 SVG 文件:
兩個(gè)重要的選項(xiàng):
dpi:控制“每英寸點(diǎn)數(shù)”分辨率;
bbox_inches:可以剪除當(dāng)前圖表周?chē)目瞻撞糠帧?/p>
得到一張帶有最小白邊且分辨率為 400DPI 的 PNG 圖片:
savefig并非一定要寫(xiě)入磁盤(pán),也可寫(xiě)入任何文件型的對(duì)象,比如StringIO:
matplotlib配置
操作matplotlib配置系統(tǒng)的方式:Python 編程方式,即利用rc方法。
如將全局的圖像默認(rèn)大小設(shè)置為 10 * 10,執(zhí)行:
plt.rc("figure", figsize=(10, 10))
rc的第一個(gè)參數(shù):是希望自定義的對(duì)象(如"figure", "axes", "xtick", "ytick", "grid", "legend"),這里是figure。
可以跟一系列的關(guān)鍵字參數(shù),將它們寫(xiě)成一個(gè)字典:
全部的自定義選項(xiàng):查閱matplotlib的配置文件matplotlibrc(位于 matplotlib/mpl-data 目錄中)。對(duì)該文件進(jìn)行自定義,并將其放在目錄中,則每次使用matplotlib時(shí)就會(huì)加載該文件。
在pandas中,有行標(biāo)簽、列標(biāo)簽、分組信息。
要制作一張完整的圖表,原本需要一大堆的matplotlib代碼,現(xiàn)在只需一兩條簡(jiǎn)潔的語(yǔ)句就可以了。pandas有許多能夠利用DataFrame對(duì)象數(shù)據(jù)組織特點(diǎn)來(lái)創(chuàng)建標(biāo)準(zhǔn)圖表的高級(jí)繪圖方法。
線型圖
Series和DataFrame都有一個(gè)用于生成各類(lèi)圖表的plot方法,默認(rèn)情況下它們都生成線型圖。
DataFrame的plot方法會(huì)在一個(gè) subplot 中為各列繪制一條線,并自動(dòng)創(chuàng)建圖例。
柱狀圖
垂直柱狀圖:Kind="bar"
水平柱狀圖:Kind="barh"
設(shè)置 stacked=True 即可為DataFrame生成堆積柱狀圖:
柱狀圖利用value_counts圖形化顯示Series中各值的出現(xiàn)頻率,如:
直方圖和密度圖
直方圖(histogram):是一種可以對(duì)值頻率進(jìn)行離散化顯示的柱狀圖。
密度圖:通過(guò)計(jì)算“可能會(huì)產(chǎn)生觀測(cè)數(shù)據(jù)的連續(xù)概率分布的估計(jì)”而產(chǎn)生的。
一般的過(guò)程是將該分布近似為一組核(如正態(tài)(高斯)分布之類(lèi)的較為簡(jiǎn)單的分布)。
密度圖也被稱(chēng)作 KDE 圖(Kernel Density Estimate 核密度估計(jì))。
直方圖和密度圖常被畫(huà)在一起,直方圖以規(guī)格化形式給出(以便給出面元密度),再在其上繪制核密度估計(jì)。
由兩個(gè)不同的標(biāo)準(zhǔn)正態(tài)分布組成的雙峰分布:
最后一行代碼繪制的密度圖的最終結(jié)果:
散布圖
散布圖(scatter plot):是觀察兩個(gè)一維數(shù)據(jù)序列之間關(guān)系的有效手段。
matplotlib的scatter方法是繪制散布圖的主要方法。
在探索式數(shù)據(jù)分析工作中,同時(shí)觀察一組變量的散布圖是很有意義的。也被稱(chēng)為散布圖矩陣(scatter plot matrix)。
pandas提供了一個(gè)能從DataFrame創(chuàng)建散布圖矩陣的 scatter_matrix 函數(shù),它還支持在對(duì)角線上放置各變量的直方圖或密度圖。
不足之處,歡迎指正。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/44742.html
摘要:根據(jù)錯(cuò)誤率決定是否回退到訓(xùn)練階段,通過(guò)改變迭代的次數(shù)和步長(zhǎng)等參數(shù)來(lái)得到更好的回歸系數(shù)。使用回歸方法進(jìn)行分類(lèi)所需做的是把測(cè)試集上每個(gè)特征向量乘以最優(yōu)化方法得來(lái)的回歸系數(shù),再將該乘積結(jié)果求和,最后輸入到函數(shù)即可。 本篇內(nèi)容為《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》第 5 章 Logistic 回歸程序清單。 書(shū)中所用代碼為 python2,下面給出的程序清單是在 python3 中實(shí)踐改過(guò)的代碼,希望對(duì)你有幫助。...
摘要:新的稱(chēng)為子類(lèi),而被繼承的稱(chēng)為基類(lèi)父類(lèi)或超類(lèi)。繼承最大的好處是子類(lèi)獲得了父類(lèi)的全部功能。在繼承關(guān)系中,如果一個(gè)實(shí)例的數(shù)據(jù)類(lèi)型是某個(gè)子類(lèi),那它的數(shù)據(jù)類(lèi)型也可以被看做是父類(lèi)。 在上一篇中我們介紹了模塊和數(shù)據(jù)結(jié)構(gòu),這一篇將介紹面向?qū)ο缶幊獭? 面向?qū)ο缶幊?面向?qū)ο缶幊獭狾bject Oriented Programming,簡(jiǎn)稱(chēng) OOP,是一種程序設(shè)計(jì)思想。OOP 把對(duì)象作為程序的基本單元...
摘要:在本節(jié)中,我們將看到一些最流行和最常用的庫(kù),用于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是用于數(shù)據(jù)挖掘,分析和機(jī)器學(xué)習(xí)的最流行的庫(kù)。愿碼提示網(wǎng)址是一個(gè)基于的框架,用于使用多個(gè)或進(jìn)行有效的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。 showImg(https://segmentfault.com/img/remote/1460000018961827?w=999&h=562); 來(lái)源 | 愿碼(ChainDesk.CN)內(nèi)容編輯...
閱讀 1360·2021-11-24 09:39
閱讀 1349·2021-11-04 16:12
閱讀 2694·2021-09-24 09:47
閱讀 3341·2021-09-01 10:50
閱讀 1481·2019-08-30 15:55
閱讀 1427·2019-08-30 15:43
閱讀 647·2019-08-30 11:08
閱讀 3584·2019-08-23 18:33