摘要:官方文檔連接像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下寫在前面,如果要對透視表中的字段進行計數(shù),有時候用會報錯,可以用實例運用簡單版透視表上面以部門為索引,下面有二級索引,部門小組。
本節(jié)學習數(shù)據(jù)透視表
引用激勵數(shù)據(jù),連接數(shù)據(jù)庫jili表,jili這幾個太難打了,下文用df代表激勵數(shù)據(jù)(代碼省略)
之前在excel中用爛了的透視表,終于用python來實現(xiàn)了,其實主要是講pivot_table里面的參數(shù)怎么使用,但書中講的不是詳細,還是要自己找一些文檔或者視頻輔助學習。
pivot_table 官方文檔連接
像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下:
df.pivot_table(data, values=None, index=None, columns=None, aggfunc="mean", fill_value=None, margins=False, dropna=True, margins_name="All")
寫在前面,如果要對透視表中的字段進行計數(shù),有時候用count會報錯,可以用len
實例運用:
1、簡單版透視表df.pivot_table(index="dep",aggfunc="sum") #上面以部門為索引,下面有二級索引,部門、小組。 不知道是不是叫二級索引,暫且這么命名吧 df.pivot_table(index=["dep","group"],aggfunc="sum")2、升級版透視表:金額分組
對金額進行分組,然后再來透視表(看了就懂了):
#金額分組 amount = pd.cut(df["allbones"],[0,1000,5000,10000,20000,40000]) df.pivot_table(index=["dep",amount],values= "allbones", aggfunc="count")
因為指定了值values = "allbones",所以結(jié)果中只包含allbones的計算結(jié)果,如果不指定values,則會像上面一樣計算滿足條件的所有字段的count值。
進行多個值的計算,并指定計算方法。 如果有需要,還可以增加計算值。
為了方便查看每個參數(shù)的內(nèi)容,所以換行了。
df.pivot_table(index =[ "dep",amount], values = ["allbones","oldrate"], aggfunc = {"allbones":[np.sum,len,np.mean], #一個字段進行3中運算 "oldrate":np.sum})4、在透視表最后加一個匯總
df.pivot_table(index =[ "dep",amount], values = ["allbones","oldrate"], aggfunc = [np.sum,np.mean,len], margins = True) #margins默認為false,改成True后在表的最后顯示匯總5、大boss版,在每個部門下面進行分類匯總:不會
還沒找到方法
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/44999.html
摘要:聚合后沒有用函數(shù),會返回一個用函數(shù)后會顯示計算結(jié)果組合之后,切片,查看的和。可以設(shè)定計算方法對列進行了切片,如果的均值小于,則不顯示二部的均值低于,所以結(jié)果中沒有二部數(shù)據(jù)。 本節(jié)學習groupby 引用激勵數(shù)據(jù),連接數(shù)據(jù)庫jili表(代碼省略)數(shù)字簡單計算本節(jié)內(nèi)容前面是運用sum/mean等函數(shù)對數(shù)字簡單計算 jili.mean() #求均值 jili.mean(axis = col...
摘要:時間序列,日期格式處理原以為本章是講怎么用處理時間格式,比如提取年月之類的。新增一列日期,不要時分新增兩列年,月,以便后續(xù)分析。這個方法太復(fù)雜,而且處理時間可能會更長,看下面的簡單方法新增月份年。 時間序列,日期格式處理 原以為本章是講怎么用python處理時間格式,比如提取年月之類的。 但本節(jié)寫的是時間格式已經(jīng)工整后的事,暫時不是我想學的,所以跳過,就沒有寫公式了。 下面的函數(shù)時之前...
摘要:第章合并連接數(shù)據(jù)集包含三個函數(shù)省略,在頁。沒有對默認合并兩個表的所有列,如果有列,有列,則結(jié)果為列多對保留多條記錄多對多會交叉每一條記錄通過參數(shù)設(shè)定連接方式兩個表都有兩個字段,則通過連接兩個表。 第3章 7-8:合并、連接數(shù)據(jù)集 包含三個函數(shù):numpy:concatenate 省略,在126頁。pandas:concat/ append(略過) /merge 主要是講merge函數(shù)...
摘要:主成分分析就是降維,通過線性組合,把多個原始變量合并成若干個主成分,這樣每個主成分都變成原始變量的線性組合。相關(guān)系數(shù)系數(shù)為為為。從結(jié)果看,這個數(shù)據(jù)可能不太適合用來分析,因為降到維后的代筆性不足。 這兩天用學了主成分分析,用的是PCA。主成分分析就是降維,通過線性組合,把多個原始變量合并成若干個主成分,這樣每個主成分都變成原始變量的線性組合。所以你想看具體哪個特征對結(jié)果的影響大,通過PC...
摘要:數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑數(shù)據(jù)聚合與分組運算數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑合并數(shù)據(jù)集可根據(jù)一個或多個鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對數(shù)據(jù)進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應(yīng)關(guān)系。 本篇內(nèi)容為整理《利用Python進行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內(nèi)容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
閱讀 2847·2021-11-22 15:22
閱讀 19005·2021-09-22 15:00
閱讀 1432·2021-09-07 09:58
閱讀 1235·2019-08-30 13:01
閱讀 2408·2019-08-29 16:27
閱讀 2344·2019-08-26 13:25
閱讀 1618·2019-08-26 12:13
閱讀 934·2019-08-26 11:53