国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

數據科學 第 3 章: 9 累計與分組 groupby

wemallshop / 1722人閱讀

摘要:聚合后沒有用函數,會返回一個用函數后會顯示計算結果組合之后,切片,查看的和。可以設定計算方法對列進行了切片,如果的均值小于,則不顯示二部的均值低于,所以結果中沒有二部數據。

本節學習groupby

引用激勵數據,連接數據庫jili表(代碼省略)
數字簡單計算
本節內容前面是運用sum/mean等函數對數字簡單計算

jili.mean() #求均值
jili.mean(axis = "columns") #求每行的均值
jili.sum()  #求和
groupby:切片計算

groupby的過程:
分割:把dataframe按指定的鍵分為若干組
應用:對每個組應用函數,通常為累計、轉換或過濾
組合:將每組1的結果合并成一個輸出數組。

jili.groupby("dep")  #聚合后沒有用函數,會返回一個dataframe
jili.groupby("dep").sum()   #用函數后會顯示計算結果

# 組合dep 之后,切片oldrate,查看group的和。這里是字符,所以顯示了group的所有值
jili.groupby("dep")["group"].sum()

#組合dep 之后,切片oldrate,查看oldrate的和
jili.groupby("dep")["oldrate"].sum()

# 對每個可以計算的字段進行了描述性統計,中間有省略
# unstack是上一節索引中的內容,是把多重索引轉換為行,具體可以看下面沒有用unstack的對比。
jili.groupby("dep").describe().unstack()

#對groupby之后的結果,切片allbones字段,進行描述性統計
jili.groupby("dep")["allbones"].describe()

groupby:4 種計算方法 1、aggregate:在groupby之后聚合的值上計算

計算方法。如 sum,count,max,std

2、filter:在原來的每個值上做計算,但是在groupby之后做計算

切片 注意filter切片器中一定要有計算方法(summean之類的),否則會報錯。

# aggregate可以設定計算方法
jili.groupby("dep").aggregate(["min","max"])

# filter對allbones列進行了切片,如果dep的allbones均值小于9000,則不顯示. 
# 二部的均值低于9000,所以結果中沒有二部數據。
jili.groupby("dep").filter(lambda x:x["allbones"].mean() >9000)

3、transform:在原來的每個值上做計算,但是在groupby之后做計算

轉換,把原來的值換為計算后的值

jili.groupby("dep").transform(lambda x:x -x.mean()).head(3)  
# x -x.mean()是減取本列的均值

def fun(x):
    x["allbones"] = x["newbones"]-x["oldbones"]
    return x
jili.groupby("dep").apply(fun)
4、apply:

把計算的結果運用到原數據(看下圖)

5、高級用法
#組合為兩層
jili.groupby(["dep","group"]).mean()

#組合為兩層后,只選allbones的值,然后再轉換行列
jili.groupby(["dep","group"])["allbones"].sum().unstack()

以上就是groupby的用法,之前跟著視頻學過,但看書的話更詳細,下節是透視表,拜拜。

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/45000.html

相關文章

  • 數據科學 4 1-3 畫圖的簡單設置

    摘要:保存打開執行打開的時候要先加載一個包第二節畫個圖的方法風格面向對象畫圖第節簡易線型圖先設置。是一個可以裝圖形文字的容器是帶有刻度和標簽的矩形。 第 4 章是講用matplotlib畫圖 期待已久的內容,用可視化展示數據比丟一張數據表給他好的多,在建模的時候先畫個圖會清晰不少,下面進入正題: 數據源:當然是上一章最后一節的提取了小時的sougou數據 第一節:保存就是教你怎么保存畫的圖,...

    ShevaKuilin 評論0 收藏0
  • 數據科學系統學習】Python # 數據分析基本操作[四] 數據規整化和數據聚合分組運算

    摘要:數據規整化清理轉換合并重塑數據聚合與分組運算數據規整化清理轉換合并重塑合并數據集可根據一個或多個鍵將不同中的行鏈接起來。函數根據樣本分位數對數據進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應關系。 本篇內容為整理《利用Python進行數據分析》,博主使用代碼為 Python3,部分內容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...

    The question 評論0 收藏0
  • 利用Pandas和matplotlib分析我愛我家房租區間頻率

    摘要:前幾天利用爬取了我愛我家的租房的一些數據,就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關資料,進行了房租的區間分析。 前幾天利用python爬取了我愛我家的租房的一些數據,就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關資料,進行了房租的區間分析。不得不說,用python做區間分析比我之前用sql關鍵字統計區間簡單多了,話不多說,上代碼 # coding=...

    huayeluoliuhen 評論0 收藏0
  • 【譯】技能測試解決方案:Python中的數據科學(三)

    摘要:在關聯該數據集時,重復行會帶來一定的困擾,為了避免這個困擾,我們只保留重復數據第一個出現的樣本。 本文是譯文,可以轉載,但需注明出處,點擊這里可以獲取原文,有刪減。本系列博文包含四篇文章:【譯】技能測試解決方案:Python中的數據科學(一)——Q1-Q15【譯】技能測試解決方案:Python中的數據科學(二)——Q16-Q30 【譯】技能測試解決方案:Python中的數據科學(三)...

    i_garfileo 評論0 收藏0
  • JavaScript 實現數組更多的高階函數

    摘要:實現數組更多的高階函數吾輩的博客原文場景雖說人人平等,但有些人更加平等。若是有一篇適合萌新閱讀的自己實現數組更多操作的文章,情況或許會發生一些變化。類似于的初始值,但它是一個函數,避免初始值在所有分組中進行累加。 JavaScript 實現數組更多的高階函數 吾輩的博客原文: https://blog.rxliuli.com/p/fc... 場景 雖說人人平等,但有些人更加平等。 為...

    aervon 評論0 收藏0

發表評論

0條評論

wemallshop

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<