pandas其實匯集了python函數的一個數據庫,主要是用來調用數據的,作為其中的聚合函數,那么,其中的函數agg的具體用法是怎么樣的呢?下面就給大家詳細的解答下。
今天看到pandas的聚合函數agg,比較陌生,平時的工作中處理數據的時候使用的也比較少,為了加深印象,總結一下使用的方法,其實還是挺好用的。
DataFrame.agg(func,axis=0,*args,**kwargs)
func:函數,函數名稱,函數列表,字典{‘行名/列名’,‘函數名’}
使用指定軸上的一個或多個操作進行聚合。
agg是一個聚合函數,聚合函數操作始終是在軸(默認是列軸,也可設置行軸)上執行,不同于numpy聚合函數
(np.sum()//求和;np.prod()//所有元素相乘;np.mean()//平均值;np.std()//標準差;np.var()//方差;np.median()//中數;np.power()//冪運算;np.sqrt()//開方;np.min()//最小值;np.max()//最大值;np.argmin()//最小值的下標;np.argmax()//最大值的下標;np.inf//無窮大;np.exp(10)//以e為底的指數;np.log(10)//對數)
下面示例展示agg具體用法:
定義一個列表值:
import pandasas pd df=pd.DataFrame([[1,2,3,4], [11,22,33,44], [111,222,333,444], [1111,2222,3333,4444] ], columns=['col1','col2','col3','col4'],)#列名 print(df)
在行上聚合這些函數
df_arows=df.agg(['max','min','mean']) col1 col2 col3 col4 max 1111.0 2222.0 3333.0 4444.0 min 1.0 2.0 3.0 4.0 mean 308.5 617.0 925.5 1234.0
每列不同的聚合
df_columns=df.agg({'col1':['sum','min'],'col2':['max','min'],'col3':['sum','min']}) col1 col2 col3 max NaN 2222.0 NaN min 1.0 2.0 3.0 sum 1234.0 NaN 3702.0
注:當某列沒有其他聚合函數時,則用NaN填充。
總結
綜上所述,這篇文章就給大家介紹到這里了,希望可以給各位讀者帶來幫助。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/128352.html
摘要:最后使用聚合函數,就得到了結果。從實現上看,返回的是一個結構,這個結構必須調用聚合函數如之后,才會得到結構為的數據結果。 介紹 每隔一段時間我都會去學習、回顧一下python中的新函數、新操作。這對于你后面的工作是有一定好處的。本文重點介紹了pandas中groupby、Grouper和agg函數的使用。這2個函數作用類似,都是對數據集中的一類屬性進行聚合操作,比如統計一個用戶在每個月...
摘要:數據規整化清理轉換合并重塑數據聚合與分組運算數據規整化清理轉換合并重塑合并數據集可根據一個或多個鍵將不同中的行鏈接起來。函數根據樣本分位數對數據進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應關系。 本篇內容為整理《利用Python進行數據分析》,博主使用代碼為 Python3,部分內容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
摘要:是一個數據分析的開源庫。與表格或關系數據庫中的表非常神似。注意帶有一個索引,類似于關系數據庫中的主鍵。的統計函數分組與聚合通過方法,可以對數據組施加一系列的函數。函數的作用是串聯,追加數據行使用函數。 pandas(Python data analysis)是一個Python數據分析的開源庫。pandas兩種數據結構:DataFrame和Series 安裝:pandas依賴于NumPy...
摘要:一大熊貓世界來去自如的老生常談,從基礎來看,我們仍然關心對于與外部數據是如何交互的。函數受限制問題唯一重要的參數,標志著一個的第個頁將會被取出。數據分析入門之總結基礎一歡迎來翔的博客查看完成版。 一.大熊貓世界來去自如:Pandas的I/O 老生常談,從基礎來看,我們仍然關心pandas對于與外部數據是如何交互的。 1.1 結構化數據輸入輸出 read_csv與to_csv 是?對...
摘要:按照某一列的數值進行排序后輸出。根據國籍這一列的屬性進行分組,然后分別計算相同國籍的潛力的平均值。值得注意的是,在分組函數后面使用一個函數可以返回帶有分組大小的結果。 這篇文章中使用的數據集是一個足球球員各項技能及其身價的csv表,包含了60多個字段。數據集下載鏈接:數據集 1、DataFrame.info() 這個函數可以輸出讀入表格的一些具體信息。這對于加快數據預處理非常有幫助。 ...
閱讀 911·2023-01-14 11:38
閱讀 878·2023-01-14 11:04
閱讀 740·2023-01-14 10:48
閱讀 1983·2023-01-14 10:34
閱讀 942·2023-01-14 10:24
閱讀 819·2023-01-14 10:18
閱讀 499·2023-01-14 10:09
閱讀 572·2023-01-14 10:02