如何用Python對數(shù)據(jù)進(jìn)行分組

89542767 發(fā)布于2022-09-13 11:47 / 875人閱讀

　　小編寫這篇文章的主要目的，就是告訴大家一些知識(shí)，告訴大家如何使用Python對數(shù)據(jù)進(jìn)行分組，另外，相關(guān)的代碼，也會(huì)給貼出來，下面就給大家詳細(xì)的解答下。

　　假如我們這兒有相關(guān)數(shù)據(jù)：

　　data=[
　　("apple",30),("apple",35),
　　("apple",32),("pear",60),
　　("pear",32),("pear",60),
　　("banana",102),("banana",104)
　　]
　　#我們希望變成如下格式
　　"""

　　[('apple',[30,35,32]),
　　('pear',[60,32,60]),
　　('banana',[102,104])]
　　"""
　　假如要是你的話，你應(yīng)該要怎么去寫這個(gè)代碼呢？
　　data=[
　　("apple",30),("apple",35),
　　("apple",32),("pear",60),
　　("pear",32),("pear",60),
　　("banana",102),("banana",104)
　　]
　　data_dict={}
　　for name,count in data:
　　if name not in data_dict:
　　data_dict[name]=[]
　　data_dict[name].append(count)
　　print(data_dict)
　　"""
　　{'apple':[30,35,32],
　　'pear':[60,32,60],
　　'banana':[102,104]}
　　"""

　  print(list(data_dict.items()))
　　"""
　　[('apple',[30,35,32]),
　　('pear',[60,32,60]),
　　('banana',[102,104])]
　　"""

　　上述代碼的書寫方式是完全沒有任何問題的，那么怎樣才能寫的更好一些，可以使用setdefault方法

　　data=[
　　("apple",30),("apple",35),
　　("apple",32),("pear",60),
　　("pear",32),("pear",60),
　　("banana",102),("banana",104)
　　]
　　data_dict={}
　　for name,count in data:
　　#setdefault(k,v)含義如下
　　#當(dāng)k不存在時(shí)，將k:v設(shè)置在字典中，并返回v
　　#當(dāng)k存在時(shí)，直接返回k對應(yīng)值
　　data_dict.setdefault(name,[]).append(count)
　　print(list(data_dict.items()))
　　"""
　　[('apple',[30,35,32]),
　　('pear',[60,32,60]),
　　('banana',[102,104])]
　　"""

　　setdefault算是一個(gè)使用比較常見的方法了，但是就是使用率不高，每次調(diào)用的時(shí)候都會(huì)調(diào)用一個(gè)空值，所以這就會(huì)比較麻煩了。

　　from collections import defaultdict
　　data=[
　　("apple",30),("apple",35),
　　("apple",32),("pear",60),
　　("pear",32),("pear",60),
　　("banana",102),("banana",104)
　　]
　　#里面接收一個(gè)callable
　　#當(dāng)訪問的k不存在時(shí)，返回callable調(diào)用之后的值
　　data_dict1=defaultdict(list)
　　for name,count in data:
　　data_dict1[name].append(count)
　　print(list(data_dict1.items()))
　　"""
　　[('apple',[30,35,32]),
　　('pear',[60,32,60]),
　　('banana',[102,104])]
　　"""
　　#也可以指定為set
　　data_dict2=defaultdict(set)
　　for name,count in data:
　　data_dict2[name].add(count)
　　print(list(data_dict2.items()))
　　"""
　　[('apple',{32,35,30}),
　　('pear',{32,60}),
　　('banana',{104,102})]
　　"""

　　總的來說，defaultdict和字典的setdefault方法非常類似，我們使用setdefault即可。

　　當(dāng)然啦，關(guān)于分組，還有一種特殊情況，就是詞頻統(tǒng)計(jì)。假設(shè)我們想統(tǒng)計(jì)可迭代對象中，每個(gè)元素出現(xiàn)的次數(shù)該怎么做呢？

　　data=["apple","apple","apple",
　　"pear","pear","pear",
　　"banana","banana"]
　　data_dict={}
　　for item in data:
　　#此處不能使用setdefault，因?yàn)樗呛瘮?shù)
　　#.setdefault(item,0)+=1是不符合語法規(guī)則的
　　if item not in data_dict:
　　data_dict[item]=0
　　data_dict[item]+=1
　　print(data_dict)
　　"""
　　{'apple':3,'pear':3,'banana':2}
　　"""
　　#或者使用defaultdict
　　from collections import defaultdict
　　data_dict=defaultdict(int)
　　for item in data:
　　data_dict[item]+=1
　　print(data_dict)
　　"""
　　defaultdict(&lt;class'int'&gt;,
　　{'apple':3,'pear':3,'banana':2})
　　"""

　　然而說到詞頻統(tǒng)計(jì)，我們還可以使用collections下的Counter類。

　　from collections import Counter
　　data=["apple","apple","apple",
　　"pear","pear","pear",
　　"banana","banana"]
　　data_dict=Counter(data)
　　#直接搞定，Counter已經(jīng)包含了我們之前的邏輯
　　print(data_dict)
　　"""
　　Counter({'apple':3,'pear':3,'banana':2})
　　"""
　　#Counter繼承dict，除了支持字典操作之外
　　#還提供了很多其它操作，其中一個(gè)就是most_common
　　#用于選擇出現(xiàn)頻率最高的幾個(gè)元素
　　print(data_dict.most_common(2))
　　"""
　　[('apple',3),('pear',3)]
　　"""

　　綜上所述，使用Python進(jìn)行分組就為大家介紹到這里了，希望可以為各位讀者帶來幫助。

GPU云服務(wù)器云服務(wù)器 js對數(shù)據(jù)進(jìn)行分組如何用python做數(shù)據(jù)分析 python 如何用如何用python

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/127690.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長詳細(xì)說明

閱讀 911·2023-01-14 11:38
OpenMV與JSON編碼問題分析

閱讀 878·2023-01-14 11:04
python中的特性管理模式詳細(xì)說明

閱讀 740·2023-01-14 10:48
Python運(yùn)用fastapi完成上傳圖片

閱讀 1982·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 942·2023-01-14 10:24
Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫操作

閱讀 819·2023-01-14 10:18
本文輕輕松松掌握Python中類的繼承

閱讀 499·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 572·2023-01-14 10:02

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

如何用Python對數(shù)據(jù)進(jìn)行分組

相關(guān)文章

**功能式Python中的探索性數(shù)據(jù)分析**

我所理解的正則表達(dá)式

我所理解的正則表達(dá)式

python 正則表達(dá)式

**如何用Python進(jìn)行數(shù)據(jù)分析？**

發(fā)表評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長詳細(xì)說明

OpenMV與JSON編碼問題分析

python中的特性管理模式詳細(xì)說明

Python運(yùn)用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫操作

本文輕輕松松掌握Python中類的繼承

python中wordcloud組裝方式總結(jié)

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

如何用Python對數(shù)據(jù)進(jìn)行分組

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！