小編寫這篇文章的主要目的就是,站在當(dāng)下的一個(gè)角度,對(duì)全球疫情情況進(jìn)行一個(gè)數(shù)據(jù)分析,,包括確診、治愈、死亡、時(shí)間、國(guó)家、地區(qū)等這些數(shù)據(jù),針對(duì)這些數(shù)據(jù),進(jìn)行相關(guān)的一些可視化數(shù)據(jù)分析,下面小編就給大家做出一個(gè)詳細(xì)的解答。
本項(xiàng)目主要通過(guò)python的matplotlib pandas pyecharts等庫(kù)對(duì)疫情數(shù)據(jù)進(jìn)行可視化分析。
本數(shù)據(jù)集來(lái)源于kaggle競(jìng)賽的開源數(shù)據(jù)集,數(shù)據(jù)集地址
本數(shù)據(jù)集主要涉及到全球疫情統(tǒng)計(jì),包括確診、治愈、死亡、時(shí)間、國(guó)家、地區(qū)等信息
功能函數(shù)
讀取文件
df=pd.read_csv(r'C:\Users\Hasee\Desktop/covid_19_data.csv') df.head()
更換列名,便于查看
cols=['序號(hào)','日期','省/州','國(guó)家','最近更新','確診','死亡','治愈'] df.columns=cols df.日期=pd.to_datetime(df.日期) df
##利用groupby按照日期統(tǒng)計(jì)確診死亡治愈病例的總和
#合并同一天同國(guó)家日期 global_confirm=df.groupby('日期')[['確診','死亡','治愈']].sum() global_confirm
全球疫情趨勢(shì)
ax=global_confirm.plot(figsize=(12,10),title='全球疫情趨勢(shì)圖')
篩選出中國(guó)的數(shù)據(jù)
利用groupby按照日期統(tǒng)計(jì)確診死亡治愈病例的總和
global_china=df[df['國(guó)家']=='Mainland China'].reset_index() global_china_confirm=global_china.groupby('日期')[['確診','死亡','治愈']].sum().reset_index()
然后對(duì)其進(jìn)行畫圖處理,把圖繪制成三條線
利用groupby按照省統(tǒng)計(jì)確診死亡治愈病例的總和
global_china=df[df['國(guó)家']=='Mainland China'].reset_index() global_china_province_confirm=global_china.groupby('省/州')[['確診','死亡','治愈']].sum().reset_index() recovercent=100.*global_china_province_confirm['治愈']/global_china_province_confirm['治愈'].sum() labels=['{0}-{1:1.2f}%-{2}'.format(i,j,k)for i,j,k in zip(list(global_china_province_confirm['省/州']),recovercent,list(global_china_province_confirm['治愈']))] plt.figure(figsize=(10,10)) plt.pie(global_china_province_confirm['治愈'],radius=0.3)
確診人數(shù)排名前15的國(guó)家
plt.figure(figsize=(16,16)) plt.barh(list(global_country_confirm_rank.國(guó)家)[::-1], list(global_country_confirm_rank.確診)[::-1]) plt.title('確診人數(shù)排名前15的國(guó)家') plt.xlabel('人數(shù)(千萬(wàn))') plt.ylabel('國(guó)家')
這里用pyecharts庫(kù)畫圖,繪制的玫瑰圖,rosetype
set_global_opts是設(shè)置格式:
中國(guó)確診人數(shù)前十的省
china_confirm=df[df['國(guó)家']=="Mainland China"] china_latest=china_confirm[china_confirm['日期']==max(china_confirm['日期'])] words=WordCloud() words.add('確診人數(shù)',[tuple(dic)for dic in zip(list(china_latest['省/州']),list(china_latest['確診']))],word_size_range=[20,100])
區(qū)域圖
china_death=df[df['國(guó)家']=="Mainland China"] china_death_latest=china_death[china_death['日期']==max(china_death['日期'])] china_death_latest=china_death_latest.groupby('省/州')[['確診','死亡']].max().reset_index() geo=Map() geo.add("中國(guó)死亡病例分布",[list(z)for z in zip(china_death_prodic,list(china_death_latest['死亡']))],"china") geo.set_global_opts(title_opts=opts.TitleOpts(title="全國(guó)各省死亡病例數(shù)據(jù)分布"),visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=[ {"min":1500,"label":'>10000人',"color":"#6F171F"}, {"min":500,"max":15000,"label":'500-1000人',"color":"#C92C34"}, {"min":100,"max":499,"label":'100-499人',"color":"#E35B52"}, {"min":10,"max":99,"label":'10-99人',"color":"#F39E86"}, {"min":1,"max":9,"label":'1-9人',"color":"#FDEBD0"}])) geo.render_notebook()
熱力圖
geo=Geo() geo.add_schema(maptype="china") geo.add("中國(guó)死亡病例分布",[list(dic)for dic in zip(china_death_prodic,list(china_death_latest['死亡']))],type_=GeoType.EFFECT_SCATTER) geo.set_global_opts(visualmap_opts=opts.VisualMapOpts(),title_opts=opts.TitleOpts(title="全國(guó)各省死亡病例數(shù)據(jù)分布")) geo.render_notebook()
全球死亡人數(shù)地理分布情況
map=Map() map.set_global_opts(title_opts=opts.TitleOpts(title="全球死亡人數(shù)地理分布情況"),visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=[ {"min":100001,"label":'>100001人',"color":"#6F171F"}, {"min":10001,"max":100000,"label":'10001-100000人',"color":"#C92C34"}, {"min":1001,"max":10000,"label":'1001-10000人',"color":"#E35B52"}, {"min":101,"max":10000,"label":'101-10000人',"color":"#F39E86"}, {"min":1,"max":100,"label":'1-100人',"color":"#FDEBD0"}])) map.add("全球死亡人數(shù)地理分布情況",[list(z)for z in zip(global_death_n,list(global_death['死亡']))],"world") map.set_series_opts(label_opts=opts.LabelOpts(is_show=False)) map.render_notebook()
全球疫情頻率直方圖
global_confirm.plot.hist(alpha=0.5) plt.xlabel('人數(shù)(千萬(wàn))') plt.ylabel('出現(xiàn)頻率') plt.title('全球疫情頻率直方圖')
其他圖
陜西確診病例餅圖
陜西省確診病例數(shù)據(jù)分布
中國(guó)治愈病例玫瑰圖
到此為止,小編這篇文章就給大家介紹到這里了,希望可以給大家?guī)?lái)幫助。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/127932.html
摘要:完成可視化熱搜榜和國(guó)內(nèi)疫情新增圖,提高學(xué)生的編程能力和分析問(wèn)題解決問(wèn)題的能力。下圖為百度微博知乎三大平臺(tái)的熱搜詞頻統(tǒng)計(jì)圖。后續(xù)我會(huì)補(bǔ)上薄弱項(xiàng),為爭(zhēng)取做一名全棧技術(shù)人員而奮斗。 ...
摘要:時(shí)間永遠(yuǎn)都過(guò)得那么快,一晃從年注冊(cè),到現(xiàn)在已經(jīng)過(guò)去了年那些被我藏在收藏夾吃灰的文章,已經(jīng)太多了,是時(shí)候把他們整理一下了。那是因?yàn)槭詹貖A太亂,橡皮擦給設(shè)置私密了,不收拾不好看呀。 ...
摘要:年底,肝膽相照接入保利威直播,肝病行業(yè)學(xué)術(shù)會(huì)議進(jìn)入線上同步直播時(shí)代,也是行業(yè)中首個(gè)建立專業(yè)直播團(tuán)隊(duì)的平臺(tái)。疫情期間,肝膽相照平臺(tái)直播場(chǎng)次較往年成倍數(shù)增長(zhǎng),開展多場(chǎng)公益主題直播,包括指導(dǎo)新冠疫情期間患者居家用藥如何 ? ? ? ? 最近被一個(gè)個(gè)驚人數(shù)字擊中神經(jīng)—— ? 我國(guó)現(xiàn)存乙肝病毒感染者約有7000萬(wàn)例 全球新冠肺炎確診病例超2800萬(wàn) ...
摘要:安全態(tài)勢(shì)可視化系統(tǒng)的目的是生成網(wǎng)絡(luò)安全綜合態(tài)勢(shì)圖,以多視圖多角度多尺度的方式與用戶進(jìn)行交互。可以看到,黑客攻擊是無(wú)處不在,無(wú)時(shí)不有的,世界互聯(lián)網(wǎng)的安全態(tài)勢(shì)并不如我們印象中那么隱蔽和少見(jiàn)。 導(dǎo)語(yǔ) 網(wǎng)絡(luò)態(tài)勢(shì)可視化技術(shù)作為一項(xiàng)新技術(shù),是網(wǎng)絡(luò)安全態(tài)勢(shì)感知與可視化技術(shù)的結(jié)合,將網(wǎng)絡(luò)中蘊(yùn)涵的態(tài)勢(shì)狀況通過(guò)可視化圖形方式展示給用戶,并借助于人在圖形圖像方面強(qiáng)大的處理能力,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)異常行為的分析和檢測(cè)...
閱讀 911·2023-01-14 11:38
閱讀 878·2023-01-14 11:04
閱讀 740·2023-01-14 10:48
閱讀 1983·2023-01-14 10:34
閱讀 942·2023-01-14 10:24
閱讀 819·2023-01-14 10:18
閱讀 499·2023-01-14 10:09
閱讀 572·2023-01-14 10:02