摘要:表示從負(fù)無窮積分到時的返回值,可以得到個隨機(jī)的符合正態(tài)分布的數(shù)字。
1.這些操作都要確保已經(jīng)在電腦中安裝好了Anaconda集成庫,如果安裝好后運(yùn)行出錯誤,可以將原來電腦中的python卸載重新安裝Anaconda,建議安裝時直接將添加環(huán)境變量打勾,否則以后得自己添加環(huán)境變量,在Pycharm中的編譯器選擇Anaconda安裝文件夾中的python。在Pycharm中新建一個data文件夾用來存放數(shù)據(jù)文件。
2.打開Python Console。
3.首先在用python讀取數(shù)據(jù),需要先輸入import pandas as pd引入pandas包,再輸入df=pd.read_csv("./data/CityData.csv")讀取數(shù)據(jù),最后輸入df顯示數(shù)據(jù)。
4.分別輸入type(df)和type(df["cid"])可以發(fā)現(xiàn)兩種數(shù)據(jù)類型不同。
5.計(jì)算平均值:df.mean()或df["xid"].mean()
6.計(jì)算中位數(shù):輸入df.median()或df["yid"].median
7.求四分位數(shù):輸入df.quantile(q=0.25)
8.求眾數(shù):輸入df.mode()或df["xid"].mode()
9.求標(biāo)準(zhǔn)差:輸入df.std()或df["yid"].std()
10.計(jì)算方差:df.var()或df["xid"].var()
11.求和:df.sum()或df["xid"].sum()
12.計(jì)算偏態(tài)系數(shù):df.skew()或df["yid"].skew()
13.計(jì)算峰態(tài)系數(shù):df.kurt()或df["yid"].kurt()
14.生成正態(tài)分布函數(shù),pandas無法直接生成,需要先引入scipyimport scipy.stats as ss,再輸入ss.norm,這時生成的是一個正態(tài)分布的對象,我們輸入ss.norm.stats(moments="mvsk")查看一下,mvsk分別代表的是均值、方差、偏態(tài)系數(shù)、峰態(tài)系數(shù)。
這時我們可以看到生成四個值,分別對應(yīng)正態(tài)分布的mvsk分別為0、1、0、0。
15.ss.norm.pdf(0.0)表示橫坐標(biāo)為0時的縱坐標(biāo)的值。ss.norm.ppf(0.9)表示從負(fù)無窮累積到返回值時得到的值為0.9,其中ppf后的值必須在0-1之間。ss.norm.cdf(2)表示從負(fù)無窮積分到2時的返回值,ss.norm.rvs(size=10)可以得到10個隨機(jī)的符合正態(tài)分布的數(shù)字。
16.類似的,我們可以分別輸入ss.chi2和ss.t得到卡方分布和T分布。
17.此外我們還可以進(jìn)行抽樣,輸入df.sample(n=10)從數(shù)據(jù)中抽取10個樣本,輸入df.sample(frac=0.1)從數(shù)據(jù)中抽取10%的樣本。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/43006.html
如何精確地記錄一篇文章的閱讀量是一個比較復(fù)雜的問題,不過對于我們的博客來說,沒有必要記錄的那么精確。因此我們使用一種簡單但有效的方式來記錄博客文章的閱讀量:文章每被瀏覽一次,則其閱讀量 +1,即所謂的文章頁面 PV(Page View)數(shù)。雖然簡單粗暴,但卻高效實(shí)用。 增加新字段 為了記錄文章的瀏覽量,需要在文章的數(shù)據(jù)庫表中新增一個用于存儲閱讀量的字段。因此給博客文章的模型新增一個 views 字...
閱讀 3228·2021-11-15 11:37
閱讀 2449·2021-09-29 09:48
閱讀 3813·2021-09-22 15:55
閱讀 3014·2021-09-22 10:02
閱讀 2636·2021-08-25 09:40
閱讀 3225·2021-08-03 14:03
閱讀 1691·2019-08-29 13:11
閱讀 1570·2019-08-29 12:49