摘要:項目目標數據是來自于地區的公共學校的數據,具體描述了學校的坐標,名字,類型等。基于此數據,我們可以學習一些基本的數據分析的方法。例如,研究學校的分布情況,類型統計等。
項目目標:
Boston Public Schools Geo數據是來自于Boston地區的公共學校的數據,具體描述了學校的坐標,名字,類型等。基于此數據,我們可以學習一些基本的Python數據分析的方法。例如,研究學校的分布情況,類型統計等。
數據集介紹:
數據集的介紹如下,其中比較重要的字段有X,Y坐標,ADDRESS地址,ZIPCODE,School類型
Data columns (total 21 columns):
X 131 non-null float64
Y 131 non-null float64
OBJECTID_1 131 non-null int64
OBJECTID 131 non-null int64
BLDG_ID 131 non-null int64
BLDG_NAME 131 non-null object
ADDRESS 131 non-null object
CITY 131 non-null object
ZIPCODE 131 non-null int64
CSP_SCH_ID 131 non-null int64
SCH_ID 131 non-null int64
SCH_NAME 131 non-null object
SCH_LABEL 131 non-null object
SCH_TYPE 131 non-null object
SHARED 131 non-null object
COMPLEX 131 non-null object
Label 131 non-null int64
TLT 131 non-null int64
PL 131 non-null object
POINT_X 131 non-null float64
POINT_Y 131 non-null float64
關鍵代碼實現:
加載數據
schools = pd.read_csv("../input/Public_Schools.csv")
schools.info()
可以看到數據字段如下,一共有21個字段,其中有9個Object類型,4個float64, 8個int64
RangeIndex: 131 entries, 0 to 130
Data columns (total 21 columns):
X 131 non-null float64
Y 131 non-null float64
OBJECTID_1 131 non-null int64
OBJECTID 131 non-null int64
BLDG_ID 131 non-null int64
BLDG_NAME 131 non-null object
ADDRESS 131 non-null object
CITY 131 non-null object
ZIPCODE 131 non-null int64
CSP_SCH_ID 131 non-null int64
SCH_ID 131 non-null int64
SCH_NAME 131 non-null object
SCH_LABEL 131 non-null object
SCH_TYPE 131 non-null object
SHARED 131 non-null object
COMPLEX 131 non-null object
Label 131 non-null int64
TLT 131 non-null int64
PL 131 non-null object
POINT_X 131 non-null float64
POINT_Y 131 non-null float64
dtypes: float64(4), int64(8), object(9)
memory usage: 21.6+ KB
2.接下來,探索數據的缺失值
schools.isnull().any()
可以看到,數據沒有缺失值
1 X False
2 Y False
3 OBJECTID_1 False
4 OBJECTID False
5 BLDG_ID False
6 BLDG_NAME False
7 ADDRESS False
8 CITY False
9 ZIPCODE False
10 CSP_SCH_ID False
11 SCH_ID False
12 SCH_NAME False
13 SCH_LABEL False
14 SCH_TYPE False
15 SHARED False
16 COMPLEX False
17 Label False
18 TLT False
19 PL False
20 POINT_X False
21 POINT_Y False
22 dtype: bool
接下來,Count frequency of schools in each city
1 schools_per_city = schools["CITY"].value_counts()
2 sns.set()
3 plt.rcParams["figure.figsize"] = [20, 7]
4 sns.barplot(x=schools_per_city.index, y=schools_per_city.get_values())
可以看到不同地區的公立學校不同數量
按照ZIPCode統計學校情況
1 school_zipcode = schools["ZIPCODE"].value_counts() sns.set()
2 sns.barplot(x=school_zipcode.index, y=school_zipcode.get_values())
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/45006.html
摘要:項目目標數據是來自于地區的公共學校的數據,具體描述了學校的坐標,名字,類型等。基于此數據,我們可以學習一些基本的數據分析的方法。例如,研究學校的分布情況,類型統計等。 項目目標: Boston Public Schools Geo數據是來自于Boston地區的公共學校的數據,具體描述了學校的坐標,名字,類型等。基于此數據,我們可以學習一些基本的Python數據分析的方法。例如,研究學校...
摘要:作者譯者校對出品翻譯組編程派這是如何打造數據科學作品集系列教程的第一篇。我們將介紹怎樣打造作品集中的第一個項目,怎樣使用數據講述一個有效的故事。班級大小紐約市每所學校班級規模數據。 作者:Vik Paruchuri譯者:Nick Tang校對:EarlGrey出品:PythonTG 翻譯組/編程派 這是「如何打造數據科學作品集」系列教程的第一篇。如果覺得不錯,可以訂閱我們第一時間獲取最...
摘要:汽車本身就是復雜產品對象,其制造過程可以形象的表示建造者模式。另一輛法拉利,。法拉利具體建造者代碼如下構造法拉利的第一部分。咻咻法拉利已造好三建造者模式的優缺點優點降低代碼耦合度。 在未上大學之前,一直有個夢想I have a dream!,就是能成為一位汽車工程師,一直幻想著開著自己設計的汽車飛奔在公路上,迷倒了萬千少女。咳咳~~雖然現在沒實現我的dream,但夢想還是得有的。 說到...
閱讀 3167·2021-11-22 15:25
閱讀 3838·2021-11-17 09:33
閱讀 3362·2021-11-08 13:15
閱讀 3044·2021-09-22 10:56
閱讀 535·2021-08-31 09:45
閱讀 2745·2019-08-30 13:49
閱讀 3072·2019-08-30 12:52
閱讀 1136·2019-08-29 17:05