摘要:項目描述保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費,那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。則是當前數據人上年度在保險的額度。如何從數據估計線性回歸系數。如何使用線性回歸預測新數據。
1. 項目描述
保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費,那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。
2 數據與簡單分析數據集下載
數據信息如下圖所示:
我們已經獲取到保險公司部分數據,文件名為insurance.csv,文件內容如下。
我們可以看出數據中共有六個維度:age(年齡),sex(性別),bmi(肥胖指數),children(孩子數量),smoker(是否吸煙),region(居住地)。charges則是當前數據人上年度在保險的額度。
所以我們可以構建一個六維高維空間來求解這個模型。
相對于年齡來說, 年齡越大, 購買保險的金額應該越大;
相對于性別來說,整體女性的壽命大于男性壽命大約10年, 因此男性的保險額度應該更大。
相對于肥胖指數來說, 肥胖指數越小, 身體狀況越不好, 購買保險的金額應該越大;
相對于孩子的數量來說, 孩子的數量越多, 壓力越大, 越勞累, 購買保險的金額應該越大;
相對于是否吸煙來說, 吸煙的人壽命遠少于不吸煙的壽命, 因此 購買保險的金額應該越大;
相對于地區來說, 地區環境越差, 有霧霾, 則越容易生病, 那么購買保險的金額應該越大;
最后說明一下,本章中的數據來源主要是來自某保險公司內部的真實歷史數據。
3 項目實踐完成本項目后,您將知道:
如何從訓練數據中估計統計量。
如何從數據估計線性回歸系數。
如何使用線性回歸預測新數據。
import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import PolynomialFeatures from sklearn.linear_model import LinearRegression # 1). 讀取csv文件數據; filename = "data/insurance.csv" data = pd.read_csv(filename) # 2). 清洗數據 reg = LinearRegression() x = data[["age", "sex", "bmi", "children", "smoker", "region"]] y = data["charges"] # 轉換數據類型為整形 x = x.apply(pd.to_numeric, errors="corece") y = y.apply(pd.to_numeric, errors="coerce") # 填充空值 x.fillna(0, inplace=True) y.fillna(0, inplace=True) print(x) print(y) # 3). 開始建模 # degree: 多項式的階數,一般默認是2; # interaction_only:如果值為true(默認是false),則會產生相互影響的特征集。 # include_bias:是否包含偏差列 poly_features = PolynomialFeatures(degree=2, include_bias=False) # 降維 X_poly = poly_features.fit_transform(x) # 4). 用線性回歸進行擬合 reg.fit(X_poly, y) print(reg.coef_) print(reg.intercept_) # 5). 預測 y_predict = reg.predict(X_poly) # 5). 真實的y值繪制:圖形繪制顯示 plt.plot(x["age"], y, "b.") # 預測的y值繪制 plt.plot(X_poly[:, 0], y_predict, "r.") plt.show()
預測值與真實值的圖像顯示:
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/43595.html
摘要:項目描述保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費,那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。則是當前數據人上年度在保險的額度。如何從數據估計線性回歸系數。如何使用線性回歸預測新數據。 1. 項目描述 保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費,那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。 2 數據與簡單分析 數據集下載...
摘要:機器學習算法類型從廣義上講,有種類型的機器學習算法。強化學習的例子馬爾可夫決策過程常用機器學習算法列表以下是常用機器學習算法的列表。我提供了對各種機器學習算法的高級理解以及運行它們的代碼。決策樹是一種監督學習算法,主要用于分類問題。 showImg(https://segmentfault.com/img/remote/1460000019086462); 介紹 谷歌的自動駕駛汽車和機...
閱讀 3208·2021-11-12 10:36
閱讀 1258·2019-08-30 15:56
閱讀 2442·2019-08-30 11:26
閱讀 550·2019-08-29 13:00
閱讀 3608·2019-08-28 18:08
閱讀 2748·2019-08-26 17:18
閱讀 1892·2019-08-26 13:26
閱讀 2431·2019-08-26 11:39