機器學習(五)-保險保費的多元線性回歸模型案例

hankkin 發布于2019-07-31 10:18 / 1300人閱讀

摘要：項目描述保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費，那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。則是當前數據人上年度在保險的額度。如何從數據估計線性回歸系數。如何使用線性回歸預測新數據。

1. 項目描述

保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費，那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。

2 數據與簡單分析

數據集下載
數據信息如下圖所示:

我們已經獲取到保險公司部分數據，文件名為insurance.csv，文件內容如下。
我們可以看出數據中共有六個維度：age（年齡）,sex（性別）,bmi（肥胖指數）,children（孩子數量）,smoker（是否吸煙）,region（居住地）。charges則是當前數據人上年度在保險的額度。
所以我們可以構建一個六維高維空間來求解這個模型。

相對于年齡來說，年齡越大，購買保險的金額應該越大；

相對于性別來說，整體女性的壽命大于男性壽命大約10年，因此男性的保險額度應該更大。

相對于肥胖指數來說，肥胖指數越小，身體狀況越不好，購買保險的金額應該越大；

相對于孩子的數量來說，孩子的數量越多，壓力越大，越勞累，購買保險的金額應該越大；

相對于是否吸煙來說，吸煙的人壽命遠少于不吸煙的壽命，因此購買保險的金額應該越大；

相對于地區來說，地區環境越差，有霧霾，則越容易生病，那么購買保險的金額應該越大；

最后說明一下，本章中的數據來源主要是來自某保險公司內部的真實歷史數據。

3 項目實踐

完成本項目后，您將知道：

如何從訓練數據中估計統計量。

如何從數據估計線性回歸系數。

如何使用線性回歸預測新數據。

import pandas as pd
import numpy as np
import  matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression

# 1). 讀取csv文件數據;
filename = "data/insurance.csv"
data = pd.read_csv(filename)

# 2). 清洗數據
reg = LinearRegression()
x = data[["age", "sex", "bmi", "children", "smoker", "region"]]
y = data["charges"]
# 轉換數據類型為整形
x = x.apply(pd.to_numeric, errors="corece")
y = y.apply(pd.to_numeric, errors="coerce")
# 填充空值
x.fillna(0, inplace=True)
y.fillna(0, inplace=True)

print(x)
print(y)


# 3). 開始建模
# degree： 多項式的階數，一般默認是2;
# interaction_only:如果值為true(默認是false),則會產生相互影響的特征集。
# include_bias:是否包含偏差列
poly_features = PolynomialFeatures(degree=2, include_bias=False)
# 降維
X_poly = poly_features.fit_transform(x)


# 4). 用線性回歸進行擬合
reg.fit(X_poly, y)
print(reg.coef_)
print(reg.intercept_)

# 5). 預測
y_predict = reg.predict(X_poly)


# 5). 真實的y值繪制:圖形繪制顯示
plt.plot(x["age"], y, "b.")
# 預測的y值繪制
plt.plot(X_poly[:, 0], y_predict, "r.")
plt.show()

預測值與真實值的圖像顯示:

GPU云服務器云服務器機器學習回歸機器學習回歸算法線性回歸最小二乘多元線性

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/43595.html

機器學習(五)-保險保費的多元線性回歸模型案例

摘要：項目描述保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費，那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。則是當前數據人上年度在保險的額度。如何從數據估計線性回歸系數。如何使用線性回歸預測新數據。 1. 項目描述保險公司對個人投保時或根據歷史數據生成的模型來計算個人保費，那么本次我們就以這個模型的求解過程為例來實踐下多元線性回歸。 2 數據與簡單分析數據集下載...

codercao 2019-06-26 18:53 評論0 收藏0
機器學習算法基礎（使用Python代碼）

摘要：機器學習算法類型從廣義上講，有種類型的機器學習算法。強化學習的例子馬爾可夫決策過程常用機器學習算法列表以下是常用機器學習算法的列表。我提供了對各種機器學習算法的高級理解以及運行它們的代碼。決策樹是一種監督學習算法，主要用于分類問題。 showImg(https://segmentfault.com/img/remote/1460000019086462); 介紹谷歌的自動駕駛汽車和機...

BenCHou 2019-07-31 10:22 評論0 收藏0

發表評論

登陸后可評論

0條評論

hankkin

男|高級講師

我要關注我要私信

TA的文章

Python使用Numpy實現Kmeans算法

閱讀 3208·2021-11-12 10:36
viewport&像素

閱讀 1258·2019-08-30 15:56
什么是 CSS？

閱讀 2442·2019-08-30 11:26
CSS Modules實踐

閱讀 550·2019-08-29 13:00
CSS

閱讀 3608·2019-08-28 18:08
微信小程序實踐_4顯示新聞（1）

閱讀 2748·2019-08-26 17:18
復習Javascript專題（二）：閉包，內存，以及垃圾回收機制

閱讀 1892·2019-08-26 13:26
css3動畫整理

閱讀 2431·2019-08-26 11:39

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

機器學習(五)-保險保費的多元線性回歸模型案例

相關文章