XGBoost筛选特征时的重要性分析图

2024-01-03 09:14:07

一、数据集

使用波士顿房价数据集,通常包含以下特征(这些特征名称应与你的数据集一致):

CRIM:城镇人均犯罪率
ZN:占地面积超过 25,000 平方英尺的住宅用地比例
INDUS:城镇非零售商用土地比例
CHAS:查尔斯河虚拟变量(如果边界是河流,则为1,否则为0)
NOX:一氧化氮浓度(百万分之一)
RM:每个住宅的平均房间数
AGE:1940 年之前建造的自住房屋的比例
DIS:距离五个波士顿就业中心的加权距离
RAD:径向公路的可达性指数
TAX:每 $10,000 的全额财产税率
PTRATIO:城镇师生比例
B:1000*(黑人占比-0.63)^2,其中黑人占比为城镇黑人的比例
LSTAT:低社会地位人口的百分比

二、画图

import matplotlib.pyplot as plt
from xgboost import XGBRegressor
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split

文章来源:https://blog.csdn.net/QMU111/article/details/135351089
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。