variable变量python python variance_inflation_factor

转载

架构领航员 2023-07-02 19:00:41

文章标签 variable变量python 主成分分析数组方差 文章分类 Python 后端开发

1，去除线性共线性，使变量数据稀疏。

共线性检测：

1，VIF（方差膨胀因子），1/（1-R**2）以10为分界点，（0-10）不存在多重共线性问题，>10存在多重共线性问题。 (vif包建议5以上则存在共线性问题)

from statsmodels.stats.outliers_influence import variance_inflation_factor as vif

vif(np.array(DataFrame),索引数) #两个参数第一个必须是包含所有解释变量的数组，第二个即为索引值。

features=data.columns
removefeatures=[]
for i in range(len(features)):
     vifs=vif(np.array(data),i)
     if vifs>10:
         removefeatures.append(features[i])
stayfeatures=list(set(features)-set(removefeatures))

2，PCA共线性问题的解决(主成分分析降维)#由于不能明确的知道需要几个变量，存在局限性

from sklearn.decomposition  import PCA
pca=PCA（n_componts=,white=是否需要归一化）
pca.fit(x)  #x可以是array,也可以是dataframe
print(pca.explained_variance_ratio_)

3，针对样本不均衡进行过采样和欠采样

主要运用算法SMOTE

from imblearn.over_sampling   import SMOTE  #不能有str需要时float or int
sm=SMOTE(random_state=?)
over_x,over_y=sm.fit_resample(x,y)

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 客户端服务器 python客户端和服务端

下一篇：python串口线程 python操作串口

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

variable变量python python variance_inflation_factor

variable变量python python variance_inflation_factor

51CTO博客