使用sklearn在PCA中恢复解释名称_variance_ratio_的特征名称

使用sklearn在PCA中恢复解释名称_variance_ratio_的特征名称,第1张

使用sklearn在PCA中恢复解释名称_variance_ratio_的特征名称

此信息包含在

pca
属性中:
components_
。如文档中所述,
pca.components_
输出一个数组
[n_components,n_features]
,因此要了解组件如何与不同功能线性相关,您必须:

注意 :每个系数代表特定的一对零件和特征之间的相关性

import pandas as pdimport pylab as plfrom sklearn import datasetsfrom sklearn.decomposition import PCA# load datasetiris = datasets.load_iris()df = pd.Dataframe(iris.data, columns=iris.feature_names)# normalize datafrom sklearn import preprocessingdata_scaled = pd.Dataframe(preprocessing.scale(df),columns = df.columns)# PCApca = PCA(n_components=2)pca.fit_transform(data_scaled)# Dump components relations with features:print(pd.Dataframe(pca.components_,columns=data_scaled.columns,index = ['PC-1','PC-2']))      sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)PC-10.522372         -0.2633550.581254          0.565611PC-2          -0.372318         -0.925556          -0.021095         -0.065416

重要提示:
作为附带说明,请注意PCA符号不会影响其解释,因为该符号不会影响每个组件中包含的差异。仅形成PCA尺寸的特征的相对符号很重要。实际上,如果再次运行PCA代码,则PCA尺寸可能会与符号相反。对此有一个直观的认识,请考虑向量及其在3-D空间中的负数-
两者本质上都表示空间中的相同方向。检查此帖子以获取更多参考。



欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5643928.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-16
下一篇2022-12-16

发表评论

登录后才能评论

评论列表(0条)

    保存