给定一个1000列100万行的训练数据集,怎么进行降维?

给定一个1000列100万行的训练数据集,怎么进行降维?,第1张

给定一个1000列100万行的训练数据集,怎么进行降维?
  1. 对大样本进行抽样使其变为小样本
  2. 可以将分类变量和数值变量分开,同时删掉相关联的变量,对于数值变量,可以通过相关性分析来找到相关的特征,对于分类变量可以通过卡方检验来找到
  3. 还可以通过PCA降维,获取包含最多方差的特征,也就是包含最多信息的特征

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4893630.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-12
下一篇 2022-11-12

发表评论

登录后才能评论

评论列表(0条)

保存