用交叉验证的目的是为了得到可靠稳定的模型。在建立PCR 或PLS 模型时,一个很重要的因素是取多少个主成分的问题。用cross validation 校验每个主成分下的PRESS值,选择PRESS值小的主成分数。或PRESS值不再变小时的主成分数。
常用的精度测试方法主要是交叉验证,例如10折交叉验证(10-fold cross validation),将数据集分成十份,轮流将其中9份做训练1份做测试,10次的结果的均值作为对算法精度的估计,一般还需要进行多次10折交叉验证求均值,例如:10次10折交叉验证,以求更精确一点
字交叉验证的基本思路是,1。选取6组做检测,剩余的做训练样本对模型进行训练,然后检验模型的性能。
2。选取与前次不同的6组做检测,剩余的做训练样本对模型进行训练,然后检验模型的性能。
3。重复以上步骤,直到所有的样本都被用作1次检测样本。也就是说10次循环就可以了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)