机器学习算法 | Python实现k-近邻算法

机器学习算法 | Python实现k-近邻算法,第1张

机器学习算法 | Python实现k-近邻算法

目录
    • 机器学习算法 | Python实现k-近邻算法
      • 基本介绍
      • 工作原理
      • 程序设计
      • 参考资料

基本介绍

KNN,全名k近邻算法。是⼀种⾮常简单有效的机器学习算法。KNN是通过计算不同特征值距离作为分类依据,即计算⼀个待分类对象不同​特征值与样本库中每⼀个样本上对应特征值的差值,将每个维度差值求和也就得到了该组数据与样本之间的距离,⼀般使⽤欧式距离进⾏计算,通过对所有样本求距离,最终得到离待分类对象最近的K个样本,将这K个点作为分类依据。

  • 优点:精度高、对异常值不敏感、无数据输入假定,对数据的特征类型没有明确的要求;
  • 缺点:时间复杂度高、空间复杂度高;

适用数据范围:数值型和标称型;
关键点:k值的选取,k值为10以内的奇数(奇数是为了避免出现打成平⼿的情况),也可以通过交叉验证的⽅式来选取得到合适的k值;

工作原理
  • 存在一个样本数据集合,也称作训练样本集

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/868873.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-13
下一篇 2022-05-13

发表评论

登录后才能评论

评论列表(0条)

保存