机器学习基本术语(举例说明)

机器学习基本术语(举例说明),第1张

有如所示西瓜数据集:

西瓜数据集
编号色泽根蒂敲声好瓜
1青绿蜷缩浊响
2乌黑蜷缩浊响
3青绿硬挺清脆
4乌黑稍蜷沉闷
  • 示例 (instance) / 样本(sample)

  反映事件或对象在某方面的表现或性质的事项。


如下所示,每一行记录为一个示例(样本)。


色泽根蒂敲声
青绿蜷缩浊响
乌黑蜷缩浊响
青绿硬挺清脆
乌黑稍蜷沉闷
  • 属性 (attribute) / 特征 (feature)

  例如上述"色泽"、“根蒂” 、“敲声”。


  • 属性值 (attribute va1ue)

  属性上的取值。


例如上述属性"色泽"的取值{“青绿” ,“乌黑”}。


  • 属性空间 (attribute space) / 样本空间 (sample space) / 输入空间

  属性张成的空间。


例如把"色泽" “根蒂” "敲声"作为三个坐标轴,则它们张成一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置。


  • 特征向量 (feature vector)

  输入空间中每个点对应的坐标向量

  • 标记(label)

  例如"好瓜",称为"标记"

  • 样例 (example)

  拥有了标记信息的示例。


如下所示,每一行记录为一个样例。


若将标记看作对象本身的一部分,则"样例"有时也称为"样本"

色泽根蒂敲声好瓜
青绿蜷缩浊响
乌黑蜷缩浊响
青绿硬挺清脆
乌黑稍蜷沉闷
  • 标记空间 (label space) / 输出空间

  所有标记的集合

  • 训练集(training set)

  从数据中学得模型的过程称为学习 (learning) 或训练 (training), 这个过程通过执行某个学习算法来完成.训练过程中使用的数据称为训练数据 (training data) ,其中每个样本称为一个训练样本 (training sample), 训练样本组成的集合称为训练集"(training set)

  • 测试集(testing set)

  学得模型后,使用其母行预测的过程称为测试 (testing) ,被预测的样本称为测试样本(testing sample)。


例如在学得 f f f后,对测试示例 x i x_i xi可得到其预测标记 f ( x i ) f(x_i) f(xi)


测试样本组成的集合称为测试集"(training set)。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/567343.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-09
下一篇 2022-04-09

发表评论

登录后才能评论

评论列表(0条)

保存