大数据与人工智能方向基础 ---- 决策树的初步认识

大数据与人工智能方向基础 ---- 决策树的初步认识,第1张

大数据与人工智能方向基础 ---- 决策树的初步认识

目录

前言

一、决策树的基本认识

二、决策树的优势

三、基本流程

四、决策树的使用


前言

有很多新手刚刚接触大数据与人工智能方向学习,如果不知道怎么着手的,跟我一起慢慢进步叭~


提示:以下是本篇文章正文内容,下面案例可供参考

一、决策树的基本认识

决策树:是一类常见的机器学习方法。

顾名思义,决策树是基于树结构来进行决策的,这恰是人类在面临决策问题时一种很自然的处理机制。例如:我们要对“这是好瓜吗”这样的问题进行决策时,通常会进行一系列的判断或子判断:我们先看“它是什么颜色”,如果是“青绿色”,则我们再看“它的根蒂是什么形态?”,如果是“蜷缩”,我们再判断“它敲起来是什么声音?”,最后,我们得出最终决策:这是个好瓜。决策过程如下:

一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应于一个属性测试;每个结点包含的样本集合根据属性测试的结果被划分到子结点中;根结点包含样本全集。从根结点到每个叶结点的路径对应了一个判定测试序列。若为分类树,则决策结果为预测类别;若为回归树,则决策结果为实数值。

二、决策树的优势

决策树的优势:①语义可表示性:从根节点到叶节点的一条决策规则为合取式,决策规则与决策规则之间是析取式,利用合取式和析取式获得某个类别的明确描述;②决策速度快:只需一系列关于待决策样本的简单查询,即可对样本的输出做出判断;③可以很自然地嵌入专家的先验知识。

三、基本流程

决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例(样本)能力强的决策树,其基本流程遵循简单且直观的"分而治之" (divide-and-conquer) 策略。

归纳:a.特征的选择:基于训练样本集,从中选择最优化分特征

b.决策树的生成(模型的局部选择):递归生成决策树,拟合训练样本

c.决策树的剪枝(模型的全局选择):简化模型,使其泛化能力更好,许多分支反映的是训练样本中的噪声和孤立点

四、决策树的使用

模型的使用过程:从根节点开始,对输入样本的特征取值提问,根据不同的回答,转向相应的分支,在到达新的结点处,做类似的分支判断。持续上述过程,直到叶子结点,输出该叶子结点对应的类别标记(或函数值)。

总结

以上只是对决策树的初步认识,更深入的学习请参考后几篇博客呦~

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5699641.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存