matlab fictree 怎么看生成的决策树利用了那些属性_安全

treefit貌似已经被classregtree代替了，
如果要获得测试值，可以用predict(tree,
test_data)来获得，当然也可以用一些classregtree自有的performance
analysis的函数。

定量决策方法，是指利用数学模型进行优选决策方案的决策方法。\x0d\\x0d\根据数学模型涉及的问题的性质（或者说根据所选方案结果的可靠性），定量决策方法一般分为确定型决策、风险型决策和不确定性决策方法三种。\x0d\\x0d\1、确定型决策方法（盈亏平衡分析）。\x0d\\x0d\确定型决策方法的特点是只有一种选择，决策没有风险，只要满足数学模型的前提条件，数学模型就会给出特定的结果。属于确定型决策方法的主要有盈亏平衡分析模型和经济批量模型。\x0d\\x0d\2、风险型决策方法（决策树）。\x0d\\x0d\有时我们会碰到这样的情况，一个决策方案对应几个相互排斥的可能状态，每一种状态都以一定的可能性（概率0-1）出现，并对应特定结果，这时的决策就被称为风险型决策。风险型决策的目的是如何使收益期望值最大，或者损失期望值最小。期望值是一种方案的损益值与相应概率的乘积之和。下面我们用决策树来说明风险型决策方法。\x0d\\x0d\决策树就是用数枝分叉形态表示各种方案的期望值，剪掉期望值小的方案枝，剩下的最后的方案即是最佳方案。决策树由决策结点、方案枝、状态结点、概率枝四个要素组成。\x0d\\x0d\3、不确定型决策方法。\x0d\\x0d\我们看到，在风险型决策方法中，计算期望值的前提是能够判断各种状况出现的概率。如果出现的概率不清楚，就需要用不确定型方法，这主要有三种，即冒险法、保守法和折中法。采用何种方法取决于决策者对待风险的态度。

两人同兼一职的现象是不存在的。同样，在晋升时，必须一个是胜利者，一个是失败者。

在瞬息万变的经营环境中，企业家要为自己的企业航船把握正确的方向，仅靠你的生活经验和直观感觉是不行的，要借助于现代成熟的定量分析方法，用以检验经验与直感的可靠性和正确性，并根据定量分析结果，进行正确的决策。哈佛商学院的管理经济学课程，教给学生们如何将主观的定性判断，与客观的定量分析相结合进行经营决策的技能。学生们通过这门课的学习，理解了定量分析对于决策的重要性。

哈佛认为，企业经营者，要做好企业的决策，必须了解企业三种经营状态。它们是“零和游戏”、“囚犯两难”和“自然淘汰”。企业面临的多数经营情况，都可归为这三种游戏类型。企业家须判断经营状况属于哪种游戏，从而决定应该采取的行动模式。

“零和游戏”就是一方得分他方失分，即合计为零的游戏。所有竞争项目都有价值，胜者得到价值。

掷硬币可谓典型的零和游戏。正面朝上，背面自然朝下。一方取胜，他方定败。这样便产生了零和游戏。同样，赌赛马、赛狗也可以说是零和游戏的一种。赌赛马取胜的人，从负者手中得到了钱，即赌注和找还钱的总和（当然要交跑道、维护费、赢马所有者的奖金、税款等）是零。

在企业中也是如此，两人同兼一职的现象是不存在的。同样，在晋升时，必须一个是胜利者，一个是失败者。

的确，在这种零和游戏中，选手可选择的战略只是一个，那就是取胜，另无他法。各选手必须竭尽全力，胜利者独享战利品，因此在这里毫无妥协的余地，谈判也毫无意义。

在“囚犯两难”的场合，如果各位参赛者都不想独占好处，那么全体选手就能得到最好的结果。如果大家齐心协力，就能取得对众人来说是最好的结局。如果每个人都姿意妄为，得到的将是最坏的结果。

犯人A、B分别在两间房子内受审。检察官要判犯人无期徒刑，由于种种原因暂时不能判决，于是，检察官向他们两人暗示：如果犯人坦白，省去了法院的时间和经费，就可以得到减刑。如果其中的一个囚犯坦白，提供了证词，此犯人就可得到特别减刑。但是实际上，如果二人都坦白，证词便无用了，所以不能得到相应的减刑。

假设犯人A坦白并提供了证词，但犯人B没有坦白，那么犯人A判刑10年，犯人B就会被判无期徒刑；反之，如果犯人B坦白并作证，犯人A缄默不语的话，则犯人B判10年刑，犯人A则判无期徒刑。如果二人都坦白，省去了二审费用，二人都会被判20年刑。但是假如二人都不坦白，就会因证据不足被免予起诉。

如上所述，如果二人相互配合都不坦白，就能得到最好的结果。然而，二人却分别被关在不同房间里受审，由于对对方不信任，二人都希望因自己坦白而减刑，这也许便招致了最坏的结果。只有信任对方，形成互相配合的状态时，犯人矩阵作战才能成功。

美国航空业在80年代中期，就陷人了这种“犯人两难”矩阵的状况。在实行严厉的管理措施时期，航空公司为缓和价格的航线竞争，就采取了相应措施。但是，管制措施一旦废除，各航空公司便想方设法增加哪怕是数目很少的飞行次数，各航空公司相对降价，来实现自己最大利润的欲望。其结果是，几乎所有的航空公司都得到了最坏的结果。原因是，各航空公司在管制措施取消以前，与职工订立了长期的工作合同，从而无法削减劳务成本。可如果航空公司都一起提高价格，整个航空公司的效益就会大为改观。但是，对消费者来说，幸运的是，在反托拉斯法中，已明确地禁止这样的价格协定。

“自然淘汰”是结婚或其他所有亲密关系中都存在的窘境。游戏中的选手A，希望得到与选手B同样的最好结果。这时对方如果放弃对最好结果的追求、，那么选手A就达到目的了。反之，选手B也亦然。

很多公司为满足各种特定的市场需求而制造产品，但实际上，往往只有一种产品幸存下来。这是因为生产方面的固定费用很高，各公司为了从投资中得到利益，就必须拥有较大的市场占有率。

在商场实战中，为了不让竞争对手进入市场，利害相关者之间的交流和暗示，就具有决定的作用了。让失败可能性很大的人在市场上竞争，是任何当事者都不喜欢的。因此，很多时候，将今后要投放市场的产品消息告诉竞争对手，使其放弃市场竞争，是一种明智而有效的方法。了解究竟谁弃权的最有效的手段，是你自己第一个进入市场。

因为不可能详细叙述所有的分析，我们这里所介绍的框架，只能将复杂的决策，分解为最简单的要素。这是应用于各种职能规范中所必需的决策方法。

管理经济学是数量分析类型学生们喜欢的科目。这是因为在分析过程中；他们可能会发现意想不到的“正确”答案。但是，习惯用主观判断和常识进行决策的学生们，也热衷于学习数量化方法和逻辑分析方法。利用数量分析法，可以避免片面性增加其准确性和可靠性。明白了一个很有趣的道理，那就是，要使决策的数量化过程正确而有效，你必须具备一种靠直觉判断各相关要素的能力。

虽然不能否认优秀的判断力和决策的关键，但管理经济学讲座的目的，是教授在若干个选择方案中，判断哪种方案最为合适的方法。哈佛将送给你一个理想的答案，送给你一个基本的方法。学生学到的定量化技术，适用于正确评价候补方案的价值；预测不确定的未来；防范风险的对策；并用游戏来预测竞争者的反应用线性规划法进行资源配置等等。

管理经济学不仅教授判断方案是否得当的方法，而且对如何向他人明确地表达自己的思考过程也有重大作用。用决策方法的一个最大好处是，如果在分析者之外，可以根据情况做出反应并能把所分析情况资料化，如果有人与分析家做出了不同的预测，是否应采取不同的行动方案，利用决策树方法便可一目了然地明确。所以，决策树利于传达思想和交流情报，可以说是非常好的系统方法之一。

管理经济学的另一个重要内容是敏感性分析。敏感性分析最终左右着判断的结果。对未来的假设和预测，并对这些预测和假设进行检验。利用敏感性分析，即使如果有人做出了错误的假设，也能检验出该假设的错误所在。

哈佛研究的决策方法，适用于非常广泛的领域，比如可以用于下面的各种职业和各种不同的决策问题。

你也许是一位著名的棒球队的市场部部长，你想要搞清几年来对主场比赛的入场观众最有影响的因素是什么？并从分析因素中判断今后该怎样进行市场活动。

你是一个对即将来临的暴风雨应采取对策的葡萄园营业部主任，暴风雨的长短与强弱和你采取的对策，可能造成葡萄全部被毁，也可能使今年成为历史上产量最高的丰收年。

假如你是一个在似乎有石油，又无充分证明的原野上，决定是否投标取得采掘石油权，而且如果投标，又必须决定价格水平的事业部长，你该如何进行决策呢？

哈佛商学院管理经济学的分析基础是决策树。

决策树由决策者必须做出决定的场合和可能出现的不确定事项的场合两部分构成。

利用决策树分析法，必须明确以下几个问题：

第一，描述决策和发生事情的顺序。

第二，应清楚选择列出的方案，与有可能发生的事情之间可能有矛盾。另外还要透彻地进行选择方案的调查。

第三，决策者应预定时间范围。在决策尚未决断时，其决策可根据不同情况而定。

在任何领域都会存在竞争对手。因此，在管理经济学讲座的案例讨论中，教授很重视训练学生们预测竞争对手可能作出的反应，并根据预测的反应来制定行动计划。学生们在各种方案中，要逐个评定各竞争对手的状况，从而选择出对自己公司有利的可靠的战略决策。

第四，在进行决策时，必须依照对某种事件的预测来筹划战略行动。所以，决策树是决定各阶段选择的指南。

在决策上列出选择方案和预想结果后，决策者必须计算所预算各种结果的现金价值。学生要进行的是分析由各种战略的实施所产生的现金收支的现值数额。

按决策的方法逐个分析备选方案，了解其合理的耗费和支出。不过在收益占两个格支出分析中，不包括埋没成本（即与决策无关的开支、应与投资决策分开考虑的财务费用等等）。

为了进行比较，教授还必须帮学生确定以税前或者税后（一般为后者）为甚准计算。其次指导学生在计算各种决策方案结果时，应如何考虑资金的时间价值，因为一切都要用现值表示。所利用的减价要素，不应与税前税后的现金收支发生矛盾。计算中还可能利用加权平均资本成本及再投资率（决策者将剩余资金用于再投资的比率）等指标。

作出“推进”决策的制造部长预计，如果新产品推进成功，税后的现金收入是550万美元，如果失败就要损失350万美元。这时如果放弃该产品，则仅损失开发阶段的埋没成本。

在现实中，要正确地评价末端值，恐怕要用到相当多的数据才行。因此用上述方式辅助判断，并记录各种假设和方案，是比较方便实用的方法。

将预计结果全部绘制于图中，便可预测各种结果的概率了。如掷硬币时，正、反面的概率各为一半，即50％，掷骰子的概率为六分之一。

评价概率时，主观判断同样重要，尽管每种可能结果的概率是根据预测、推测得来的，但是决策者要提高其精确度，还要充分利用以往的经验和数据。

那么，如何将以上步骤用于决策上去呢？哈佛的方法是：

根据预测结果和概率的所有情报，确定可能产生现金价值的行动方式。如果这样能做成决策树，然后再决定哪种行动战略能带来最大利益，而选择“惜售”或“甩卖”等行为，去“分解”决策树。进行这种作业时，哈佛的学生从计算末端值开始，即通过计算结果的加权平均值，得到该事项节的预想现金值。

回归分析比预测更为复杂，一般要借助计算机进行数据计算。也许有人一听就会皱眉头，确实，回归分析技术有些高深，如果你在企业中看到一群人在谈论回归分析的话，差不多可以肯定其中有一两位企业管理硕士或经济学博士。

回归分析是将预想的可能出现的结果，在计算机上实际摸拟的一种技术。采用此技术，能分析出现在的情况及与过去类似的情况，搞清所有对事项可能产生影响的要素。

下面我们来看看美国职业棒球队比赛时，主场比赛观念的预测方法。

首先要考虑对观众数量有影响的各种因素，如比赛球队、比赛时间、比赛季节、星期几、平均票价、客队和主队的明星队员、气温、电视转播、全部比赛场次数量等。

其次，在计算机上输入有关各要素的各种变量数据和各场的观念数，以及过去各比赛季节等信息。

使用回归分析方法，须用计算机进行数千个数据的处理，才可知道哪种变量对观念数量影响最大。根据回归分析所得出的影响要素及其结果的关系，可以说明今后的趋向。

哈佛1981年秋天进行的有关这一问题的调查分析结论是，对观众数量最具影响力的，是有无明星选手参加比赛以及该场比赛是否为决赛两个主要因素{而电视是否转播，对观众的数量影响并不很大。这个调查结果，对承办者来说是很有意义的。

由以上结果可知，纽约·尼克思队给著名球星哈特里克·阿温很高的年薪无可厚非，达克·富罗蒂的年薪猛增也理所当然。因为人们大多是来看他们表演的。可见回归分析证明了直感的正确性。

决策者为收集预测数据还有一个方法，就是选择对于结果有象征性的若干实例，以此来预测结果。相信此技术效果的人们，称之为推销试验。

生产新型口香糖的制造部长，为预测产品实际在全国有无反响，准备在一些地区进行推销试验。抽样越多，收集的情报就越准。另外，试销和抽样要花费大量的时间和金钱，但产品实际投入市场后却不一定能够成功。经营者不断盘算的是“为获得更准确的情报，准备花多少钱？”

哈佛的管理经济学讲座，教给学生们对此类问题应采取的正确方法。决策者对不完整的情报，是不会投入很多资金的。而要获得完整的情报，能使决策者作出正确的判断，又必须投入相当多的资金。

分析两种情况，但在说明之前有一点必须明确，那就是并非分析者描述了决策树就可万事大吉了，而是要把输入公式中的重要情报整体作一下重新分析。

例如，制造部长虽已得出成功和失败的概率，但是不能判断其结果是否正确。为检查这种假设的敏感性，部长会自问，怎样才能开拓一个具有取消中止计划的充分魅力的市场呢？盈亏平衡分析应是解决这一问题的不可缺少的分析方法。

如果用管理经济学的语言来说，就是有多大的成功概率时，投放战略会处于同一水平之上。

制造部长要考虑的另一个因素是非货币价值分析，在这判断新型口香糖的生产会使公司对零售业可施加多大的影响力方面是非常重要的。当他们改变中止投放市场的决定时，这种影响力在何种程度上才为必要。

例如，假定投放市场的成功率为30％，公司为使产品投放市场并获得在功，必须拥有相当于270万美元以上价值的影响力，即在市场上要产生相当的反响。如果制造部长认为没有270万美元以上的市场效果，那么，不能投放市场的决断也就成立了。

但是，尽管如此，制造部长依然担心自己的判断不准时该怎么办呢？除计算预想现金值之外，就没有其他判断标准了吗？此时最好把风险的概率及对风险的讨厌程度也考虑在内。

即便冒风险也不愿放过增加收益的机会的话，就应事先考虑投放后发生什么事情，如果搞得好可赚550万美元。可是如果考虑到企业预算比较紧张，即使是350万美元的损失，也不能小看的话，就要谨慎地考虑投放市场的决策了。

哈佛商学院告诉那些未来的经营者们，每个人及每个企业单位所承担的风险性质，以及对风险的忍耐度，对决策过程起着重要的作用。如果决策不是时常根据预想现金的最大值进行的，那么在开始分析之前，就必须要确定决策的基准是什么。

哈佛商学院还教授以下两种解决问题的技术。因为实际上可选择的方案很多，只靠大脑和笔记本是解决不了问题的，因此这两种技术都要利用电子计算机进行辅助计算。

第一种技术是利用模拟实验模型。这种模型的典型事例，就是计算某年必须生产多少呼拉圈。呼拉圈是一种深受欢迎的产品，生产量相当大，解决此类问题要使用计算机进行。

模拟模型往往用于不确定因素的预测。通过模拟实验，可能对各种战略结果给出实际影响的状况，解决决策树中的很多问题。当然，对产品的新价格总是经常存在着不确定性，但基于各种实验中产生的平均利益，总能找到各种战略的预想现金值，因为用计算机能较容易地验证假设和进行敏感性分析。

第二种技术是线性规划法，一般适用于生产性资源的分配决策。经营目标通常是以最小的支出获得最大的收益。在这种情况下，就要考虑机器设备、从业人员某时期内的生产能力、营业时间、各产品的原材料数量、仓库贮藏能力等资源约束条件。

然后再通过计算机求解学生们提出的诸多联立方程式。学生们通过解释其演算结果，不仅可知全部产品中，哪种产品能达到最大收益；哪个生产部门应完全发挥生产能力；投放新产品能否获利等等，而且还能得出与决策有关的其他各种答案。线性规划模型可用于使系列投资带来最大收益的场合。

模拟实验模型和线性规划模型是经营管理中经常使用的两种定量化模型。

前面分析了各种可能的情况，下面就是怎样决策了。选择战略时，头脑中应思考以下二个问题：

第一，决策树只反映特定决策者的看法，因而判断行动时机和各种不确定事项因人而异。

第二，输入新情报时，情况变了，有时须随之变更决策树。

无论多么优异的决策树，都不过是解决问题的一种方法。

在决定行动战略时，按以下步骤做则很方便。

步骤之一，根据决策基准实行明确的决策，如目的是要获得最大限度的预想现金值？还是最小限度的经济损失？总之必须选择对战略及价值最合适的决策标准。

步骤之二，决策应在一定时间中确实地贯彻执行。在设定目标时，要考虑预计的是长期风险和利益，还是短期和结果？期限多长？要六个月、一年、二年，还是更长的时间。

步骤之三，把可能发生的主要问题都放在决策树中是很困难的，但必须认真和反复地思考各种战略中所能想到的问题和价值。必须考虑对预计行动的竞争反应和结果。为了提高决策树计算的概率的可靠性，还要看看有没有收集到更多情报的选择方案。假如将抽样技术用于结果预测，就要分析一下该结果对作了决断是否具备足够的现实性。

企业的决策多数是很复杂的，往往需要深思熟虑和调查。因此，出色的判断力是决策时不可缺少的要素。在需要考虑与找出与问题有关的各种要素，同时明确各要素问的相互关系的场合，数量分析会成为很好的决策工具。

定量分析技术可能会有意想不到的威力，但如果过于偏信，或漫不经心滥用的话，也可能出现误导决策的危险。判断和直感，是包括数量决策在内的，所有正确的经营决策所不可缺少的要素。、

train_features %训练数据集，可以使用自己的数据或者使用UCI数据集，有需要的话问我或者百度下载
train_targets %类别属性, 一般是就训练数据集的最后一列
inc_node %Percentage of incorrectly assigned samples at a node，默认是025
region %决策域向量，一般为[-x,x,-y,y,number of points]

危险比（hazard ratio）是生存分析中一种比较两组人群生存时间差异的指标。常用于疾病预后研究中，可以描述不同风险因素对于疾病发展的影响。
将危险比应用于分类问题时，可以使用机器学习模型中的决策树算法进行预测建模，其中的一种基于决策树的算法是ForestTree。
ForestTree 是一种高性能的离散数据集分类算法，在Python中可以使用sklearn库中的方法实现。该算法的基本思想是通过构建一系列决策树，每棵树都对训练数据做出分类判断，并根据多数表决方法集成这些结果。
在用ForestTree 算法进行危险比分析时，需要首先获取完整、可信的数据，通过数据预处理和特征工程等方法，确定合适的特征变量，并进行训练集和测试集的划分。然后，将训练数据输入ForestTree 模型进行训练，得到一个由多个决策树组成的集成分类器，并使用测试数据集测试模型效果。
在得到ForestTree 模型的结果之后，可以通过观察结果对危险因素对于结果的影响情况进行分析和解释，并从中获得有益的生物学或临床医学信息，为相关研究提供科学依据。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12891566.html

matlab fictree 怎么看生成的决策树利用了那些属性

发表评论

评论列表（0条）