因子分析方法

因子分析方法,第1张

问题一:统计分析中的因子分析(factors),如何确定因子的个数 方差累计贡献率,碎石图,特征根,很多的

问题二:主成分分析和因子分析有什么区别? 因子分析与主成分分析的异同点:

都对原始数据进行标准化处理; 都消除了原始指标的相关性对综合评价所造成的信息重复的影响; 构造综合评价时所涉及的权数具有客观性; 在信息损失不大的前提下,减少了评价工作量

公共因子比主成分更容易被解释; 因子分析的评价结果没有主成分分析准确; 因子分析比主成分分析的计算工作量大

主成分分析仅仅是变量变换,而因子分析需要构造因子模型。

主成分分析:原始变量的线性组合表示新的综合变量,即主成分;

因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。

问题三:因子分析法的分析步骤 因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。(i)因子分析常常有以下四个基本步骤:⑴确认待分析的原变量是否适合作因子分析。⑵构造因子变量。⑶利用旋转方法使因子变量更具有可解释性。⑷计算因子变量得分。(ii)因子分析的计算过程:⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。⑵求标准化数据的相关矩阵;⑶求相关矩阵的特征值和特征向量;⑷计算方差贡献率与累积方差贡献率;⑸确定因子:设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;⑹因子旋转:若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。⑺用原指标的线性组合来求各因子得分:采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。⑻综合得分以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )此处wi为旋转前或旋转后因子的方差贡献率。⑼得分排序:利用综合得分可以得到得分名次。在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:・ 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子 ,从子 所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。・ 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。・ 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子 ;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。

问题四:因子分析到底有什么用处? 问题:大家觉得因子分析到底有什幺用处呢?把原来很多个影响因素归纳成几个影响因子,如果不继续做回归或者聚类的话,光做因子分析有价值吗?答复:因子分析是将多个实测变量转换为少数几个综合指标(或称潜变量),它反映一种降维的思想。通过降维将相关性高的变量聚在一起,从而减少需要分析的变量的数量,而减少问题分析的复杂性。在你对问题系统结构不了解时候,因子分析可以根据数据内在逻辑性,把它归并成几个公因子,每个公因子分别代表空间的一个维度,如果经过正交或斜 交旋转的话,各个维度之间可以认为是不相关的,这些公因子能够相对完整地刻画对象的体系维度,最起码累计方差贡献率大于85%的话,就基本能够保证重要信 息不丢失了。一句话,你如果对研究对象到底应该分为几个维度不清楚的话,用因子分析可以通过数据内在逻辑告诉你。但如果你对研究对象体系比较清楚的话,那你直接确定维度,通过AHP计算出权重,就能够把系统表述清楚了。但这里面有巨大问题,单纯通过数据内 在逻辑来判断维度,常常是错误的,而主观判断其实更加科学,并非象统计学宣称的,数据说话才有发言权。真正有发言权的,是你对问题的经验认识程度。人们为 了避免被人嘲笑主观判断的失误,而越来越选择了统计分析,实际上,他们并不清楚,单纯用统计分析来做判断,才是最愚蠢的。只有主客观结合起来,才是相对科 学的,两者矛盾的时候,应该深入研究矛盾的根源,搞不清楚的话,我认为指标体系评价法要远比统计分析准确的多。而变量之所以能分布在不同的因子内,则是由 于其方差波动性大小和变量之间的相关性决定的,波动性越大,越排在前面的公因子中,各个公因子之间的变量是不相关的,而每个公因子之间的变量是相关的。因 子分析认为那些数据波动大的变量对对象影响作用更大,它们排在公因子的前列,这样单纯从数据逻辑来判断的准则你认为对吗?我想,如果管理和社会科学都这幺 认为的话,那错误将大大增加了。上面想法是我这两年做课题的体会,没有在任何一本书上看过相关说法,也许说的不对,这是我个人看法。如果让我选择的话,我 宁愿用指标体系评价法,体系几个维度事先就清楚,最多先用因子分析算算,看看数据波动性如何,到底能确定几个维度,只起辅助作用。研究者就是专家,指标体 系的维度由主观来做判断,这主要来自经验判断,而不是由数据判断,我认为其实更科学。当然,如果你对问题一无所知,那指标体系评价法用AHP来做的话,错 误很可能更多。我以前就强烈批判过AHP。说到底,没有一种评价方法是好的,说明问题就好。问题:那能对LISREL进行类似于因子分析的探索性因素分析了解吗?能给点评价么?3x答复:下面是探索性分析的原理:传统上所谈的因素分析)factor ysis)指的是探索性因素分析)exploratory factor ysis),它的目的是在承认有测量误差的情形下,尝试用少数的因素)factors)以解释许多变项间的相关关系。随着统计理论及电脑计算上的进展,目前因素分析的方法可分成探索性因素分析)exploratory factor ysis,EFA)及验证性因素分析)confirmatory factor ysis,CFA),这两类分析之间的差别在于研究者对研究变项间因素结构的了解程度不同。如果研究者对资料内所含的因素性质,结构及个数不是很 清楚,则可使用探索性因素分析试图找出能解释资料变项间相关关系的少数几个重要因素。若研究者从过去文献中的理论及自己的研究经验,而对资料间因素之数 目,结构有一定程度的了解及假设,则可使用验证性因素分析来验证该假设是否能解>>

问题五:因子分析法是什么? 因子分析

1输入数据。

2点Analyze 下拉菜单,选Data Reduction 下的Factor 。

3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。

4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。

5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法――Principal ponents,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。

6单击主对话框中的OK 按钮,输出结果。

统计专业研究生工作室原创,请勿复杂粘贴

问题六:怎么判断样本能不能因子分析? 基本指标层面的因子分析检验

在对数据进行因子分析前首先要对其进行检验,来判断是否适合做因子分析,检验所采用的方法为巴特利特球度检验(BartlettTestofSphericity)和KMO(Kaiser-Meyer-Olkin)检验。

巴特利特球度检(BartlettTestofSphericity)是假设相关系数矩阵是一个单位阵,如果统计量值比较大,且其相对应的相伴概率值小于用户指定的显著性水平,拒绝原假设,认为适合作因子分析。反之,接受原假设,不适合作因子分析。

问题七:因子分析法和数据包络分析法 有何区别? 100分 因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家CE斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

数据包络分析方法(DataEnvelopmentAnalysis,DEA)是运筹学、管理科学与数理经济学交叉研究的一个新领域。它是根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型单位进行相对有效性评价的一种数量分析方法。DEA方法及其模型自1978年由美国著名运筹学家ACharnes和WWCooper提出以来,已广泛应用于不同行业及部门,并且在处理多指标投入和多指标产出方面,体现了其得天独厚的优势。

问题八:因子分析法的优缺点 ・ 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子 ,从子 所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认供系统的内核。 ・ 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。 ・ 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。 如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子 ;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。

问题九:因子分析法如何确定主成分及各个指标的权重? 5分 在SPSS中,主成分分析是通过设置因子分析中的抽取方法实现的,如果设置的抽取方法是主成分,那么计算的就是主成分得分,另外,因子分析和主成分分析尽管原理不同,但是两者综合得分的计算方法是一致的。

确定数据的权重也是进行数据分析的重要前提。可以利用SPSS的因子分析方法来确定权重。主要步骤是:

(1)首先将数据标准化,这是考虑到不同数据间的量纲不一致,因而必须要无量纲化。

(2)对标准化后的数据进行因子分析(主成分方法),使用方差最大化旋转。

(3)写出主因子得分和每个主因子的方程贡献率。

Fj =β1jX1 +β2jX2 +β3jX3 + ……+ βnjXn ; Fj 为主成分(j=1、2、……、m),X1、X2 、X3 、……、Xn 为各个指标,β1j、β2j、β3j、……、βnj为各指标在主成分Fj 中的系数得分,用ej表示Fj的方程贡献率。

(4)求出指标权重。 ωi=[(m∑j)βijej]/[(n∑i)(m∑j)βijej],ωi就是指标Xi的权重。

因子分析应用在评价指标权重确定中,通过主成分分析法得到的各指标的公因子方差,其值大小表示该项指标对总体变异的贡献,通过计算各个公因子方差占公因子方差总和的百分数。

问题十:什么是因子分析,该方法可以解决哪些问题 可以将变量或指标划分为若干维度,以便进一步做更高级的统计分析。南心网SPSS。

因子分析就是将大量的彼此可能存在相关关系的变量,转换成较少的彼此不相关的综合指标的多元统计方法。。 下面我们主要从下面四个方面来解说:

[if !supportLineBreakNewLine]

[endif]

实际应用

理论思想

建立模型

[if !supportLineBreakNewLine]

[endif]

分析结果

[if !supportLineBreakNewLine]

[endif]

一、实际应用

在市场调研中,研究人员关心的是一些研究指标的集成或者组合,这些概念通常是通过等级评分问题来测量的,如利用李克特量表取得的变量。每一个指标的集合(或一组相关联的指标)就是一个因子,指标概念等级得分就是因子得分。因子分析在市场调研中有着广泛的应用,主要包括:(1)消费者习惯和态度研究(U&A)(2) 品牌形象和特性研究(3)服务质量调查(4) 个性测试(5)形象调查(6) 市场划分识别(7)顾客、产品和行为分类在实际应用中,通过因子得分可以得出不同因子的重要性指标,而管理者则可根据这些指标的重要性来决定首先要解决的市场问题或产品问题。

[if !supportLineBreakNewLine]

[endif]

二、理论思想

因子分析(Factor Analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个独立的不可观测变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显式变量,而假想变量是不可观测的潜在变量,称为因子。主成分分析利用的是“降维”的思想,利用原始变量的线性组合组成主成分。在信息损失较小的前提下,把多个指标转化为几个互补相关的综合指标。因子分析是主成分分析的扩展和推广,通过对原始变量的相关系数矩阵内部结构的研究,导出能控制所有变量的少数几个不可观测的综合变量,通过这少数几个综合变量去描述原始的多个变量之间的相关关系。。

[if !supportLineBreakNewLine]

[endif]

因子分析的数学模型可以表示为Xp×1=Ap×m·Fm×1+ep×1,其中X为可实测的p维随机向量,它的每个分量代表一个指标或变量。

F=(F1, F2,,Fm)T为不可观测的m维随机向量,它的各个分量将出现在每个变量之中,所以称它们为公共因子。矩阵A称为因子载荷矩阵,矩阵中的每一个元素称为因子载荷,表示第i个变量在第j个公共因子上的载荷,它们需要由多次观测X所得到的样本来估计。

向量e称为特殊因子,其中包括随机误差,它们满足条件:

(1)Cov(F,e)=0,即F与e不相关。

(2)Cov(Fi,Fj)=0,i≠j ,Var(Fi)=Cov(Fi, Fj)=I ,即向量F的协方差矩阵为m阶单位阵。(

3)Cov(ei,ej)=0,i≠j ,Var(ei)=σi2,即向量e的协方差矩阵为p阶对角阵。因子分析的基本思想是通过变量的相关系数矩阵内部结构的分析,从中找出少数几个能控制原始变量的随机变量Fi(i=1,2,,m),选取公共因子的原则是使尽可能多地包含原始变量中的信息,建立模型X=A· F+e ,忽略e,以F代替X,用它再现原始变量X的众多分量之间的相关关系,达到简化变量降低维数的目的。

[if !supportLineBreakNewLine]

[endif]

三、建立模型

[if !supportLineBreakNewLine]

[endif]

因子分析的基本步骤如下。

对数据进行标准化处理,

估计因子载荷矩阵,

因子旋转,建立因子分析数学模型的目的不仅要找出公共因子并对变量进行分组,更重要的是要知道每个公共因子的意义,以便对实际问题作出科学分析。当因子载荷矩阵A的结构不便对主因子进行解释时,可用一个正交阵右乘A(即对A实施一个正交变换)。由线性代数知识,对A施行一个正交变换,对应坐标系就有一次旋转,便于对因子的意义进行解释。

估计因子得分以公共因子表示原因变量的线性组合,而得到因子得分函数。我们可以通过因子得分函数计算观测记录在各个公共因子上的得分,从而解决公共因子不可观测的问题。

[if !supportLineBreakNewLine]

[endif]

因子分析案例:

[if !supportLineBreakNewLine]

[endif]

题目:以下给出了中国历年国民经济主要指标统计(1992~2000)数据。试用因子分析对这些指标提取公因子并写出提取的公因子与这些指标之间的表达式。

一、数据输入

二、 *** 作步骤 1、进入SPSS,打开相关数据文件,选择“分析”|“降维”|“因子”命令。2、选择进行因子分析的变量。在对话框的左侧列表框中,依次选择“工业总产值”“国内生产总值”“货物周转量”“原煤”“发电量”“原油”进入“变量”列表框。

3、选择输出系数相关矩阵。

单击“因子分析”对话框中的“描述”按钮,d出“因子分析:描述”对话框。在“相关性矩阵”选项组中选中“KMO和巴特利特的球形度检验”复选框,单击“继续”按钮返回“因子分析”对话框。

4、设置对提取公因子的要求及相关输出内容。

单击“因子分析”对话框中的“提取”按钮,在“输出”选项组中选中“碎石图”复选框。

5、设置因子旋转方法。单击“因子分析”对话框中的“旋转”按钮,在“方法”选项组中选中“最大方差法”单选按钮。

6、设置有关因子得分的选项。单击“得分”按钮,选中“显示因子得分系数矩阵”复选框。

7、其余设置采用系统默认值即可。单击“确定”按钮,等待输出结果。

[if !supportLineBreakNewLine]

[endif]

四、结果分析

1、KMO检验和巴特利特检验结果KMO检验是为了看数据是否适合进行因子分析,其取值范围是0~1。其中09~1表示极好,08~09表示可奖励的,07~08表示还好,06~07表示中等,05~06表示糟糕,0~05表示不可接受。如下表所示,本例中KMO的取值为0657,表明可以进行因子分析。巴特利特检验是为了看数据是否来自于服从多元正态分布的总体。本例中显著性值为0000,说明数据来自正态分布总体,适合进一步分析。

2、变量共同度变量共同度表示的是各变量中所含原始信息能被提取的公因子所解释的程度。如下表所示,因为本例中所有变量共同度都在85%以上,所以提取的这几个公因子对各变量的解释能力很强。

3

4、碎石图有两个成分的特征值超过了1,只考虑这两个成分即可。

5、旋转成分矩阵第一个因子在工业总产值、国内生产总值、货物周转量、发电量及原油上有较大的载荷,所以其反映的是除原煤以外的其他变量的信息,第二个因子在原煤这一变量上有较大的载荷,反映的是原煤这一变量的信息。

6、成分得分系数矩阵给出了成分得分系数矩阵,据此可以直接写出各公因子的表达式。值得一提的是,在表达式中各个变量已经不是原始变量而是标准化变量。表达式如下:F1=0194工业总产值+0216国内生产总值+0206货物周转量+0003原煤+0211发电量+0212原油F2=0311工业总产值-0002国内生产总值-0154货物周转量+0853原煤-0124发电量+0036原油

分析结论:

[if !supportLineBreakNewLine]

[endif]

通过分析,我们可以知道:

由结果分析1、知,本例很适合使用因子分析。

由结果分析2、3、4可知,本例适合选前两个公因子进行分析,因为这已足够替代原来的变量,它们几乎涵盖了原变量的全部信息。

结果分析5给出了本例中的两个公因子及其所反映的变量。

结果分析6给出了公因子与标准化形式的变量之间的表达式。

[if !supportLineBreakNewLine]

[endif]

参考案例数据:

[if !supportLineBreakNewLine]

[endif]

[if !supportLists]1    [endif]spss统计分析与行业应用案例详解(第四版)  杨维忠,张甜,王国平  清华大学出版社

[if !supportLists]2 [endif](获取更多知识,前往gz号程式解说)

原文来自 https://mpweixinqqcom/s/5b-rkSherOn-tHyzBZPsTw

可以使用在线spssau完成因子分析,可结合帮助手册的案例懂的更快。

通常有三个步骤:第一步是判断是否适合进行因子分析;第二步是因子与题项对应关系判断;第三步是因子命名。

第一步:判断是否进行因子分析。

主要看KMO值大小,一般KMO值大于06说明适合进行因子分析。

第二步:提取因子,因子与题项对应关系判断。

看因子的提取情况,以及因子载荷系数,分析题项与因子的对应关系。

第三步:因子命名。

在第二步删除掉不合理题项后,并且确认因子与题项对应关系良好后,则可结合因子与题项对应关系,对因子进行命名。

具体步骤可阅读在线spssau帮助手册:因子分析-SPSSAU

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/11670052.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存