楼主,(我是2012年考研,现在复试ING)我还是直接给你去年考研大纲把大纲上有的章节一定要看,没有的内容坚决不看下面是去年的大纲(最好是打印出来,随时要的),对于楼主的大纲不清晰的内容,主语解决办法要就是买本数三考研书籍(李永乐的不错),对于一些大纲上模糊的章节内容,你就对照考研书籍上面的知识点,都是考试范围的内容来定位就行了
2012全国硕士研究生入学统一考试数学考试大纲
数学三
考试科目
微积分、线性代数、概率论与数理统计
试卷结构
一、总分
试卷满分为 150分,考试时间 180分钟
二、内容比例
微积分约 56 %
线性代数约 22 %
概率论与数理统计约 22 %
三、题型结构
单项选择题 8小题,每小题 4分,共 32分
填空题 6小题,每小题 4分,共 24分
解答题(包括证明题) 9小题,共 94分
微积分
一、函数、极限、连续
考试内容
函数的概念及表示法,函数的有界性、单调性、周期性和奇偶性,复合函
数、反函数、分段函数和隐函数,基本初等函数的性质及其图形,初等函数,函
数关系的建立
数列极限与函数极限的定义及其性质,函数的左极限和右极限,无穷小量和
无穷大量的概念及其关系,无穷小量的性质及及无穷小量的比较,极限的四则运
算,极限存在的两个准则:单调有界准则和夹逼准则,两个重要极限:
lim sin x
=
1,lim(1+
1)x
=
e
x→0 xx→∞
x
函数连续的概念,函数间断点的类型,初等函数的连续性,闭区间上连续函
数的性质。
考试要求
1.理解函数的概念,掌握函数的表示法,会建立应用问题的函数关系。
2.了解函数的有界性、单调性、周期性和奇偶性。
3.理解复合函数及分段函数的概念,了解反函数及隐函数的概念。
4.掌握基本初等函数的性质及其图形,了解初等函数的概念。
5.了解数列极限和函数极限(包括左极限和右极限)的概念。
6.了解极限的性质与极限存在的两个准则,掌握极限的四则运算法则,掌握利
用两个重要极限求极限的方法。
7.理解无穷小量的概念和基本性质,掌握无穷小量的比较方法,了解无穷大量
的概念及其无穷小量的关系。
8.理解函数连续性的概念(含左连续和右连续),会判断函数间断点的类型。
9.了解连续函数的性质和初等函数的连续性,理解闭区间上连续函数的性质(有
界性、最大值和最小值定理、介值定理),并会应用这些性质。
二、一元函数微分学
考试内容
导数和微分的概念,导数的几何意义和经济意义,函数的可导性与连续性之
间的关系,平面曲线的切线与法线,导数和微分的四则运算,基本初等函数的导
数,复合函数、反函数和隐函数的微分法,高阶导数,一阶微分形式的不变性,
微分中值定理,洛必达(L’Hospital)法则,函数单调性的判别,函数的极值,
函数图形的凹凸性、拐点及渐近线,函数图形的描绘,函数的最大值与最小值
考试要求
1.理解导数的概念及可导性与连续性之间的关系,了解导数的几何意义与经济
意义(含边际与d性的概念),会求平面曲线的切线方程和法线方程。
2.掌握基本初等函数的导数公式、导数的四则运算法则及复合函数的求导法则,
会求分段函数的导数,会求反函数与隐函数的导数。
3.了解高阶导数的概念,会求简单函数的高阶导数。
4.了解微分的概念、导数与微分之间的关系以及一阶微分形式的不变性,会求
函数的微分。
5.理解罗尔( Rolle)定理、拉格朗日( Lagrange)中值定理,了解泰勒( Taylor)
定理、柯西(Cauchy)中值定理,掌握这四个定理的简单应用。
6.会用洛必达法则求极限。
7.掌握函数单调性的判别方法,了解函数极值的概念,掌握函数极值、最大值
和最小值的求法及其应用。
8.会用导数判断函数图形的凹凸性(注:在区间(a,b)内,设函数 f(x)具有二
阶导数,当 f// (x) >
0时,f(x)的图形是凹的;当 f// (x) <
0时,
f(x)的图形是凸的),会求函数图形的拐点和渐近线。
三、一元函数积分学
考试内容
原函数和不定积分的概念,不定积分的基本性质,基本积分公式,定积分的
概念和基本性质,定积分中值定理,积分上限的函数及其导数,牛顿—莱布尼茨
(Newton-Leibniz)公式,不定积分和定积分的换元积分法与分部积分法,反常
(广义)积分,定积分的应用
考试要求
1.理解原函数与不定积分的概念,掌握不定积分的基本性质和基本积分公式,
掌握不定积分的换元积分法与分部积分法。
2.了解定积分的概念和基本性质,了解定积分中值定理,理解积分上限的函数
并会求它的导数,掌握牛顿—莱布尼茨公式以及定积分的换元积分法和分部
积分法。
3.会利用定积分计算平面图形的面积、旋转体的体积和函数的平均值,会利用
定积分求解简单的经济应用问题。
4.了解反常积分的概念,会计算反常积分。
四、多元函数微积分学
考试内容
多元函数的概念,二元函数的几何意义,二元函数的极限与连续的概念,有
界闭区域上二元连续函数的性质,多元函数偏导数的概念与计算,多元复合函数
的求导法与隐函数求导法,二阶偏导数,全微分,多元函数的极值和条件极值、
最大值和最小值,二重积分的概念、基本性质和计算,无界区域上简单的反常二
重积分
考试要求
1.了解多元函数的概念,了解二元函数的几何意义。
2.了解二元函数的极限与连续的概念,了解有界闭区域上二元连续函数的性质。
3.了解多元函数偏导数与全微分的概念,会求多元复合函数一阶、二阶偏导数,
会求全微分,会求多元隐函数的偏导数。
4.了解多元函数极值和条件极值的概念,掌握多元函数极值存在的必要条件,
了解二元函数极值存在的充分条件,会求二元函数的极值,会用拉格朗日乘
数法求条件极值,会求简单多元函数的最大值和最小值,并会解决简单的应
用问题。
5.了解二重积分的概念与基本性质,掌握二重积分的计算方法(直角坐标、极
坐标),了解无界区域上较简单的反常二重积分并会计算。
五、 无穷级数
考试内容
常数项级数的收敛与发散的概念,收敛级数的和的概念,级数的基本性质与
收敛的必要条件,几何级数与 P级数及其收敛性,正项级数收敛性的判别法,任
意项级数的绝对收敛与条件收敛,交错级数与莱布尼茨定理,幂级数及其收敛半
径、收敛区间(指开区间)和收敛域,幂级数的和函数,幂级数在其收敛区间内
的基本性质,简单幂级数和函数的求法,初等函数的幂级数展开式
考试要求
1.了解级数的收敛与发散、收敛级数的和的概念。
2.了解级数的基本性质及级数收敛的必要条件,掌握几何级数及 P级数的收敛
与发散的条件,掌握正项级数收敛性的比较判别法和比值判别法。
3.了解任意项级数绝对收敛与条件收敛的概念以及绝对收敛与收敛的关系,了
解交错级数的莱布尼茨判别法。
4.会求幂级数的收敛半径、收敛区间及收敛域。
5.了解幂级数在其收敛区间内的基本性质(和函数的连续性、逐项求导和逐项
积分),会求简单幂级数在其收敛区间内的和函数,并会由此求出某些数项级
数的和。
6.了解ex
,sin x,cos x,ln(1+
x)与(1+
x)α
的麦克劳林
(Maclaurin)展开式。
六、常微分方程与差分方程
考试内容
常微分方程的基本概念,变量可分离的微分方程,齐次微分方程,一阶线性
微分方程,线性微分方程解的性质及解的结构定理,二阶常系数齐次线性微分方
程及简单的非齐次线性微分方程,差分与差分方程的概念,差分方程的通解与特
解,一阶常系数线性差分方程,微分方程的简单应用
考试要求
1.了解微分方程及其阶、解、通解、初始条件和特解等概念。
2.掌握变量可分离的微分方程、齐次微分方程和一阶线性微分方程的求解方法。
3.会解二阶常系数齐次线性微分方程。
4.了解线性微分方程解的性质及解的结构定理,会解自由项为多项式、指数函
数、正弦函数、余弦函数的二阶常系数非齐次线性微分方程。
5.了解差分与差分方程及其通解与特解等概念。
6.了解一阶常系数线性差分方程的求解方法。
7.会用微分方程求解简单的经济应用问题。
线性代数
一、行列式
考试内容
行列式的概念和基本性质,行列式按行(列)展开定理
考试要求
1.了解行列式的概念,掌握行列式的性质。
2.会应用行列式的性质和行列式按行(列)展开定理计算行列式。
二、矩阵
考试内容
矩阵的概念,矩阵的线性运算,矩阵的乘法,方阵的幂,方阵乘积的行列式,
矩阵的转置,逆矩阵的概念和性质,矩阵可逆的充分必要条件,伴随矩阵,矩阵
的初等变换,初等矩阵,矩阵的秩,矩阵的等价,分块矩阵及其运算
考试要求
1.理解矩阵的概念,了解单位矩阵、数量矩阵、对角矩阵、三角矩阵的定义及
性质,了解对称矩阵、反对称矩阵及正交矩阵等的定义和性质。
2.掌握矩阵的线性运算、乘法、转置以及它们的运算规律,了解方阵的幂与方
阵乘积的行列式的性质。
3.理解逆矩阵的概念,掌握逆矩阵的性质以及矩阵可逆的充分必要条件,理解
伴随矩阵的概念,会用伴随矩阵求逆矩阵。
4.了解矩阵的初等变换和初等矩阵及矩阵等价的概念,理解矩阵的秩的概念,
掌握用初等变换求矩阵的逆矩阵和秩的方法。
5.了解分块矩阵的概念,掌握分块矩阵的运算法则。
三、向量
考试内容
向量的概念,向量的线性组合与线性表示,向量组的线性相关与线性无关,
向量组的极大线性无关组,等价向量组,向量组的秩,向量组的秩与矩阵的秩之
间的关系,向量的内积,线性无关向量组的正交规范化方法
考试要求
1.了解向量的概念,掌握向量的加法和数乘运算法则。
2.理解向量的线性组合与线性表示、向量组线性相关、线性无关等概念,掌握
向量组线性相关、线性无关的有关性质及判别法。
3.理解向量组的极大线性无关组的概念,会求向量组的极大线性无关组及秩。
4.理解向量组等价的概念,理解矩阵的秩与其行(列)向量组的秩之间的关系。
5.了解内积的概念,掌握线性无关向量组正交规范化的施密特( Schmidt)方法。
四、线性方程组
考试内容
线性方程组的克莱姆( Crammer)法则,线性方程组有解和无解的判定,齐
次线性方程组的基础解系和通解,非齐次线性方程组的解与相应的齐次线性方程
组(导出组)的解之间的关系,非齐次线性方程组的通解
考试要求
1.会用克莱姆法则解线性方程组。
2.掌握非齐次线性方程组有解和无解的判定方法。
3.理解齐次线性方程组的基础解系的概念,掌握齐次线性方程组的基础解系和
通解的求法。
4.理解非齐次线性方程组解的结构及通解的概念。
5.掌握用初等行变换求解线性方程组的方法。
五、矩阵的特征值和特征向量
考试内容
矩阵的特征值和特征向量的概念、性质,相似矩阵的概念及性质,矩阵可相
似对角化的充分必要条件及相似对角矩阵,实对称矩阵的特征值和特征向量及相
似对角矩阵
考试要求
1.理解矩阵的特征值、特征向量的概念,掌握矩阵特征值的性质,掌握求矩阵
特征值和特征向量的方法。
2.理解矩阵相似的概念,掌握相似矩阵的性质,了解矩阵可相似对角化的充分
必要条件,掌握将矩阵化为相似对角矩阵的方法。
3.掌握实对称矩阵的特征值和特征向量的性质。
六、二次型
考试内容
二次型及其矩阵表示,合同变换与合同矩阵,二次型的秩,惯性定理,二
次型的标准形和规范形,用正交变换和配方法化二次型为标准形,二次型及其矩
阵的正定性
考试要求
1.了解二次型的概念,会用矩阵形式表示二次型,了解合同变换和合同矩阵的
概念。
2.了解二次型的秩的概念,了解二次型的标准形、规范形等概念,了解惯性定
理,会用正交变换和配方法化二次型为标准形。
3.理解正定二次型、正定矩阵的概念,并掌握其判别法。
概率论与数理统计
一、随机事件和概率
考试内容
随机事件与样本空间,事件的关系与运算,完备事件组,概率的概念,概率
的基本性质,古典型概率,几何型概率,条件概率,概率的基本公式,事件的独
立性,独立重复试验
考试要求
1.了解样本空间(基本事件空间)的概念,理解随机事件的概念,掌握事件的
关系及运算。
2.理解概率、条件概率的概念,掌握概率的基本性质,会计算古典型概率和几
何型概率,掌握概率的加法公式、减法公式、乘法公式、全概率公式以及贝
叶斯(Bayes)公式等。
3.理解事件的独立性的概念,掌握用事件独立性进行概率计算;理解独立重复
试验的概念,掌握计算有关事件概率的方法。
二、随机变量及其分布
考试内容
随机变量,随机变量分布函数的概念及其性质,离散型随机变量的概率分布,
连续型随机变量的概率密度,常见随机变量的分布,随机变量函数的分布
考试要求
1.理解随机变量的概念,理解分布函数
F(x) =
P{X
≤
x}(∞
<
x
<
+∞
)
的概念及性质,会计算与随机变量相联系的事件的概率。
2.理解离散型随机变量及其概率分布的概念,掌握 0—1分布、二项分布 B(n,p)、
几何分布、超几何分布、泊松(Poisson)分布 及其应用。
P(λ)
3.掌握泊松定理的结论和应用条件,会用泊松分布近似表示二项分布。
4.理解连续型随机变量及其概率密度的概念,掌握均匀分布 U(a,b)、正态分
布 N(μ,σ
2)、指数分布及其应用,其中参数为 λ(λ>
0)的指
数分布 的概率密度为
E(λ)
f
(x) =
0λ
,
eλx, 若
若
xx
>
≤
00
5.会求随机变量函数的分布。
三、多维随机变量的分布
考试内容
多维随机变量及其分布函数,二维离散型随机变量的概率分布、边缘分布和
条件分布,二维连续型随机变量的概率密度、边缘概率密度和条件密度,随机变
量的独立性和不相关性,常见二维随机变量的分布,两个及两个以上随机变量的
函数的分布
考试要求
1.理解多维随机变量的分布函数的概念和基本性质。
2.理解二维离散型随机变量的概率分布和二维连续型随机变量的概率密度,掌
握二维随机变量的边缘分布和条件分布。
3.理解随机变量的独立性和不相关性的概念,掌握随机变量相互独立的条件,
理解随机变量的不相关性与独立性的关系。
4.掌握二维均匀分布和二维正态分布 N(μ1, μ2;σ12,σ
22; ρ),理
解其中参数的意义。
5.会根据两个随机变量的联合分布求其函数的分布,会根据多个相互独立随机
变量的联合分布求其函数的分布。
四、随机变量的数字特征
考试内容
随机变量的数学期望(均值)、方差、标准差及其性质,随机变量函数的数
学期望,切比雪夫(Chebyshew)不等式,矩、协方差、相关系数及其性质
考试要求
1.理解随机变量数字特征(数学期望、方差、标准差、矩、协方差、相关系数)
的概念,会运用数字特征的基本性质,并掌握常用分布的数字特征。
2.会求随机变量函数的数学期望。
3.了解切比雪夫不等式。
五、大数定律和中心极限定理
考试内容
切比雪夫大数定律,伯努利( Bernoulli)大数定律,辛钦( Khinchine)大数
定律,棣莫弗—拉普拉斯(De Moivre-Laplace)定理,列维—林德伯格
(Levy-Lindberg)定理
考试要求
1.了解切比雪夫大数定律、伯努利大数定律和辛钦大数定律(独立同分布随机
变量序列的大数定律)。
2.了解棣莫弗—拉普拉斯中心极限定理(二项分布以正态分布为极限分布)、列
维—林德伯格中心极限定理(独立同分布随机变量序列的中心极限定理),并
会用相关定理近似计算有关随机事件的概率。
六、数理统计的基本概念
考试内容
总体,个体,简单随机样本,统计量,经验分布函数,样本均值,样本方差
χ
2
和样本矩, 分布,t分布,F分布,分位数,正态总体的常用抽样分布
考试要求
1.了解总体、简单随机样本、统计量、样本均值、样本方差及样本矩的概念,
其中样本方差定义为
1 n
S
2 =Σ(Xi
X
)2
n
1i=1
χ
2χ
2
2.了解产生 变量、t变量和 F变量的典型模式;了解标准正态分布、
分布,t分布和 F分布的上侧α分位数,会查相应的数值表。
3.掌握正态总体的样本均值、样本方差、样本矩的抽样分布。
4.了解经验分布函数的概念和性质。
七、参数估计
考试内容
点估计的概念,估计量和估计值,矩估计法,最大似然估计法
考试要求
1.了解参数的点估计、估计量与估计值的概念。
2.掌握矩估计法(一阶矩、二阶矩)和最大似然估计法。
按照模糊综合分析法,我们对某企业效绩进行评价。
1设因素集U:U={u1,u2,……u9}
综合我国现行评价体系和平衡记分法(SEC),我们选取了u1(净资产收益状况)、u2(资产营运状况)、u3(长期偿债能力)、u4(短期偿债能力)。U5(销售增长状况),u6(市场占有能力)、u7(技术能力)、u8(发展创新能力)、u9(学习能力)等9个指标为反映企业效绩的主要指标。其中,u1、u2、u3、u4、u5是财务业绩方面的指标,原来都用精确的比率指标反映,但对它们适当地模糊化更能客观真实地反映企业效绩。例如,在评价企业短期偿债能力时,该企业流动比率为18,但专家们发现该企业存货数额庞大,占了流动资产的较大部分,说明其资产的流动性并不好,因而仍可评定该指标为较低等级。U6是客户方面业绩指标,u7内部经营过程方面业绩指标,u8、u9是学习与增长方面业绩指标。
2设评价集V={v1,v2……v4}
简便起见,我们设v1:优秀,v2:良好,v3:平均,v4:较差。
3我们选取了该企业的注册会计师、熟悉该企业情况的专家组成评判组,得到评价矩阵
4根据专家意见,我们确定权重集A为:
5按照M(,,+)模型
所以,根据最大隶属度原则,该企业效绩评定为“良好”。事后,该企业领导认为这个评价结果比较符合实际情况。
按照模糊综合分析法,我们对某企业效绩进行评价。
1设因素集U:U={u1,u2,……u9}
综合我国现行评价体系和平衡记分法(SEC),我们选取了u1(净资产收益状况)、u2(资产营运状况)、u3(长期偿债能力)、u4(短期偿债能力)。U5(销售增长状况),u6(市场占有能力)、u7(技术能力)、u8(发展创新能力)、u9(学习能力)等9个指标为反映企业效绩的主要指标。其中,u1、u2、u3、u4、u5是财务业绩方面的指标,原来都用精确的比率指标反映,但对它们适当地模糊化更能客观真实地反映企业效绩。例如,在评价企业短期偿债能力时,该企业流动比率为18,但专家们发现该企业存货数额庞大,占了流动资产的较大部分,说明其资产的流动性并不好,因而仍可评定该指标为较低等级。U6是客户方面业绩指标,u7内部经营过程方面业绩指标,u8、u9是学习与增长方面业绩指标。
2设评价集V={v1,v2……v4}
简便起见,我们设v1:优秀,v2:良好,v3:平均,v4:较差。
3我们选取了该企业的注册会计师、熟悉该企业情况的专家组成评判组,得到评价矩阵
4根据专家意见,我们确定权重集A为:
5按照M(,,+)模型
所以,根据最大隶属度原则,该企业效绩评定为“良好”。事后,该企业领导认为这个评价结果比较符合实际情况。
参考资料:
回答者:屁屁有葱 - 举人 五级 11-8 11:52
运用模糊集对分析法,建立了大气环境监测布点优化的数学模型,对成都大气环境监测点的优化实例证明:该方法优化结果切实可靠,最终保留的信息量大,而且计算方法灵活,简便易行
回答者:jinlintx - 试用期 一级 11-8 11:56
粗糙集理论及其应用
摘 要 在很多实际系统中均不同程度地存在着不确定性因素, 采集到的数据常常包含着噪声,不精确甚至不完整 粗糙集理论是继概率论,模糊集,证据理论之后的又一个处理不确定性的数学工具 作为一种较新的软计算方法, 粗糙集近年来越来越受到重视, 其有效性已在许多科学与工程领域的成功应用中得到证实, 是当前国际上人工智能理论及其应用领域中的研究热点之一
本文介绍了粗糙集理论的基本概念,特点及有关应用
关键词 粗糙集, 不确定性, 数据分析, 软计算
1 引言
在自然科学,社会科学和工程技术的很多领域中, 都不同程度地涉及到对不确定因素和对不完备( imperfect) 信息的处理 从实际系统中采集到的数据常常包含着噪声, 不够精确甚至不完整 采用纯数学上的假设来消除或回避这种不确定性, 效果往往不理想, 反之, 如果正视它,对这些信息进行合适地处理, 常常有助于相关实际系统问题的解决 多年来, 研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径 模糊集和基于概率方法的证据理论是处理不确定信息的两种方法, 已应用于一些实际领域 但这些方法有时需要一些数据的附加信息或先验知识, 如模糊隶属函数,基本概率指派函数和有关统计概率分布等, 而这些信息有时并不容易得到 1982 年, 波兰学者Z Paw lak 提
出了粗糙集理论, 它是一种刻划不完整性和不确定性的数学工具, 能有效地分析不精确,不一致( incon sisten t),不完整( incomp lete) 等各种不完备的信息, 还可以对数据进行分析和推理, 从中发现隐含的知识, 揭示潜在的规律 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性本文简要介绍了粗糙集理论的基本概念和实际应用
2 粗糙集的理论
2 1 粗糙集理论的产生和发展
在本世纪70 年代, 波兰学者Z Paw lak 和一些波兰科学院,波兰华沙大学的逻辑学家们,一起从事关于信息系统逻辑特性的研究 粗糙集理论就是在这些研究的基础上产生的 1982年, Z Paw lak 发表了经典论文Rough Set s , 宣告了粗糙集理论的诞生 此后, 粗糙集理论引起了许多数学家,逻辑学家和计算机研究人员的兴趣, 他们在粗糙集的理论和应用方面作了大量的研究工作1991 年Z Paw lak 的专著和1992 年应用专集的出版, 对这一段时期理论和实践工作的成果作了较好的总结, 同时促进了粗糙集在各个领域的应用 此后召开的与粗糙集有关的国际会议进一步推动了粗糙集的发展 越来越多的科技人员开始了解并准备从事该领域的研究 目前, 粗糙集已成为人工智能领域中一个较新的学术热点, 在机器学习,知识获取,决策分析,过程控制等许多领域得到了广泛的应用
2 2 粗糙集理论所处理的问题
粗糙集能有效地处理下列问题:
·不确定或不精确知识的表达;
·经验学习并从经验中获取知识;
·不一致信息的分析;
·根据不确定,不完整的知识进行推理;
·在保留信息的前提下进行数据化简;
·近似模式分类;
·识别并评估数据之间的依赖关系
2 3 粗糙集理论的一些基本概念
2 3 1 知识的含义
"知识"这个概念在不同的范畴内有多种不同的含义 在粗糙集理论中,"知识"被认为是一种分类能力 人们的行为是基于分辨现实的或抽象的对象的能力, 如在远古时代, 人们为了生存必须能分辨出什么可以食用, 什么不可以食用; 医生给病人诊断, 必须辨别出患者得的是哪一种病 这些根据事物的特征差别将其分门别类的能力均可以看作是某种"知识"
2 3 2 不可分辨关系与基本集
分类过程中, 相差不大的个体被归于同一类, 它们的关系就是不可分辨关系( indiscernability relation) 假定只用两种黑白颜色把空间中的物体分割两类, {黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的, 因为描述它们特征属性的信息相同, 都是黑色 如果再引入方,圆的属性, 又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体} 这时, 如果两个同为黑色方物体, 则它们还是不可分辨的 不可分辨关系也称为一个等效关系(equivalence relationship ) , 两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系
基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合, 是组成论域知识的颗粒 不可分辨关系这一概念在粗糙集理论中十分重要, 它深刻地揭示出知识的颗粒状结构 , 是定义其它概念的基础 知识可认为是一族 等效关系, 它将论域分割成一系列的等效类
2 3 3 集合的下逼近,上逼近及边界区
粗糙集理论延拓了经典的集合论, 把用于分类的知识嵌入集合内, 作为集合组成的一部分 一个对象a 是否属于集合X 需根据现有的知识来判断, 可分为三种情况: (1) 对象a 肯定属于集合X ; (2) 对象a 肯定不属于集X ; (3) 对象a 可能属于也可能不属于集合X 集合的划分密切依赖于我们所掌握的关于论域的知识, 是相对的而不是绝对的给定一个有限的非空集合U 称为论域, I 为U 中的一族等效关系, 即关于U 的知识, 则二元对 K = (U , I ) 称为一个近似空间(approximation space) 设x 为U 中的一个对象, X为U 的一个子集, I (x ) 表示所有与x 不可分辨的对象所组成的集合, 换句话说, 是由x 决定的
等效类, 即I (x ) 中的每个对象都与x 有相同的特征属性(attribute)
集合X 关于I 的下逼近(Lower approximation) 定义为:
I (X ) = {x ∈U : I (x ) I (X ) 实际上由那些根据现有知识判断肯定属于X 的对象所组成的最大的集合, 有时也称
为X 的正区(po sit ive region) , 记作PO S (X ) 类似地, 由根据现有知识判断肯定不属于X 的
对象组成的集合称为X 的负区(negat ive region) , 记作N EG (X )
集合X 关于I 的上逼近(U pper app rox im at ion) 定义为
I3 (X ) = {x ∈U : I (x ) ∩ X ≠ 5 } (2)
I3 (X ) 是由所有与X 相交非空的等效类I (x ) 的并集, 是那些可能属于X 的对象组成的最小
集合 显然, I3 (X ) + N EG (X ) = 论域U
集合X 的边界区(Boundary region) 定义为
BND (X ) = I
3 (X ) - I 3 (X ) (3)
BND (X ) 为集合X 的上逼近与下逼近之差 如果BND (X ) 是空集, 则称X 关于I 是清晰的
(crisp ) ; 反之如果BND (X ) 不是空集, 则称集合X 为关于I 的粗糙集( rough set)
下逼近,上逼近及边界区等概念称为可分辨区(discern ib ility region s) , 刻划了一个边界含
糊(vague) 集合的逼近特性 粗糙程度可按按下式的计算
A1
=
I 3 (X )
I
3 (X ) , (4)
式中 # 表示集合# 的基数或势(cardinality) , 对有限集合表示集合中所包含的元素的个数
显然0≤A
1 (X ) ≤1, 如果A
1 (X ) = 1, 则称集合X 相对于I 是清晰(crisp ) 的, 如果A
1 (X ) 0} (7)
BND (X ) = {x ∈U : 0 < LIX
(x ) < 1} (8)
从上面的定义中, 可以看出粗糙集理论中"含糊"(vague) 和"不确定"(uncertain ty) 这两个
概念之间的关系:"含糊"用来描述集合, 指集合的边界不清楚; 而"不确定"描述的是集合中的
元素, 指某个元素是否属于某集合是不确定的
2 4 实例
下面用一个具体的实例说明粗糙集的概念 在粗糙集中使用信息表( info rm at ion tab le) 描
述论域中的数据集合 根据学科领域的不同, 它们可能代表医疗,金融,军事,过程控制等方面
的数据 信息表的形式和大家所熟悉的关系数据库中的关系数据模型很相似, 是一张二维表
1 期韩祯祥等: 粗糙集理论及其应用39
1995-2005 Tsinghua Tongfang Optical Disc Co, Ltd All rights reserved
格, 如表一所示 表格的数据描述了一些人的教育程度以及是否找到了较好工作, 旨在说明两
者之间的关系 其中王治,马丽, 赵凯等称为对象(ob ject s) , 一行描述一个对象 表中的列描
述对象的属性 粗糙集理论中有两种属性: 条件属性(condit ion at t ribu te) 和决策属性(decision
at t ribu te) 本例中"教育程度"为条件属性;"是否找到了好工作"为决策属性
表1 教育程度与是否找到好工作的关系
姓名教育程度是否找到了好工作
王治高中否
马丽高中是
李得小学否
刘保大学是
赵凯博士是
设O 表示找到了好工作的人的集合, 则
O = {马丽, 刘保, 赵凯}, 设I 表示属性"教育
程度"所构成的一个等效关系, 根据教育程度
的不同, 该论域被分割为四个等效类: {王治,
马丽},{李得},{刘保},{赵凯} 王治和马丽在
同一个等效类中, 他们都为高中文化程度, 是
不可分辨的 则:
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵凯}
集合O 的负区为 N EG (O ) = {李得}
集合O 的边界区为 BND (O ) = {王治, 马丽}
集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马
丽}
根据表1, 可以归纳出下面几条规则, 揭示了教育程度与是否能找到好工作之间的关系
RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作)
RUL E 2: IF (教育程度= 小学) THEN (找不到好工作)
RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)
从这个简单的例子中, 我们还可以体会到粗糙集理论在数据分析,寻找规律方面的作用
3 粗糙集理论的特点
3 1 粗糙集是一种软计算方法
软计算(sof t compu t ing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的 软计算中的主要工具
包括粗糙集,模糊逻辑(FL ),神经网络(NN ),_________概率推理(PR ),信度网络(Belief N etwo rk s),遗
传算法(GA ) 与其它进化优化算法,混沌(Chao s) 理论等
传统的计算方法即所谓的硬计算(hard compu t ing) , 使用精确,固定和不变的算法来表达
和解决问题 而软计算的指导原则是利用所允许的不精确性,不确定性和部分真实性以得到易
于处理,鲁棒性强和成本较低的解决方案, 以便更好地与现实系统相协调
3 2 粗糙集理论的特点
粗糙集方法的简单实用性是令人惊奇的, 它能在创立后的不长时间内得到迅速应用是因
为具有以下特点[ 6~ 8 ]:
(1) 它能处理各种数据, 包括不完整( incomp lete) 的数据以及拥有众多变量的数据;
(3) 它能处理数据的不精确性和模棱两可(am b igu ity) , 包括确定性和非确定性的情况;
(4) 它能求得知识的最小表达( reduct) 和知识的各种不同颗粒(granu larity) 层次;
(5) 它能从数据中揭示出概念简单, 易于 *** 作的模式(pat tern) ;
(6) 它能产生精确而又易于检查和证实的规则, 特别适于智能控制中规则的自动生成
40 信 息 与 控 制27 卷
1995-2005 Tsinghua Tongfang Optical Disc Co, Ltd All rights reserved
4 粗糙集理论的应用
粗糙集理论是一门实用性很强的学科, 从诞生到现在虽然只有十几年的时间, 但已经在不
少领域取得了丰硕的成果, 如近似推理,数字逻辑分析和化简,建立预测模型,决策支持,控制
算法获取,机器学习算法和模式识别等等 下面介绍一下粗糙集应用的几个主要领域
4 1 人工神经网络训练样本集化简
人工神经网络具有并行处理,高度容错和泛化能力强的特点, 适合应用在预测,复杂对象
建模和控制等场合 但是当神经网络规模较大,样本较多时, 训练时间过于漫长, 这个固有缺点
是制约神经网络进一步实用化的一个主要因素 虽然各种提高训练速度的算法不断出现, 问题
远未彻底解决 化简训练样本集, 消除冗余数据是另一条提高训练速度的途径
文[ 10 ]正是沿着这条思路, 应用粗糙集化简神经网络训练样本数据集, 在保留重要信息的
前提下消除了多余(superf luou s) 的数据 仿真实验表明训练速度提高了4 77 倍, 获得了较好
的效果
4 2 控制算法获取
实际系统中有很多复杂对象难于建立严格的数学模型, 这样传统的基于数学模型的控制
方法就难以奏效 模糊控制模拟人的模糊推理和决策过程, 将 *** 作人员的控制经验总结为一系
列语言控制规则, 具有鲁棒性和简单性的特点, 在工业控制等领域发展较快 但是有些复杂对
象的控制规则难以人工提取, 这样就在一定程度上限制了模糊控制的应用
粗糙集能够自动抽取控制规则的特点为解决这一难题提供了新的手段 一种新的控制策
略—模糊- 粗糙控制(fuzzy2rough con t ro l) 正悄然兴起, 成为一个有吸引力的发展方向 应用
这种控制方法, 文[11 ]研究了"小车—倒立摆系统"这一经典控制问题, 文[12 ]研究了过程控制
(水泥窑炉) , 均取得了较好的控制效果 应用粗糙集进行控制的基本思路是: 把控制过程的一
些有代表性的状态以及 *** 作人员在这些状态下所采取的控制策略都记录下来, 然后利用粗糙
集理论处理这些数据, 分析 *** 作人员在何种条件下采取何种控制策略, 总结出一系列控制规
则:
规则1 IF Condit ion 1 满足 THEN 采取decision 1
规则2 IF Condit ion 2 满足 THEN 采取decision 2
规则3 IF Condit ion 3 满足 THEN 采取decision 3
这种根据观测数据获得控制策略的方法通常被称为从范例中学习( learn ing f rom exam2
p les) 粗糙控制( rough con t ro l) 与模糊控制都是基于知识,基于规则的控制, 但粗糙控制更加
简单迅速,实现容易(因为粗糙控制有时可省却模糊化及去模糊化步骤) ; 另一个优点在于控制
算法可以完全来自数据本身, 所以从软件工程的角度看, 其决策和推理过程与模糊(或神经网
络) 控制相比可以很容易被检验和证实(validate) 文[ 11 ]还指出在特别要求控制器结构与算
法简单的场合, 更适合采取粗糙控制
美国电力科学研究院(EPR I) 对粗糙集的应用研究的潜力对十分重视, 将其作为战略性
研究开发(St rategy R&D) 项目, 在1996 年拨款 196, 600 资助San Jo se 州立大学进行电力系
统模糊- 粗糙控制器的研究
1 期韩祯祥等: 粗糙集理论及其应用41
1995-2005 Tsinghua Tongfang Optical Disc Co, Ltd All rights reserved
4 3 决策支持系统
面对大量的信息以及各种不确定因素, 要作出科学,合理的决策是非常困难的 决策支持
系统是一组协助制定决策的工具, 其重要特征就是能够执行IF THEN 规则进行判断分
析 粗糙集理论可以在分析以往大量经验数据的基础上找到这些规则, 基于粗糙集的决策支持
系统在这方面弥补了常规决策方法的不足, 允许决策对象中存在一些不太明确,不太完整的属
性, 并经过推理得出基本上肯定的结论
下面举一个例子, 说明粗糙集理论可以根据以往的病例归纳出诊断规则, 帮助医生作出判
断 表二描述了八个病人的症状 从表二中可以归纳出以下几条确定的规则:
表2 症状与感冒的关系
病人编号
病理症状诊断结果
是否头痛体温是否感冒
病人1 是正常否
病人2 是高是
病人3 是很高是
病人4 否正常否
病人5 否高否
病人6 否很高是
病人7 否高是
病人8 否很高否
1 IF (体温正常) THEN (没感冒)
2 IF (头痛) AND (体温高) THEN
(感冒)
3 IF (头痛) AND (体温很高) THEN
(感冒)
还有几条可能的规则:
4 IF (头不痛) THEN (可能没感冒)
5 IF (体温高) THEN (可能感冒了)
6 IF (体温很高) THEN (可能感冒了)
病人5 和病人7, 病人6 和病人8, 症状
相同, 但是一个感冒另一个却没感冒, 这种情
况称为不一致( incon sisten t) 粗糙集就是靠这种IF THEN 规则的形式表示数据中蕴含的
知识
希腊工业发展银行ETEVA 用粗糙集理论协助制订信贷政策, 从大量实例中抽取出的规
则条理清晰, 得到了金融专家的好评[ 13 ]
4 4 从数据库中知识发现
现代社会中, 随着信息产业的迅速发展, 大量来自金融,医疗,科研等不同领域的信息被存
储在数据库中 这些浩如烟海的数据间隐含着许多有价值的但鲜为人知的相关性, 例如股票的
价格和一些经济指数有什么关系; 手术前病人的病理指标可能与手术是否成功存在某种联系;
满足何种条件的夜空会出现彗星等天文现象等等
由于数据库的庞大, 人工处理这些数据几乎是不可能的, 于是出现了一个新的研究方向—
数据库中的知识发现(Know ledge D iscovery in Databases, KDD) , 也叫做数据库(信息) 发掘
(M in ing) , 它是目前国际上人工智能领域中研究较为活跃的分支 粗糙集是其中的一种重要
的研究方法, 它采用的信息表与关系数据库中的关系数据模型很相似, 这样就便于将基于粗糙
集的算法嵌入数据库管理系统中
粗糙集引入核(co re),化简( reduct) 等有力的概念与方法, 从数据中导出用IF THEN
规则形式描述的知识, 这些精练的知识更便于存储和使用 美国医学工作者应用粗糙集理论对
大量的病历进行分析, 发现黑人妇女患乳腺癌后的死亡率比白人妇女高 到目前为止, 早产的
预测在医学上还是比较困难的 现有的人工预测方法准确率只有17à - 58à , 而应用粗糙集
理论则可将准确率提高到68à - 90à [ 8 ]
42 信 息 与 控 制27 卷
1995-2005 Tsinghua Tongfang Optical Disc Co, Ltd All rights reserved
5 粗糙集与模糊集,证据理论及其它一些情况
5 1 粗糙集与模糊集,证据理论
粗糙集与模糊集都能处理不完备( imperfect) 数据, 但方法不同, 模糊集注重描述信息的含
糊(vagueness) 程度, 粗糙集则强调数据的不可辩别( indiscern ib ility) , 不精确( imp recision) 和
模棱两可(am b igu ity) 使用图像处理中的语言来作比喻, 当论述图像的清晰程度时, 粗糙集强
调组成图像象素的大小, 而模糊集则强调象素存在不同的灰度 粗糙集研究的是不同类中的对
象组成的集合之间的关系, 重在分类; 模糊集研究的是属于同一类的不同对象的隶属的关系,
重在隶属的程度 因此粗糙集和模糊集是两种不同的理论, 但又不是相互对立的, 它们在处理
不完善数据方面可以互为补充
粗糙集理论与证据理论虽有一些相互交叠的地方, 但本质不同, 粗糙集使用集合的上,下
逼近而证据理论使用信任函数(belief funct ion) 作为主要工具 粗糙集对给定数据的计算是客
观的, 无须知道关于数据的任何先验知识(如概率分布等) , 而证据理论则需要假定的似然值
(p lau sib ility)
5 2 近年来召开的与粗糙集有关的国际会议
相继召开的以粗糙集理论为主题的国际会议, 促进了粗糙集理论的推广 这些会议发表了
大量的具有一定学术和应用价值的论文, 方便了学术交流, 推动了粗糙集在各个科学领域的拓
展和应用 下面列出了近年召开的一些会议:
· 1992 年第一届国际研讨会(Rough Set s: State of the A rt and Perspect ives) 在波兰
K iek rz 召开;
·1993 年第二届国际研讨会(The Second In ternat ionalWo rk shop on Rough Set s and
Know ledge D iscovery, RSKD'93) 在加拿大Banff 召开;
·1994 年第三届国际研讨会(The Th ird In ternat ionalWo rk shop on Rough Set s and Sof t
Compu t ing, RSSC'94) 在美国San Jo se 召开;
·1995 年在美国No rth Caro lina 召开了题为"Rough Set Theo ry, RST'95"的国际会议;
·1996 年第四届国际研讨会(The Fou rth In ternat ionalWo rk shop on Rough Set s, Fuzzy
Set s, andM ach ine D iscovery, RSFD'96) 在日本东京召开;
·1997 年3 月在美国No rth Caro lina 召开了第五届国际研讨会(The F if th In ternat ional
Wo rk shop on Rough Set s and Sof t Compu t ing, RSSC'97)
5 3 国际上一些有关粗糙集的软件
目前, 国际上研究粗糙集的机构和个人开发了一些应用粗糙集的实用化软件, 也出现了商
业化的软件 加拿大Reduct System Inc 公司开发的用于数据库知识发现的软件DataLogic
R [ 14 ]是用C 语言开发的, 可安装在个人计算机上, 为科研领域和工业界服务
美国肯萨斯大学开发了一套基于粗糙集的经验学习系统[ 15 ] , 名为L ERS (L earn ing f rom
Examp les based on Rough Set s) , 它能从大量经验数据中抽取出规则 L ERS 已被美国国家航
空航天管理局(NA SA ) 的约翰逊(John son) 空间中心采用, 作为专家系统开发工具, 为"自由
号"(F reedom ) 空间站上的医疗决策服务 美国环境保护署(U S Environm en tal P ro tect ion A 2
gency) 资助的一个项目中也采用了L ERS
波兰波兹南工业大学(Poznan U n iversity of Techno logy) 开发的软件RoughDA S 和
1 期韩祯祥等: 粗糙集理论及其应用43
1995-2005 Tsinghua Tongfang Optical Disc Co, Ltd All rights reserved
RoughClass, 也在不少实际领域中得到应用[ 5 ]
加拿大Regina 大学开发的KDD- R 是用C 编写的, 在UN IX 环境下运行, KDD2R 基于
变精度粗糙集模型[ 16 ] (V ariab le P recision Rough Set, V PRS) , 通过改变粗糙程度而使数据中
隐含的模式更清楚的显示出来
6 结束语
粗糙集是一种较有前途的处理不确定性的方法, 相信今后将会在更多的领域中得到应用
但是, 粗糙集理论还处在继续发展之中, 正如粗糙集理论的创立人Z Paw lak 所指出的那
样[ 8 ] , 尚有一些理论上的问题需要解决, 诸如用于不精确推理的粗糙逻辑(Rough logic) 方法,
粗糙集理论与非标准分析(Non standard analysis) 和非参数化统计(Nonparam et ric stat ist ics)
等之间的关系等等
将粗糙集与其它软计算方法(如模糊集,人工神经网络,遗传算法等) 相综合, 发挥出各自
的优点, 可望设计出具有较高的机器智商(M IQ ) 的混合智能系统(Hyb rid In telligen t
System ) , 这是一个值得努力的方向
模糊理论(Fuzzy Logic) [编辑本段]模糊的基本概念 概念是思维的基本形式之一,它反映了客观事物的本质特征。人类在认识过程中,把感觉到的事物的共同特点抽象出来加以概括,这就形成了概念。比如从白雪、白马、白纸等事物中抽象出“白”的概念。一个概念有它的内涵和外延,内涵是指该概念所反映的事物本质属性的总和,也就是概念的内容。外延是指一个概念所确指的对象的范围。例如“人”这个概念的内涵是指能制造工具,并使用工具进行劳动的动物,外延是指古今中外一切的人。
所谓模糊概念是指这个概念的外延具有不确定性,或者说它的外延是不清晰的,是模糊的。例如“青年”这个概念,它的内涵我们是清楚的,但是它的外延,即什么样的年龄阶段内的人是青年,恐怕就很难说情楚,因为在“年轻”和“不年轻”之间没有一个确定的边界,这就是一个模糊概念。
需要注意的几点:首先,人们在认识模糊性时,是允许有主观性的,也就是说每个人对模糊事物的界限不完全一样,承认一定的主观性是认识模糊性的一个特点。例如,我们让100个人说出“年轻人”的年龄范围,那么我们将得到100个不同的答案。尽管如此,当我们用模糊统计的方法进行分析时,年轻人的年龄界限分布又具有一定的规律性;
其次,模糊性是精确性的对立面,但不能消极地理解模糊性代表的是落后的生产力,恰恰相反,我们在处理客观事物时,经常借助于模糊性。例如,在一个有许多人的房间里,找一位“年老的高个子男人”,这是不难办到的。这里所说的“年老”、“高个子”都是模糊概念,然而我们只要将这些模糊概念经过头脑的分析判断,很快就可以在人群中找到此人。如果我们要求用计算机查询,那么就要把所有人的年龄,身高的具体数据输入计算机,然后我们才可以从人群中找这样的人。
最后,人们对模糊性的认识往往同随机性混淆起来,其实它们之间有着根本的区别。随机性是其本身具有明确的含义,只是由于发生的条件不充分,而使得在条件与事件之间不能出现确定的因果关系,从而事件的出现与否表现出一种不确定性。而事物的模糊性是指我们要处理的事物的概念本身就是模糊的,即一个对象是否符合这个概念难以确定,也就是由于概念外延模糊而带来的不确定性。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)