在matlab。打开matlab,通过导入数据,输入“输入数据”(input),以及“输出数据”(output),可以看到工作区已经出现了两个数据。MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环。
人工神经网络算法的信用风险预测
信用风险或信用违约表明未偿还已提供给客户的银行金融服务的可能性。信贷风险一直是银行贷款决策中广泛研究的领域。信用风险对银行和金融机构,特别是对商业银行而言,起着至关重要的作用,并且始终难以解释和管理。由于技术的进步,银行已经设法降低成本,以便开发强大而复杂的系统和模型来预测和管理信贷风险。
为了预测信用违约,已经创建并提出了几种方法。方法的使用取决于银行和金融机构的复杂程度,贷款的规模和类型。常用的方法是判别分析。这种方法使用了有助于决策的得分函数,而一些研究人员由于其限制性假设而对区分分析的有效性表示怀疑。变量之间的正态性和独立性[4]。人工神经网络模型的创建是为了克服其他效率低下的信用违约模型的缺点。
本文的目的是研究神经网络算法解决预测信用违约问题的能力,该能力衡量一段时间内贷款申请的信用度。前馈神经网络算法被应用于银行的住宅抵押贷款应用的小型数据集,以预测信用违约。模型的输出将生成一个二进制值,该值可用作分类器,以帮助银行识别借款人是否违约。本文将采用一种经验方法,该方法将讨论两个基于神经网络的模型,并且将通过训练和验证有关住宅抵押贷款申请的模型来报告实验结果。作为该方向的最后一步,还对数据集执行了线性回归方法。
2方法论
21数据
数据是从kagglecom(贷款俱乐部贷款数据)收集的,其中包含850万条记录。从数据集中抽取了60
因变量: loan_status(0和1);如果借款人将违约,那么投资将是不良的;如果借款人不违约,则他或她将能够偿还全部贷款额。因此,要区分神经网络,0表示借方将违约,而1表示借方将不违约。
自变量:以下变量被视为自变量,loan_amnt,funded_amnt,emp_length,等级,funded_amnt_inv,期限,int_rate,分期付款,year_inc,issue_d和application_type
22模型
在这项研究中,使用了经典的前馈神经网络。前馈网络由一个具有10个输入变量的输入层,7个隐藏层和一个具有代表分类器的神经元的输出层组成。使用监督学习算法(反向传播算法)对网络进行训练。该算法通过最小化实际和期望输出之间的误差来优化神经元权重。对于神经元i,权重将通过公式进行更新,其中f为学习系数是隐藏层的输出,算法将一直运行到找到停止标准为止。
对于图3所示的神经网络算法,必须仔细选择参数,例如f的值以及神经元数和隐藏层数。在图3中,连接由每层之间的黑线表示和权重,蓝线显示每个步骤中的偏差(模型的截距)。网络是一个黑匣子,训练算法可以在融合时随时使用。同样,已经从提取的数据集中为网络算法创建了一个随机样本。然后创建一个训练和测试数据集,分别用于训练模型和验证模型的性能。
图3:信用违约模型的神经网络图
3实验与结果
已将10个归一化变量作为按顺序排列的输入作为网络输入。网络的输出是一个分类器,结果为0和1。首先,已检查数据是否缺少数据点值,没有数据丢失;无需修复数据集。输入的相关矩阵如图4所示。
图4:输入数据集的相关图
训练完数据集后,将在测试数据集上对其进行测试。为了基于其他输入来计算输出,已使用了计算功能。将7个隐藏层添加到网络并创建了模型。网络已生成以下结果矩阵:
表1:经典前馈神经网络的结果矩阵
属性
值
错误
322833
达到阈值
00998
脚步
6765
总共需要6765个步骤,直到误差函数的所有导数都小于默认阈值(001)。在实现经典的前馈算法之后,通过使用学习速率为001的反向传播算法实现了另一个模型。经典过程和反向传播过程具有几乎相同的错误率。因此,经典模型拟合不如反向传播算法令人满意。
图5:输入的广义权重
表2:预测输出与期望输出的比较
实际
预测
火柴
0
00032
真正
0
000017
真正
0
00114
真正
1个
0985
真正
0
00060
真正
0
00132
真正
0
09704
假
0
00101
真正
1个
000128
真正
最后,将线性回归应用于数据集以比较两种算法的准确性。glm()函数已用于拟合线性回归模型。对于回归,已分配了大于05的概率,如果回归中的预测值大于05,则该值为1,否则为0。已经通过合并错误分类误差来计算准确性,并且混淆矩阵的计算也如图6所示。 。
图6:混淆矩阵和线性回归统计
为了强调比较,已计算了线性回归和神经网络的均方误差,如表3所示。从表中可以看出,两个过程的均方误差大致相同,因此两个过程都相同工作。有必要知道,MSE中的偏差取决于训练和测试划分。
表3:两个过程的均方误差
MSE神经网络
MSE线性回归
00220449
00227334
4。结论
本文研究了人工神经网络和线性回归模型来预测信用违约。两种系统都已经过kagglecom提供的贷款数据培训。两种系统的结果对数据集均显示出相同的效果,因此非常有效,通过人工神经网络的准确率为9767575%,准确率为9769609%。系统对输出变量的分类正确,误差很小。因此,这两个过程都可以用来识别信用违约率。而且,神经网络代表黑匣子方法,因此与线性回归模型相比,难以解释结果。因此,使用哪种模型取决于必须使用的应用程序。此外,在使用神经网络过程拟合模型时,用户需要格外注意属性和数据规范化以提高性能。总之,神经网络提供了强有力的证据来有效预测贷款申请的信用违约。
神经网络算法具有广泛的应用范围,不仅对住宅抵押至关重要。其他应用可以是由公司发行的债券评级,通常称为债券评级,对可以持续使用长达一年的短期投资进行评级,对本地和外币的长期和短期评级,主权或国家评级。通过使用适当的算法和技术,可以进一步增强预测系统,以为应用程序分配信用等级。
题库
摘要 由于污水各指标含量和污水处理过程的复杂性,污水出水COD含量变化有着很强的非线性,一般方法难以建模;而神经网络尤其是小波神经网络擅长处理复杂模型,故使用两种网络建立污水出水COD预测模型,进行仿真和对比分析。此外,对高邮市海潮污水处理厂的监测数据进行实证分析,表明建立的模型具有较快的收敛速度和较高的预测精度,能够对污水处理中出水COD含量浓度进行有效预测和控制,具有一定理论价值和应用价值。
关键词 小波神经网络;BP神经网络;COD含量;预测
中图分类号 TN710 文献标识码 A 文章编号 1673-9671-(2012)071-0108-03
高邮市海潮污水处理厂采用的是德国冯·诺顿西公司的“百乐克”工艺,是由德国冯诺顿西公司于七十年代研究成功的一种新型污水处理技术。COD,是表示水质污染度的指标。污水处理工艺复杂,水质变化大,各参数关系复杂,出水水质难以预测。神经网络方法具有一定的鲁棒性和自适应性,故使用神经网络进行建模,进行预测、控制。
BP神经网络是一种典型的多层前馈神经网络,主要特点是信号前向传递,误差反向传递,分为输入层,隐藏层,输出层。研究表明,足够多的隐含层神经元可以使得三层神经网络可以无限地逼近任何复杂函数。但BP网络也有一些缺陷,限制了它在工程中的进一步应用。
小波神经网络是近年来新兴的一种人工神经网络,集小波分析和人工神经网络的优点于一体。该网络引入伸缩因子和平移因子,具有更多的自由度和更强的灵活性,能有效克服传统神经网络模型的不足。本文采用小波神经网络对污水出水COD含量进行建模,进行实证分析,证明了该模型的有效性和可行性。
1 小波神经网络模型
11 小波的基本概念
小波分析是当前数学中一个迅速发展的新领域,是针对傅里叶变换的不足发展而来的,它解决了傅里叶变换不能解决的问题。有关概念简要复述如下:
定义1:设φ(t)∈L2(R),如果
(11)
则称φ(t)为一个小波,也常称为母小波或基本小波。
定义2:对小波φ(t)进行伸缩和平移,可得到一族函数
(12)
则称φu,s(t)为小波φ(t)的小波基函数。式(2)中,s称为尺度参数,u称为平移参数。
本文使用的小波基函数是Morlet小波,其表达式为:
(13)
12 小波神经网络结构和学习算法
小波神经网络以BP神经网络拓扑结构为基础,隐含层节点的传递函数为小波基函数,信号向前传播,同时误差反向传播,是一种三层的前向网络;其拓扑结构如图1所示。
图1中,X1,X2,…,Xk是小波神经网络的输入变量,Y1,Y2,…,Ym是小波神经网络的预测输出,ωij和ωjk为小波神经网络权值。
在输入信号序列为xi(i=1,2,…,k)时,隐含层输出计算公式为:
(21)
式(21)中,h( j )是隐含层第j个节点输出值;ωij为输入层和隐含层的连接权值;bj为小波基函数hj的平移因子;aj为小波基函数hj的伸缩因子;hj为小波基函数。
图1 小波神经网络拓扑结构
小波神经网络输出层计算公式为:
(22)
式(22)中,ωik为隐含层到输出层权值;h(i)为第i个节点的输出;l为隐含层节点数;m为输出层节点数。
小波神经网络采用梯度修正法修正各权值和参数,进而不断逼近期望输出,过程如下:
1)计算网络预测误差
(23)
式(23)中,yn(k)为期望输出,y(k)为小波神经网络预测输出。
2)根据误差修正小波神经网络权值和小波基函数系数
(24)
式(24)中,Δωn,k(i+1)、Δa k(i+1)、Δb k(i+1)是由网络预测误差计算求得:
式(25)中,η为学习速率。
(25)
2 污水出水COD预测模型
研究表明,污水出水COD含量与污水前几个时段的COD含量有关,据此设计小波神经网络。输入层为当前时间点前n个时间点的COD含量;输出层为当前COD含量预测值。其中,1至5月的污水出水COD含量为训练数据,6月份(1到30日)为测试数据,算法流程如下:
图2 小波神经网络算法流程
本文采用的小波神经网络有4个输入节点,表示预测时间节点前4个时间点的污水出水COD含量,隐含层有6个节点,输出层有1个节点,为网络预测的污水出水COD含量。
3 模型仿真结果分析
31 数据预处理
神经网络训练的数据预处理对网络有着很重要的影响,故要对数据进行归一化处理:
(41)
32 模型仿真与分析
构建BP网络模型和小波神经网络模型,输入向量为待预测时间点前4个时间点的污水出水COD的归一化数据,输出数据为预测时间点处的污水出水COD待归一化数据。训练网络,得到预测值和预测误差。表1给出了2012年6月1至30日的COD实测值、BP网络模型预测值以及小波网络模型预测值。
利用MATLAB软件进行仿真,图3是BP神经网络模型预测曲线,图4是小波神经网络模型仿真预测曲线。
图3 基于BP神经网络构建的污水出水COD预测模型
(1~5月训练,6月测试)
设xt为实际值,xt为模型预测值,n为模型预测检验个数。定义平均绝对误差MAE为:
(42)
由仿真结果知,两种网络预测趋势相同, BP网络模型预测平均误差MAE为124(mg/L),平均相对误差为53193%,小波神经网络模型预测平均误差MAE为113(mg/L),平均相对误差
图4 基于小波神经网络构建的污水出水COD预测模型(1~5月训练,6月测试)
为47877%;训练过程中,同等精度条件下,BP神经网络模型训练次数要远多于小波神经网络训练次数;表明BP网络和小波神经网络模型均可以较好地模拟污水出水COD含量变化过程,但小波神经网络模型在收敛速度和预测精度方面要优于传统的BP网络模型。
4 结论
小波神经网络是基于小波分析理论的一种新型神经网络模型,具有时频局域化分析和自适应能力。本文将小波神经网络模型应用到污水出水COD含量预测中,为污水出水COD含量预测提供了一种新方法。使用MATLAB软件实证分析了模型的可行性和有效性,结果表明,小波神经网网络模型在收敛速度和预测精度方面均优于传统的BP网络模型,故最终使用小波神经网络建立模型。最后,本文的模型具有一定普遍意义,在高度非线性的时间序列预测问题中,可以采用小波神经网络建模的方法对时间序列未来的变化进行预测和控制。
参考文献
[1]谢立春BP神经网络算法的改进及收敛性分析[J]计算技术与自动化,2007,26(3):52-56
[2]贺清碧,周建丽BP神经网络收敛性问题的改进措施[J]重庆交通学院学报,2005,24(1):143-145
[3]陈哲,冯天瑾小波神经网络研究进展及展望[J]青岛海洋大学学报,1999,29(4):66-667
[4]朱四超基于小波神经网络的工程变形量预测模型[J]2010,8(2):103-105
[5]李元松,李新平,代翼飞,田昌贵,陈清运小波神经网络在高陡边坡位移预测中的应用[J]2010,32(9):39-43
[6]潘国荣,谷川变形监测数据的小波神经网络预测方法[J]大地测量与地球动学,2007,27(4):47-50
[7]聂勋科基于神经网络的污水出水COD预测模型重庆工学院学报[J]22(8):156-161
[8]孙延奎小波分析及其应用[M]北京:机械工业出版社,2005
[9]史峰,王小川,郁磊,李洋MATLAB神经网络30个案例分析[M]北京航空航天大学出版社,2011
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)