拟牛顿法之BFGS_软件运维

考虑无约束最优化问题

假设有二阶连续偏导，且表示第次迭代的值。可以将在附近做二阶泰勒展开

其中，是的梯度在点的值，是的海塞矩阵

在点的值。

每次迭代从开始，求目标函数的极小点。假设满足

由泰勒展开，有

即

因此有

或者以定义搜索方向，即有

以式迭代就是牛顿法

在牛顿法的迭代中，需要计算海塞矩阵的逆矩阵，这一计算比较复杂行唤信，考虑用一个阶矩阵代替。就是拟牛顿法的基本想法。

由梯度的基本定义，可知满足以下关系

令，则，称为拟牛顿条件。如果正定，则可以保证搜索方向式下降的。

这是由于搜索方向是，根据牛顿法的迭代规则，有

所以在前述的泰勒展开中，可以改写为

由于正定，。故当充分小时，总有

拟牛顿法同样满足这个条件，以一正定矩阵代替，同时令其满足拟牛顿条件，即按照拟牛顿法，在每次迭代中可以选择更新矩阵。

DFP方法选择正定矩阵逼近的是海塞矩阵的逆矩阵，仍未达到最优化。故BFGS方法用正定矩阵逼近海塞矩阵本身。此时相应的拟牛顿条件为。

假设每次迭代中，

考虑使和满足

得到BFGS迭代公式

输入：链高目标函数，梯度函数，精档轮度要求

输出：的极小点

（1）选定初始点，取为正定对称矩阵，置

（2）计算，如果，停止迭代，找到最优点，否则继续迭代

（3）由求出

（4）求使得

（5）更新

（6）计算 ,比较误差，如果不符合停止条件，计算，进行下一次迭代

（7）

根据二阶泰勒展开，用一阶和二阶倒数确定参数迭代步长和方向

设初始向量，它在处的泰勒展开如下：

，当时

注：矩阵求导公式：

晌猛

对上式相对于求导：

①

因此可以得到处的迭代方程：

对应这种形式，步长，方向

从上述公式可以知道，牛顿法的每一次迭代都需要计算二阶海塞矩阵，当特征和数据非常多时，时间和空间开销都会比较大。

拟牛顿法只是一种方法的统称，即用一个近似矩阵B去替代逆海塞矩阵，然后在每一轮迭代中更新B

怎样找到逆海塞矩阵的替代矩阵？

对上一节中的①式做一下变换：

令 , ，上式变成：

再令凳谨指，，得到：

①

也就是说，第k步迭代的海塞矩阵可以通过第k步的迭代步长和一阶导数差值拟合。

BFGS( Broyden–Fletcher–Goldfarb–Shanno ):

https://blog.csdn.net/itplus/article/details/21897443

用表示的近似，表示的枣配近似：

那么的迭代公式为

设 ②，再根据①式得到的 :

交换和的位置：

令：，以及

解出：

再带入到②中：

L-BFGS:

BFGS中B矩阵的每次更新都需要nXn的空间开销，L-BFGS不会直接存储B，而是①只存取需要用到的n个向量，并且②只保存了最近的m次迭代的结果，所以L-BFGS算法又做了近似。

用MATLAB优化工具箱解线性规划

命令：x=linprog（c，A，b）

命令：x=linprog（c，A，b，Aeq,beq）

注意：若没有不等式：存在，则令A=[ ]，b=[ ]. 若没有等式约束, 则令Aeq=[ ], beq=[ ].

命令：[1] x=linprog（c，A，b，Aeq,beq, VLB，VUB）

[2] x=linprog（c，A，b，Aeq,beq, VLB，VUB, X0）

注意：[1] 若没有等式约束, 则令Aeq=[ ], beq=[ ]. [2]其中X0表示初始点

4、命令：[x,fval]=linprog(…)

返回最优解x及x处的目标函数值fval.

例1

解编写M文件小xxgh1.m如下：

c=[-0.4 -0.28 -0.32 -0.72 -0.64 -0.6]

A=[0.01 0.01 0.01 0.03 0.03 0.030.02 0 0 0.05 0 00 0.02 0 0 0.05 00 0 0.03 0 0 0.08]

b=[850700100900]

Aeq=[]beq=[]

vlb=[000000]vub=[]

[x,fval]=linprog(c,A,b,Aeq,beq,vlb,vub)

例2 解: 编写M文件xxgh2.m如下：

c=[6 3 4]

A=[0 1 0]

b=[50]

Aeq=[1 1 1]

beq=[120]

vlb=[30,0,20]

vub=[]

[x,fval]=linprog(c,A,b,Aeq,beq,vlb,vub

例3 （任务分配问题）某车间有甲、乙两台机床，可用于加工三种工件。

假定这两台车床的可用台时数分别为800和900，三种工件的数量分别为400、

600和500，且已知用三种不同车床加工单位数量不同工件所需的台时数和加工

费用如下表。问怎样分配车床的加工任务，才能既满足加工工件的要求，又使

加工费用最低

解设在甲车床上加工工件1、2、3的数量分别为x1、x2、x3，在乙车床上

加工工件1、2、3的数量分别为x4、x5、x6。可建立以下线性规划模型：

编写M文件xxgh3.m如下:

f = [13 9 10 11 12 8]

A = [0.4 1.1 1 0 0 0

0 0 0 0.5 1.2 1.3]

b = [800900]

Aeq=[1 0 0 1 0 0

0 1 0 0 1 0

0 0 1 0 0 1]

beq=[400 600 500]

vlb = zeros(6,1)

vub=[]

[x,fval] = linprog(f,A,b,Aeq,beq,vlb,vub)

例4．某厂每日8小时的产量不低于1800件。为了进行质量控制，计划聘请两种不同水平的检验员。一级检验员的标准为册者：速度25件/小时，正确率98%，计时工资4元/小时；二级检验员的标准为：速度15小时/件，正确率95%，计时工资3元/小时。检验员每错检一次，工厂要损失2元。为使总检验费用最省，该工厂应聘一级、二级检验员各几名？

解设需要一级和二级检验员的人数分别为x1、x2人,

编写M文件xxgh4.m如下：

c = [4036]

A=[-5 -3]

b=[-45]

Aeq=[]

beq=[]

vlb = zeros(2,1)

vub=[915]

%调用linprog函数：

[x,fval] = linprog(c,A,b,Aeq,beq,vlb,vub)

结果为：

x =

9.0000

0.0000

fval =360

即只需聘用9个一级检验员。

4．控制参数options的设置

Options中常用的几个参数的名称、含义、取值如下:

(1) Display: 显示水平.取值为’off’时,不显示输出取值为’iter’时,显示每次迭代的信息取值为’final’时,显示最终结果.默认值为’final’.

(2) MaxFunEvals: 允粗塌许进行函数评价的最大次数,取值岩姿圆为正整数.

(3) MaxIter: 允许进行迭代的最大次数,取值为正整数

控制参数options可以通过函数optimset创建或修改。命令的格式如下：

(1) options=optimset(‘optimfun’)

创建一个含有所有参数名,并与优化函数optimfun相关的默认值的选项结构options.

（2）options=optimset(‘param1’,value1,’param2’,value2,...)

创建一个名称为options的优化选项参数,其中指定的参数具有指定值,所有未指定的参数取默认值.

(3)options=optimset(oldops,‘param1’,value1,’param2’,

value2,...)

创建名称为oldops的参数的拷贝,用指定的参数值修改oldops中相应的参数.

例：opts=optimset(‘Display’,’iter’,’TolFun’,1e-8)

该语句创建一个称为opts的优化选项结构,其中显示参数设为’iter’, TolFun参数设为1e-8.

用Matlab解无约束优化问题

一元函数无约束优化问题

常用格式如下：

（1）x= fminbnd (fun,x1,x2)

（2）x= fminbnd (fun,x1,x2 ，options)

（3）[x，fval]= fminbnd（...）

（4）[x，fval，exitflag]= fminbnd（...）

（5）[x，fval，exitflag，output]= fminbnd（...）

其中（3）、（4）、（5）的等式右边可选用（1）或（2）的等式右边。

函数fminbnd的算法基于黄金分割法和二次插值法，它要求目标函数必须是连续函数，并可能只给出局部最优解。

例1 求在0<x<8中的最小值与最大值

主程序为wliti1.m:

f='2*exp(-x).*sin(x)'

fplot(f,[0,8])%作图语句

[xmin,ymin]=fminbnd (f, 0,8)

f1='-2*exp(-x).*sin(x)'

[xmax,ymax]=fminbnd (f1, 0,8)

运行结果：

xmin = 3.9270ymin = -0.0279

xmax = 0.7854 ymax = 0.6448

例2 对边长为3米的正方形铁板，在四个角剪去相等的正方形以制成方形无盖水槽，问如何剪法使水槽的容积最大？

先编写M文件fun0.m如下:

function f=fun0(x)

f=-(3-2*x).^2*x

主程序为wliti2.m:

[x,fval]=fminbnd('fun0',0,1.5)

xmax=x

fmax=-fval

运算结果为: xmax = 0.5000,fmax =2.0000.即剪掉的正方形的边长为0.5米时水槽的容积最大,最大容积为2立方米.

2、多元函数无约束优化问题

标准型为：min F(X)

命令格式为:

（1）x= fminunc（fun,X0 ）；或x=fminsearch（fun,X0 ）

（2）x= fminunc（fun,X0 ，options）；

或x=fminsearch（fun,X0 ，options）

（3）[x，fval]= fminunc（...）；

或[x，fval]= fminsearch（...）

（4）[x，fval，exitflag]= fminunc（...）；

或[x，fval，exitflag]= fminsearch

（5）[x，fval，exitflag，output]= fminunc（...）；

或[x，fval，exitflag，output]= fminsearch（...）

说明:

• fminsearch是用单纯形法寻优. fminunc的算法见以下几点说明：

[1] fminunc为无约束优化提供了大型优化和中型优化算法。由options中的参数LargeScale控制：

LargeScale=’on’(默认值),使用大型算法

LargeScale=’off’(默认值),使用中型算法

[2] fminunc为中型优化算法的搜索方向提供了4种算法，由

options中的参数HessUpdate控制：

HessUpdate=’bfgs’（默认值），拟牛顿法的BFGS公式；

HessUpdate=’dfp’，拟牛顿法的DFP公式；

HessUpdate=’steepdesc’，最速下降法

[3] fminunc为中型优化算法的步长一维搜索提供了两种算法，

由options中参数LineSearchType控制：

LineSearchType=’quadcubic’(缺省值)，混合的二次和三

次多项式插值；

LineSearchType=’cubicpoly’，三次多项式插

• 使用fminunc和 fminsearch可能会得到局部最优解.

例3 min f(x)=(4x12+2x22+4x1x2+2x2+1)*exp(x1)

1、编写M-文件 fun1.m:

function f = fun1 (x)

f = exp(x(1))*(4*x(1)^2+2*x(2)^2+4*x(1)*x(2)+2*x(2)+1)

2、输入M文件wliti3.m如下:

x0 = [-1, 1]

x=fminunc(‘fun1’,x0)

y=fun1(x)

3、运行结果:

x= 0.5000 -1.0000

y = 1.3029e-10

例4 Rosenbrock 函数 f（x1，x2）=100（x2-x12）2+(1-x1)2

的最优解（极小）为x*=（1，1），极小值为f*=0.试用

不同算法（搜索方向和步长搜索）求数值最优解.

初值选为x0=（-1.2 , 2）.

1. 为获得直观认识，先画出Rosenbrock 函数的三维图形,

输入以下命令：

[x,y]=meshgrid(-2:0.1:2,-1:0.1:3)

z=100*(y-x.^2).^2+(1-x).^2

mesh(x,y,z)

2. 画出Rosenbrock 函数的等高线图,输入命令：

contour(x,y,z,20)

hold on

plot(-1.2,2,' o ')

text(-1.2,2,'start point')

plot(1,1,'o')

text(1,1,'solution')

3.用fminsearch函数求解

输入命令:

f='100*(x(2)-x(1)^2)^2+(1-x(1))^2'

[x,fval,exitflag,output]=fminsearch(f, [-1.2 2])

运行结果:

x =1.00001.0000

fval =1.9151e-010

exitflag = 1

output =

iterations: 108

funcCount: 202

algorithm: 'Nelder-Mead simplex direct search'

4. 用fminunc 函数

(1)建立M-文件fun2.m

function f=fun2(x)

f=100*(x(2)-x(1)^2)^2+(1-x(1))^2

(2)主程序wliti44.m

Rosenbrock函数不同算法的计算结果

可以看出，最速下降法的结果最差.因为最速下降法特别不适合于从一狭长通道到达最优解的情况.

例5 产销量的最佳安排

某厂生产一种产品有甲、乙两个牌号，讨论在产销平衡的情况下如何确定各自的产量，使总利润最大. 所谓产销平衡指工厂的产量等于市场上的销量.

符号说明

z(x1,x2)表示总利润；

p1，q1，x1分别表示甲的价格、成本、销量；

p2，q2，x2分别表示乙的价格、成本、销量；

aij，bi，λi,ci（i，j =1，2）是待定系数.

基本假设

1．价格与销量成线性关系

利润既取决于销量和价格，也依赖于产量和成本。按照市场规律，

甲的价格p1会随其销量x1的增长而降低，同时乙的销量x2的增长也

会使甲的价格有稍微的下降，可以简单地假设价格与销量成线性关系，

即： p1 = b1 - a11 x1 - a12 x2 ，b1，a11，a12 >0，且a11 >a12；

同理， p2 = b2 - a21 x1- a22 x2 ，b2，a21，a22 >0

2．成本与产量成负指数关系

甲的成本随其产量的增长而降低,且有一个渐进值,可以假设为

负指数关系,

总利润为： z(x1,x2)=(p1-q1)x1+(p2-q2)x2

若根据大量的统计数据,求出系数b1=100,a11=1,a12=0.1,b2=280,

a21=0.2,a22=2,r1=30,λ1=0.015,c1=20, r2=100,λ2=0.02,c2=30,则

问题转化为无约束优化问题：求甲,乙两个牌号的产量x1，x2，使总利润z最大.

为简化模型,先忽略成本,并令a12=0,a21=0,问题转化为求:

z1 = ( b1 - a11x1 ) x1 + ( b2 - a22x2 ) x2

的极值. 显然其解为x1 = b1/2a11 = 50, x2 = b2/2a22 = 70,

我们把它作为原问题的初始值.

模型求解

1.建立M-文件fun.m:

function f = fun(x)

y1=((100-x(1)- 0.1*x(2))-(30*exp(-0.015*x(1))+20))*x(1)

y2=((280-0.2*x(1)- 2*x(2))-(100*exp(-0.02*x(2))+30))*x(2)

f=-y1-y2

2.输入命令:

x0=[50,70]

x=fminunc(‘fun’,x0),

z=fun(x)

3.计算结果:

x=23.9025, 62.4977, z=6.4135e+003

即甲的产量为23.9025,乙的产量为62.4977,最大利润为6413.5.

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12342184.html

拟牛顿法之BFGS

发表评论

评论列表（0条）