拟牛顿法之BFGS

拟牛顿法之BFGS,第1张

  考虑无约束最优化问题

  假设 有二阶连续偏导,且 表示第 次迭代的值。可以将 在 附近做二阶泰勒展开

  其中, 是 的梯度在点 的值, 是 的海塞矩阵

在点 的值。

  每次迭代从 开始,求目标函数的极小点。假设 满足

由泰勒展开,有

因此有

或者以 定义搜索方向,即有

以式 迭代就是牛顿法

  在牛顿法的迭代中,需要计算海塞矩阵的逆矩阵 ,这一计算比较复杂行唤信,考虑用一个 阶矩阵 代替 。就是拟牛顿法的基本想法。

  由梯度的基本定义,可知 满足以下关系

令 ,则 ,称为拟牛顿条件。如果 正定,则可以保证搜索方向式下降的。

  这是由于搜索方向是 ,根据牛顿法的迭代规则,有

所以在前述的泰勒展开中, 可以改写为

由于 正定, 。故当 充分小时,总有

  拟牛顿法同样满足这个条件,以一正定矩阵 代替 ,同时令其满足拟牛顿条件,即 按照拟牛顿法,在每次迭代中可以选择更新矩阵 。

  DFP方法选择正定矩阵逼近的是海塞矩阵的逆矩阵,仍未达到最优化。故BFGS方法用正定矩阵 逼近海塞矩阵 本身。此时相应的拟牛顿条件为 。

  假设每次迭代中,

考虑使 和 满足

得到BFGS迭代公式

输入:链高目标函数 ,梯度函数 ,精档轮度要求

输出: 的极小点

(1)选定初始点 ,取 为正定对称矩阵,置

(2)计算 ,如果 ,停止迭代,找到最优点,否则继续迭代

(3)由 求出

(4)求 使得

(5)更新

(6)计算 ,比较误差,如果不符合停止条件,计算 ,进行下一次迭代

(7)

根据二阶泰勒展开,用一阶和二阶倒数确定参数迭代步长和方向

设初始向量 ,它在 处的泰勒展开如下:

,当 时

注:矩阵求导公式:

 晌猛

对上式相对于 求导:

因此可以得到 处的迭代方程:

对应 这种形式,步长 ,方向

从上述公式可以知道,牛顿法的每一次迭代都需要计算二阶海塞矩阵,当特征和数据非常多时,时间和空间开销都会比较大。

拟牛顿法只是一种方法的统称,即用一个近似矩阵B去替代逆海塞矩阵 ,然后在每一轮迭代中更新B

怎样找到逆海塞矩阵的替代矩阵?

对上一节中的①式做一下变换:

令 , ,上式变成:

再令凳谨指 , ,得到:

也就是说,第k步迭代的海塞矩阵可以通过第k步的迭代步长和一阶导数差值拟合。

BFGS( Broyden–Fletcher–Goldfarb–Shanno ):

https://blog.csdn.net/itplus/article/details/21897443

用 表示 的近似, 表示 的枣配近似:

那么 的迭代公式为

设 ②,再根据①式得到的 :

交换 和 的位置:

令: ,以及

解出:

再带入到②中:

L-BFGS:

BFGS中B矩阵的每次更新都需要nXn的空间开销,L-BFGS不会直接存储B,而是①只存取需要用到的n个向量,并且②只保存了最近的m次迭代的结果,所以L-BFGS算法又做了近似。

用MATLAB优化工具箱解线性规划

命令:x=linprog(c,A,b)

命令:x=linprog(c,A,b,Aeq,beq)

注意:若没有不等式: 存在,则令A=[ ],b=[ ]. 若没有等式约束, 则令Aeq=[ ], beq=[ ].

命令:[1] x=linprog(c,A,b,Aeq,beq, VLB,VUB)

[2] x=linprog(c,A,b,Aeq,beq, VLB,VUB, X0)

注意:[1] 若没有等式约束, 则令Aeq=[ ], beq=[ ]. [2]其中X0表示初始点

4、命令:[x,fval]=linprog(…)

返回最优解x及x处的目标函数值fval.

例1

解 编写M文件小xxgh1.m如下:

c=[-0.4 -0.28 -0.32 -0.72 -0.64 -0.6]

A=[0.01 0.01 0.01 0.03 0.03 0.030.02 0 0 0.05 0 00 0.02 0 0 0.05 00 0 0.03 0 0 0.08]

b=[850700100900]

Aeq=[]beq=[]

vlb=[000000]vub=[]

[x,fval]=linprog(c,A,b,Aeq,beq,vlb,vub)

例2 解: 编写M文件xxgh2.m如下:

c=[6 3 4]

A=[0 1 0]

b=[50]

Aeq=[1 1 1]

beq=[120]

vlb=[30,0,20]

vub=[]

[x,fval]=linprog(c,A,b,Aeq,beq,vlb,vub

例3 (任务分配问题)某车间有甲、乙两台机床,可用于加工三种工件。

假定这两台车床的可用台时数分别为800和900,三种工件的数量分别为400、

600和500,且已知用三种不同车床加工单位数量不同工件所需的台时数和加工

费用如下表。问怎样分配车床的加工任务,才能既满足加工工件的要求,又使

加工费用最低

解设在甲车床上加工工件1、2、3的数量分别为x1、x2、x3,在乙车床上

加工工件1、2、3的数量分别为x4、x5、x6。可建立以下线性规划模型:

编写M文件xxgh3.m如下:

f = [13 9 10 11 12 8]

A = [0.4 1.1 1 0 0 0

0 0 0 0.5 1.2 1.3]

b = [800900]

Aeq=[1 0 0 1 0 0

0 1 0 0 1 0

0 0 1 0 0 1]

beq=[400 600 500]

vlb = zeros(6,1)

vub=[]

[x,fval] = linprog(f,A,b,Aeq,beq,vlb,vub)

例4.某厂每日8小时的产量不低于1800件。为了进行质量控制,计划聘请两种不同水平的检验员。一级检验员的标准为册者:速度25件/小时,正确率98%,计时工资4元/小时;二级检验员的标准为:速度15小时/件,正确率95%,计时工资3元/小时。检验员每错检一次,工厂要损失2元。为使总检验费用最省,该工厂应聘一级、二级检验员各几名?

解设需要一级和二级检验员的人数分别为x1、x2人,

编写M文件xxgh4.m如下:

c = [4036]

A=[-5 -3]

b=[-45]

Aeq=[]

beq=[]

vlb = zeros(2,1)

vub=[915]

%调用linprog函数:

[x,fval] = linprog(c,A,b,Aeq,beq,vlb,vub)

结果为:

x =

9.0000

0.0000

fval =360

即只需聘用9个一级检验员。

4.控制参数options的设置

Options中常用的几个参数的名称、含义、取值如下:

(1) Display: 显示水平.取值为’off’时,不显示输出取值为’iter’时,显示每次迭代的信息取值为’final’时,显示最终结果.默认值为’final’.

(2) MaxFunEvals: 允粗塌许进行函数评价的最大次数,取值岩姿圆为正整数.

(3) MaxIter: 允许进行迭代的最大次数,取值为正整数

控制参数options可以通过函数optimset创建或修改。命令的格式如下:

(1) options=optimset(‘optimfun’)

创建一个含有所有参数名,并与优化函数optimfun相关的默认值的选项结构options.

(2)options=optimset(‘param1’,value1,’param2’,value2,...)

创建一个名称为options的优化选项参数,其中指定的参数具有指定值,所有未指定的参数取默认值.

(3)options=optimset(oldops,‘param1’,value1,’param2’,

value2,...)

创建名称为oldops的参数的拷贝,用指定的参数值修改oldops中相应的参数.

例:opts=optimset(‘Display’,’iter’,’TolFun’,1e-8)

该语句创建一个称为opts的优化选项结构,其中显示参数设为’iter’, TolFun参数设为1e-8.

用Matlab解无约束优化问题

一元函数无约束优化问题

常用格式如下:

(1)x= fminbnd (fun,x1,x2)

(2)x= fminbnd (fun,x1,x2 ,options)

(3)[x,fval]= fminbnd(...)

(4)[x,fval,exitflag]= fminbnd(...)

(5)[x,fval,exitflag,output]= fminbnd(...)

其中(3)、(4)、(5)的等式右边可选用(1)或(2)的等式右边。

函数fminbnd的算法基于黄金分割法和二次插值法,它要求目标函数必须是连续函数,并可能只给出局部最优解。

例1 求 在0<x<8中的最小值与最大值

主程序为wliti1.m:

f='2*exp(-x).*sin(x)'

fplot(f,[0,8])%作图语句

[xmin,ymin]=fminbnd (f, 0,8)

f1='-2*exp(-x).*sin(x)'

[xmax,ymax]=fminbnd (f1, 0,8)

运行结果:

xmin = 3.9270ymin = -0.0279

xmax = 0.7854 ymax = 0.6448

例2 对边长为3米的正方形铁板,在四个角剪去相等的正方形以制成方形无盖水槽,问如何剪法使水槽的容积最大?

先编写M文件fun0.m如下:

function f=fun0(x)

f=-(3-2*x).^2*x

主程序为wliti2.m:

[x,fval]=fminbnd('fun0',0,1.5)

xmax=x

fmax=-fval

运算结果为: xmax = 0.5000,fmax =2.0000.即剪掉的正方形的边长为0.5米时水槽的容积最大,最大容积为2立方米.

2、多元函数无约束优化问题

标准型为:min F(X)

命令格式为:

(1)x= fminunc(fun,X0 );或x=fminsearch(fun,X0 )

(2)x= fminunc(fun,X0 ,options);

或x=fminsearch(fun,X0 ,options)

(3)[x,fval]= fminunc(...);

或[x,fval]= fminsearch(...)

(4)[x,fval,exitflag]= fminunc(...);

或[x,fval,exitflag]= fminsearch

(5)[x,fval,exitflag,output]= fminunc(...);

或[x,fval,exitflag,output]= fminsearch(...)

说明:

• fminsearch是用单纯形法寻优. fminunc的算法见以下几点说明:

[1] fminunc为无约束优化提供了大型优化和中型优化算法。由options中的参数LargeScale控制:

LargeScale=’on’(默认值),使用大型算法

LargeScale=’off’(默认值),使用中型算法

[2] fminunc为中型优化算法的搜索方向提供了4种算法,由

options中的参数HessUpdate控制:

HessUpdate=’bfgs’(默认值),拟牛顿法的BFGS公式;

HessUpdate=’dfp’,拟牛顿法的DFP公式;

HessUpdate=’steepdesc’,最速下降法

[3] fminunc为中型优化算法的步长一维搜索提供了两种算法,

由options中参数LineSearchType控制:

LineSearchType=’quadcubic’(缺省值),混合的二次和三

次多项式插值;

LineSearchType=’cubicpoly’,三次多项式插

• 使用fminunc和 fminsearch可能会得到局部最优解.

例3 min f(x)=(4x12+2x22+4x1x2+2x2+1)*exp(x1)

1、编写M-文件 fun1.m:

function f = fun1 (x)

f = exp(x(1))*(4*x(1)^2+2*x(2)^2+4*x(1)*x(2)+2*x(2)+1)

2、输入M文件wliti3.m如下:

x0 = [-1, 1]

x=fminunc(‘fun1’,x0)

y=fun1(x)

3、运行结果:

x= 0.5000 -1.0000

y = 1.3029e-10

例4 Rosenbrock 函数 f(x1,x2)=100(x2-x12)2+(1-x1)2

的最优解(极小)为x*=(1,1),极小值为f*=0.试用

不同算法(搜索方向和步长搜索)求数值最优解.

初值选为x0=(-1.2 , 2).

1. 为获得直观认识,先画出Rosenbrock 函数的三维图形,

输入以下命令:

[x,y]=meshgrid(-2:0.1:2,-1:0.1:3)

z=100*(y-x.^2).^2+(1-x).^2

mesh(x,y,z)

2. 画出Rosenbrock 函数的等高线图,输入命令:

contour(x,y,z,20)

hold on

plot(-1.2,2,' o ')

text(-1.2,2,'start point')

plot(1,1,'o')

text(1,1,'solution')

3.用fminsearch函数求解

输入命令:

f='100*(x(2)-x(1)^2)^2+(1-x(1))^2'

[x,fval,exitflag,output]=fminsearch(f, [-1.2 2])

运行结果:

x =1.00001.0000

fval =1.9151e-010

exitflag = 1

output =

iterations: 108

funcCount: 202

algorithm: 'Nelder-Mead simplex direct search'

4. 用fminunc 函数

(1)建立M-文件fun2.m

function f=fun2(x)

f=100*(x(2)-x(1)^2)^2+(1-x(1))^2

(2)主程序wliti44.m

Rosenbrock函数不同算法的计算结果

可以看出,最速下降法的结果最差.因为最速下降法特别不适合于从一狭长通道到达最优解的情况.

例5 产销量的最佳安排

某厂生产一种产品有甲、乙两个牌号,讨论在产销平衡的情况下如何确定各自的产量,使总利润最大. 所谓产销平衡指工厂的产量等于市场上的销量.

符号说明

z(x1,x2)表示总利润;

p1,q1,x1分别表示甲的价格、成本、销量;

p2,q2,x2分别表示乙的价格、成本、销量;

aij,bi,λi,ci(i,j =1,2)是待定系数.

基本假设

1.价格与销量成线性关系

利润既取决于销量和价格,也依赖于产量和成本。按照市场规律,

甲的价格p1会随其销量x1的增长而降低,同时乙的销量x2的增长也

会使甲的价格有稍微的下降,可以简单地假设价格与销量成线性关系,

即: p1 = b1 - a11 x1 - a12 x2 ,b1,a11,a12 >0,且a11 >a12;

同理, p2 = b2 - a21 x1- a22 x2 ,b2,a21,a22 >0

2.成本与产量成负指数关系

甲的成本随其产量的增长而降低,且有一个渐进值,可以假设为

负指数关系,

总利润为: z(x1,x2)=(p1-q1)x1+(p2-q2)x2

若根据大量的统计数据,求出系数b1=100,a11=1,a12=0.1,b2=280,

a21=0.2,a22=2,r1=30,λ1=0.015,c1=20, r2=100,λ2=0.02,c2=30,则

问题转化为无约束优化问题:求甲,乙两个牌号的产量x1,x2,使总利润z最大.

为简化模型,先忽略成本,并令a12=0,a21=0,问题转化为求:

z1 = ( b1 - a11x1 ) x1 + ( b2 - a22x2 ) x2

的极值. 显然其解为x1 = b1/2a11 = 50, x2 = b2/2a22 = 70,

我们把它作为原问题的初始值.

模型求解

1.建立M-文件fun.m:

function f = fun(x)

y1=((100-x(1)- 0.1*x(2))-(30*exp(-0.015*x(1))+20))*x(1)

y2=((280-0.2*x(1)- 2*x(2))-(100*exp(-0.02*x(2))+30))*x(2)

f=-y1-y2

2.输入命令:

x0=[50,70]

x=fminunc(‘fun’,x0),

z=fun(x)

3.计算结果:

x=23.9025, 62.4977, z=6.4135e+003

即甲的产量为23.9025,乙的产量为62.4977,最大利润为6413.5.


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12342184.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存