比如囚徒困境举例吧:
clear
A=[10,10 0,20
20,0 1,1]%输入收益矩阵
Bx=[A(:,1),A(:,3)]%x参与者的收益
By=[A(:,2),A(:,4)]%y参与者的收益
x(1)=round(1+rand)%x随机初始策略
y(1)=round(1+rand)%y随机初始策略
n=20
for i=1:1:n%仿真步数
[Y,y(i+1)]=min(By(x(i),:))%y在x确定的收益选择
[X,x(i+1)]=min(Bx(:,y(i+1)))%x在y确定时的收益选择
end
ns=[x(1,n+1),y(1,n+1)]%输出纳什均衡
再比如斗鸡博弈吧:
clear
A=[10,10 0,0
0,0 1,1]%输入收益矩阵
Bx=[A(:,1),A(:,3)]%x参与者的收益
By=[A(:,2),A(:,4)]%y参与者的收益
x(1)=round(1+rand)%x随机初始策略
y(1)=round(1+rand)%y随机初始策略
n=20
for i=1:1:n%仿真步数
[Y,y(i+1)]=max(By(x(i),:))%y在x确定的收益选择
[X,x(i+1)]=max(Bx(:,y(i+1)))%x在y确定时的收益选择
end
ns=[x(1,n+1),y(1,n+1)]%输出纳什均衡
由于是仿真结果两个均衡只会随机出现一个咯
其它的差不多啦,连续分布的可以用近似啦
如果觉得好的,你就加点分啦
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)