部署Openstack报错及个人总结（更新......）_随笔

部署Openstack报错及个人总结（更新......）

openstack在部署过程中出现过许多问题，以下是自己在部署中遇到的问题总结，网上的答案千篇一律，经过不断的踩坑，自己做了一些笔记，希望能给到一点帮助

1、nova image-show 报错500
yum downgrade python-urllib3 版本1.10
yum downgrade python-requests 版本2.7

2、http启动报错
cp /usr/share/keystone/keystone.wsgi /var/www/cgi-bin/keystone/admin
cp /usr/share/keystone/keystone.wsgi /var/www/cgi-bin/keystone/main
httpd

3、neutron报timeout
/etc/neutron/neutron.conf中会有一个配置项“rpc_response_timeout”，它用来配置RPC的超时时间，默认为60s,所以导致超时异常.解决方法为设置rpc_response_timeout=180
在controller上

4、rabbitmq报错406
删除openstack用户，重新建立一个
rabbitmqctl delete_user openstack
rabbitmqctl add_user openstack RABBIT_PASS
rabbitmqctl set_permissions openstack ".*" ".*" ".*"

5、删除僵尸实例
http://www.bubuko.com/infodetail-644952.html

6、cinder创建云硬盘一直显示创建中，查看debug去抓8776然后就不动了
cinder配置文件没关联到ceph

7、dashboard能正常登陆，能做一系列的 *** 作，但在做删除 *** 作时会报如下错误
解决：在/etc/openstack-dashboard/local_settings中的import os后加入相关模块三行
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
然后重启httpd和memcached

8、dashbaord session过期后再无法登录，报错
在/etc/openstack-dashboard/local.settings 加上一行 AUTH_USER_MODEL='openstack_auth.User'

9、FWaas安装完后数据库没有对应的表，导致无法创建防火墙
su -s /bin/sh -c "neutron-db-manage --service fwaas --service_plugins openstack-neutron-fwaas upgrade head" neutron

10、raw格式的镜像修改实例密码
网络节点：yum install cloud-init
计算节点：vim /etc/nova/nova.conf 加force_config_drive=true/always
创建主机时引用文件：
#cloud-config
ssh_pwauth: true
disable_root: 0
user: root
password: abc123
chpasswd:
expire: false

11、raw格式镜像地址
centos7：http://cloud.centos.org/centos/7/images/
centos6：http://cloud.centos.org/centos/6/images/
删除clond.conf里users里的root
ubuntu：http://cloud-images.ubuntu.com/daily/server
转换镜像格式：http://docs.openstack.org/image-guide/convert-images.html

12、rabbitmq报错
2016-08-12 23:13:26.072 3683 ERROR oslo_messaging._drivers.impl_rabbit [-] AMQP server on 172.16.0.1:5672 is unreachable: [Errno 104] Connection reset by peer. Trying again in 1 seconds
：
配置文件里面rabbit-hosts 记得加“s”

13、neutron 9696端口与LB问题：
LB需要调成7层模式，会话保持与openstack一致

14、HA环境中查看vnc界面失败，刷新几下才好，再刷新又不好
在所有controller上/etc/nova/nova.conf的default模块中添加：memcached_servers = 172.16.0.1:11211,172.16.0.2:11211,172.16.0.3:11211
如果还没好：
查看netstat -lntap |grep memcache
保证监听的是0.0.0.0:11211，如果监听的是127.0.0.1，则需要修改：/etc/sysconfig/memcached
将OPTIONS="-l 127.0.0.1,::1"改成OPTIONS=""

15、修改openstack默认配额
修改controller上的nova.conf文件里面的quota选项
网络相关选项在controller上的neutron.conf里

16、cinder存储节点日志报错：(OperationalError) (1040, 'Too many connections') None None
增加mysql最大连接数

17、ceilometer meter-list报错： The service catalog is empty
修改环境变量：vim ceilometer-openrc.sh
unset OS_PROJECT_DOMAIN_ID
unset OS_USER_DOMAIN_ID
export OS_PROJECT_NAME=admin
export OS_TENANT_NAME=admin
export OS_USERNAME=admin
export OS_PASSWORD=Admin@1233
export OS_AUTH_URL=http://172.16.0.100:35357/v2.0
export OS_IMAGE_API_VERSION=2
export OS_VOLUME_API_VERSION=2

18、rabbitmq启动报错ERROR: node with name "rabbit" already running
ps aux | grep erl
kill -9 该进程

19、rabbitmq优化命令
rabbitmqctl stop
rabbitmq-server -detached

20、创建实例一直显示scheduling，nova-schedul日志一直调度：
有一台计算节点坏了，但是dashboard上没有关闭这个坏的计算节点，先将其关闭，然后重启计算节点上的nova-compute服务

21、cinder-volumes云硬盘dashboard和命令都删不掉：
进入数据库：
>UPDATE volumes SET attach_status='detached',status="available" WHERe id='647d95ff-851d-415c-aba6-9419e5541758';

22、查看镜像报错：The resource could not be found. (HTTP 404)
Deferring keystone exception: The plugin token_endpoint could not be found
删除当前环境变量： unset OS_TOKEN OS_URL
重新创建：. admin-openrc

23、通过libvirt-set-admin-password方式修改实例登录密码：
安装相关软件（计算+控制）：
libvirt 1.2.16+ 宿主机
python-libvirt 1.2.16+ 宿主机
qemu-guest-agent 2.3+ 虚机内部 https://launchpad.net/ubuntu/+source/qemu
虚机镜像除了要安装qemu-guest-agent外，镜像本身还要设置hw_qemu_guest_agent属性：
json文件在控制节点/etc/glance/metadefs目录下
导入元数据文件：compute-libvirt-image.json
# glance-manage db_load_metadefs 导入所有默认的元数据文件
在镜像处选择更新元数据： libvirt Driver Options for Images 下的hw_qemu_guest_agent的值为yes。
在控制节点：
# nova list
# nova root-password 实例名字
New password:
Again:

24、使用ovs安全组策略不生效：
在计算节点的openvswitch_agent.ini文件里的[securitygroup]模块下添加：：
enable_ipset = True
enable_security_group = True
firewall_driver = neutron.agent.linux.iptables_firewall.OVSHybridIptablesFirewallDriver
开启所有计算节点的iptables服务

25、dashboard上面调整云主机大小不生效，计算节点报错：
原因：
OpenStack的云主机配置类型的修改，其实相当于做了一个云主机在不同宿主机的迁移，所以需要在相关迁移云主机进行无密码访问，由于OpenStack是由Nova组件来管理云主机，所以需要对Nova用户进行无密码访问。
需要配置各节点的ssh无密码访问

26、更改云主机密码
nova meta 主机名 set changePasswd=True admin_pass=密码

27、云主机热迁移配置：
所有计算节点：
vim /etc/nova/nova.conf
在[libvirt]下添加：
live_migration_flag = VIR_MIGRATE_UNDEFINE_SOURCE,VIR_MIGRATE_PEER2PEER,VIR_MIGRATE_LIVE,VIR_MIGRATE_PERSIST_DEST,VIR_MIGRATE_TUNNELLED
vim /etc/libvirt/libvirtd.conf
添加：
listen_tls = 0
listen_tcp = 1
auth_tcp = "none"
tcp_port = "16509"
listen_addr = "本机IP"
vim /etc/sysconfig/libvirtd
添加：LIBVIRTD_ARGS="--listen"
# service openstack-nova-compute restart
# service libvirtd restart
# netstat -lntp|grep 16509 如果有端口就成功了

28、配置云主机实例cpu型号和物理机一致：
修改所有计算节点：
# vim /etc/nova/nova.conf
在[libvirt]下添加cpu_mode=host-passthrough
如果想指定某个型号：
cpu_mode=custom
cpu_model=型号
（支持的型号列表文件： /usr/share/libvirt/cpu_map.xml）
注意：型号要和物理机兼容，否则云主机系统起不来

29、Authorization Failure. Authorization failed: Unable to establish connection to http://controller:5000/v3/auth/tokens

检查端口35357和5000是否没有启动

这两个端口对应的httpd服务

只需重启Apache即可

Systemctl restart httpd.service34

使用/usr/local/nginx/sbin/nginx -s reload 重新读取配置文件出错

[root@localhost nginx]/usr/local/nginx/sbin/nginx -s reload

提示 nginx: [error] invalid PID number "" in "/usr/local/nginx/logs/nginx.pid"

[root@localhost nginx]# cd logs

[root@localhost logs]# ls

access.log error.log nginx-access.log nginx_error.log

果然没有/usr/local/nginx/logs/nginx.pid 文件

解决方法：

[root@localhost nginx]/usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5699955.html

部署Openstack报错及个人总结（更新......）

发表评论

评论列表（0条）