就在三周前,我从一家卖方企业跳槽到一家新企业。与卖方企业相比,该企业更依赖阿里云服务器的云计算平台,以及其ECS案例和其他服务项目如SLB、RDS、OSS等。是一个很大的数量级。本文的情况是为了更好的处理阿里云服务器和ECS云服务器SSH连接的一个难题,是从发现常见故障到排除常见故障再到最后思考的一个详细的全过程。文章内容长,照片多。建议大家有空的时候认真读一读。如果没有空,就看文末的“总结与思考”部分。
发现的常见故障:
2017-05-23中午17:00前,朋友反映GitLab所属web服务器浏览发现异常。发现企业内一切都无法正常工作,GitLab网络服务器可以根据SSH连接。经过测试,发现问题确实存在。
客户自纠自查全过程(运维管理):
显示:
(1)为了方便书写和阅读,所有内容都是初始截图(在新标签页打开图片浏览初始照片),不会隐藏IP等敏感信息。请不要刻意***,如发现系统缺陷,热烈欢迎留言板留言,进一步交流;
(2)通讯记录后面的图片是通讯记录中按顺序出现的照片,供大家查阅;
(3)工作目标复杂,时间紧迫。如有疑问,请不吝赐教,见谅。
1.客户反映问题,售后工程师做了基本诊断。
2.互相帮助,互相检查
3.进一步测试问题。
4.立即跟踪进度并进一步诊断问题。
5.进一步分析确定原因。
6.找原因,解决困难。
7.售后工程师出难结果,用户反馈,下单。
问题和解决方案总结:
【困难情况】ECS云服务器的详细公有IP地址,根据SSH无法连接。提醒“连接被对等体重置”内网地址连接正常。
【解决方案】清查发现手机客户端IP扫描器服务器上的几个敏感端口号被云盾屏蔽。如果没有问题,可以按照以下方式设置授权管理通关:云盾控制面板-》DDOS安全防护-基础安全防护-点击实际案例-扫描器拦截-授权管理设置-加上源地址124.129.14.90。
总结与反思:
1.阿里云服务器的产品确实为客户提供了极大的便利,但客户也必须掌握客户自己应用的阿里云服务器产品的技术栈和相关专业知识,客户必须有自己的技术专业运维管理。
2.客户在提交问题时,要尽可能多的向问题诊断人员展示信息,以便在短时间内协助问题诊断人员准确定位。
3.在订单的整个过程中,客户要尽量展示照片,保存疑难问题的直接证据,做好中后期纠纷案件和理赔的充分准备。
4.重要的是使用枚举来减少问题的类别,区分问题的类型并应用适当的特殊工具。比如这种情况:SSH无法连接->:清除其他问题查明是网络问题->:网络问题专用工具:tcpdumpWireshark软件盘点->:辨别不是xxx的问题->:最终结论:云盾屏蔽。
5.售后工程师帮你解决困难的时候,他们要想的更多。并不是一次提交订单就说明情况完了。在这里客户必须全程配合,即时跟踪问题,掌握订单进度。
6.在整个解决问题的过程中,客户和售后要互相原谅,互相帮助,重要的是解决困难。
7.安全事故的责任问题。这次安全事故不能说完全是客户的问题。阿里云服务器的云盾确实有缺点。假设客户的企业办公互联网中存在蓄意的扫描器,云盾在检测到***后应该立即通知客户,比如在得到***威胁关联通知后,在被屏蔽并列入黑名单后应该立即通知客户。
8.对这位售后工程师的评价:其实他不容易。但是纵观整个解决困难的过程,可以发现这位技术工程师在工作能力和为客户解决困难的心态上还是有一定的困难。如果能在整个沟通过程中更加主动,在解决困难的思路上更加灵活,应该能在更短的时间内解决困难。
9.我自己的想法:
(1)作为运维管理人员,工作经验要不断积累,专业技能要不断提高,必须保持乐观的心态和处理难题时的心态;
(2)遇到难题时,要全方位考虑,找出所有可能的困难因素,逐一清除,最终解决困难;
(3)解决困难时,特殊的工具和思路很重要。在普通运维管理的整个过程中,不仅要积累工作经验和专业知识,还要关注一些问题的详细解决方案的积累,这样才能掌握合适的专用工具,快速解决困难。
(4)…………
时间有限。先说到这里,中后期再逐步整理思考。
-结束-
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)