Agilent IO monitor怎么没有信息显示？Start之后是空的_服务器

应用平台：Win9x/NT/2000/XP/2003上网IP信息显示工具-IPMonitor，能够显示您上网的本机IP(LocalIPAddress)，以及公开IP(PublicIPAddress)，特色有：1)可以选择所要监控的网络卡；2)可以选择更新频率(1~60分钟)；3)可以切换显示本机或公开IP。ipMonitoripMonitor为网络，服务器和应用程序可用性监控提供经济，完备和即可使用的解决方案，只需数分钟就能完成安装-让你对网络状况一目了然。ipMonitor通过如下途径简化网络管理：快速发现基于IP的网络设备，并自动推荐监控每个设备的设置-能节省你大量的时间，因为无需任何手动配置想要创造性地监控动态目录DNS，MSExchange，FTP，Web，IMAP，MSSQLServer，SMTP，等等通过模拟处理模拟最终用户的反应时间自动化恢复和补救行动以减少停机时间提供尖端的用户界面，使你可以迅速地浏览详细的网络数据，快速定位信息，并对你的网络和应用程序架构状况一目了然。

轻量应用服务器到期后，会将服务器关机，7 天内数据保留，用户可以续费。超过 7 天后未续费，服务器将会被释放。
云服务器技术原理：分布式存储用于将大量服务器整合为一台超级计算机，提供大量的数据存储和处理服务。分布式文件系统、分布式数据库允许访问共同存储资源，实现应用数据文件的IO共享。
通过API接口对云主机资源进行调配，实现对KVM的一键式系统安装、备份、远程重启、状态监控等功能。
百度开放云平台平台的每个集群节点被部署在互联网的骨干机房，可独立提供计算、存储、在线备份、托管、带宽等互联网基础设施服务。

眼下，中国共计装有近2亿个视频监控摄像头，而具备AI能力的摄像头仅占其中的1%。

在高清监控摄像头数量与AI渗透率不断递增的情况下，由摄像头采集的图像、视频流数据，需要更强大的分析引擎对其进行分析、处理和训练。

以北京地铁站为例，北京1000多个地铁站中平均每站都有上百个摄像头，平均每个地铁站每天流通8到10万人较为常见。保守预估每个相机每天看见1万个人，再假设对比库中有1万个目标（对于公安数据库来说并不大），这个相机每天要回答的问题就是一亿零一万个！

显然，在当前各类安防项目中，依靠纯嵌入式智能DVR和NVR均无法满足严苛的计算要求。

面对万亿级AI安防市场，在技术落地成花的十字路口，所有的安防企业高管们都会面对一个终极命题：AI安防究竟需要一款怎样强大的服务器？
谈到安防服务器，X86无处不在，一直以来，它都是包括安防在内等多个行业的“宠儿”。

“眼下安防市场很多的管理平台，譬如流媒体服务器、转发服务器、主控服务器基本基于X86架构建设，它的最大优势是比较容易开发、上手比较快，大多工程师更擅长在X86架构上做研发。”

华泰科捷CEO傅剑辉告诉雷锋网，考虑到它表现不俗的性价比，X86服务器一直都是我们采购的首选。

由此，过去多年来，X86服务器也获得了全球顶尖服务器供货商的青睐。

遗憾的是，各科成绩均“达标”的 X86服务器，在如今大热的AI浪潮面前，却遇到了一些“偏科”难题。

傅剑辉透露，从安防用户实际使用角度考量，目前X86服务器应用在安防行业主要存在三大问题：

一、CPU负责逻辑运算的单元并不多，在多任务处理时效率低下。面对海量视频信息，传统X86服务器单纯以CPU为核心的数据中心部署已经不能很好地满足并行灵活计算、多变环境的计算需求，很难在安防企业级服务器市场有惊艳的表现。

“以前的视频数据只需存在后台，做少量分析即可，也就是说存储足够大就行；今天，很多客户都希望我们能够实时处理这些海量视频信息并反馈结果，而这就意味着系统需要同时做解码、做视频结构化、做识别、搜索等等，X86明显就不够用了。”

换句话说，X86可以类比手机里的功能机，它能够满足单一的通信处理需求，而AI融入的安防市场，更需要一台强大的智能手机，配备更强大的性能以适配游戏、处理等个性需求。

二、在行业出现算力不够的大背景下，很多厂商打出X86服务器加上若干GPU卡的组合拳，而这种为了单纯解决算力而“拼凑”出的方案大大增加了服务器的功耗和用户成本。

从行业采用情况看，如果涉及人脸识别等AI项目时，大部分厂商会采用GPU作为人像数据结构化的处理单元，特别是在X86服务器集群中，GPU更是成为唯一选择。

在某种程度上，GPU的确解决了部分算力不足的问题，却也存在两个致命硬伤。

一是功耗大，需依托X86架构服务器运行，不适用于更为广泛的AI方案开发；二是成本高昂，比如采用GPU方案，折算单路人脸识别成本在万元以上，相较其他千元级，甚至是百元级的方案，毫无成本优势可言，这两个致命短板，也让很多企业不得不寻求新的方案。

三、由于X86更多采用的是较为开放的LinuX系统，而非封闭的AIX系统，在稳定性和可维护性上略显不足。

“未来的市场必定是数据规模和计算能力的角逐。”

浪潮商用机器有限公司产品部张琪告诉雷锋网，随着越来越多新应用的出现，传统的X86计算架构会遇到很多瓶颈，包括数据瓶颈（处理器的计算单元以多快的速度获取和交换数据）、计算瓶颈（单位空间内能集成多少计算能力）、延迟瓶颈、通信瓶颈。

就像设计时速30码的道路难以承载均速100码的车辆通行一样，很短时间内就可造成道路拥堵甚至瘫痪。

今天来看，面对大计算、智能化场景，谁能够最先解决算力问题，又能够更好降低功耗与成本，谁就能在AI浪潮下引领鳌头。

在张琪看来，基于POWER9的高性能服务器能够很好满足AI安防时代下的高智能需求。
从AI安防实际场景所需出发，浪潮商用机器有限公司近期推出了基于POWER9服务器，搭载UltraVision视频智能分析系统的AI视觉分析智能分析解决方案(UltraVision on Power)。

AI视觉分析解决方案可以看作一个超级高效的AI大脑，它软硬结合，能够实时、准确、智能、节能地完成包括安防在内各个行业所需的复杂性数据处理工作。

“硬”，体现在POWER9架构上，它能够提供强大的图像视频的计算处理能力。相比其他处理器，POWER9支持了PCIe40、NVlink20等新一代I/O协议，能够在AI等应用中展示出更好的应用表现。

具体来看，相比X86，其单节点视频处理路数提升近3倍，达38倍提升深度学习框架AI模型训练效率，18倍更好的加速数据库性能，IO能力提升了近5倍。

另外，执行视频和图像编解码，查询搜索任务时，整机可提供单精度56TFlops和双精度28TFlops超强算力，和比X86服务器相比，单块GPU即可提供比纯CPU服务器高30倍的推理能力。

值得一提的是，该方案独有的CAPI技术，可以将延迟降低至1/36，全面加速图像处理，同时功耗降低高达30%。

18倍、38倍、3倍、5倍、30倍，看起来不大的几个数字对于安防行业来说，都是庞大数量级的提升。

这几个数字的变化，能够将各类犯罪和严重的暴力事件的防控手段从事后介入提前到事前或事中，大大减少安全事件的发生，实现公共安全从被动防御到主动防御的业务转变。

除了POWER9提供的超强算力硬核外，在软件层面，该方案还有高重UltraVision视频智能分析技术加持，如目标检测（PD）、行人重识别（RE-ID）等多项计算机视觉技术，提升目标识别准确率高达94%。

毋庸置疑，软硬结合的AI视觉分析解决方案在实际落地过程中，能够实实在在地为用户解决AI时代下的高算力与低功耗问题。

除此之外，相比其他热门方案，该方案还有两大优势不得不提。

其一、独有的利旧能力降低客户成本。

通常来说，一般的AI视频系统想要实现某些功能必须接入具备AI技术的感知摄像头，该方案在部署过程中不需要更换原有摄像头，只需要旁路接入视频采集端，即可实现AI系统；

另外，该方案还可以兼容不同品牌、不同制式的任何摄像头；可以不改变客户原服务器等硬件架构的情况下直接部署，有效降低客户部署成本。

其二、就浪潮商用机器公司本身来说，依托其在服务器领域的引领地位，拥有强大的定制化落地能力，缩短交付周期从月到天。
该方案无论是面对大数据处理、机器学习这样的AI应用，还是软件定义存储、内存数据库这一类的开源应用都会有比较好的性能表现。

毫无疑问，专为AI、云计算、大数据等新兴应用而生的AI视觉分析解决方案在客户面对严苛业务挑战时，提供了更多元化的选择。

依托这款高性能产品，用户可以更快地部署各类智能应用，缩短安防AI应用的技术迭代周期。

与此同时，性能卓越的浪潮商用机器服务器的应用不仅限于安防行业，在互联网、金融等对安全性要求高的领域，其也可以施展拳脚。

安防之外，整个社会正在向规模化、自动化、智能化转型升级。其中，智能化的应用方向涵盖四大方向：前端化、云端化、平台化和行业化。

在这个升级过程中，新的平台需要有新的能力做新的认知，新的认知催生新的需求和应用。

对于包括浪潮在内的科技公司来说，这是一次巨大的机会，同时也是一个不小的挑战，路漫漫其修远兮，必须上下而求索。雷锋网雷锋网雷锋网

cpu/带宽使用正常，磁盘IO占用过高，建议你检查服务器当时时间点是否有读写进程任务导致（Windows服务器任务管理器—性能—资源监控器—磁盘查看磁盘活动进程和磁盘读写，Linux服务器可以通过top，iostat等命令查看），你也可以检查数据库日志检查你的数据库是否存在慢查询、死锁、全表扫描导致，或者你可以通过使用云监控监控进程的磁盘IO读写。如果遇到问题你可以通过阿里云的售后支持-提交工单咨询。

运维人员的工作每天基本上都是在检查问题，枯燥但又重要， 要是你的某一个环节出现问题并没有及时发现问题，对于企业来说损失可能非常大，基本上运维人每天的工作我罗列了下，有这几种：

1、负责服务器的硬件配置、软件安装、机房上下架等技术维护工作

2、负责虚拟化技术产品物理机配置、管理和日常运行监控和维护

3、负责独立主机或虚拟应用产品的开通使用、日常维护、故障诊断和排除

4、提供独立主机或虚拟应用客户产品 *** 作和应用方面的技术支持

5、监视分管的服务器，及时发现问题，并积极解决问题

现在信息化数字时代，单靠人工去检查出现错误几率会很大，而且有的运维人还不只管理两台服务器，像我们公司的运维每人至少要管理30台服务器，这样子单靠人工运维耗费的人工成本和时间是非常大的，所以还是推荐你用运维工具吧，比如云帮手（）

1支持跨云商批量管理服务器

2兼容性强大，兼容市面基本所有的云商云主机，兼容 *** 作系统；

3 *** 作简单，可视化界面预览资源、一键修复、一键部署；

4 可以远程登录云主机FTP桌面，处理云主机上的文件；

5监控和资源还有告警功能，这个是挺好的，不用盯着看；

6系统修复功能，这个是挺实用也比较必须的；

7免费使用。总得来说功能还是挺全的，不存在需要又要另外找软件的尴尬。

你好，很高兴回答你这个问题。从运维的角度来讲，服务器的数量少并不意味着我们的运维工作就非常轻松，相反我们更应该重视此阶段的工作。

我们可以从以下几方面来开展我们的运维工作：

1应用服务器

我们可以从当前服务器中找出 至少2个节点装Vsphere虚拟化，建立一个数据中心、集群 ；如果你的服务器有多网卡和SCSI，还可以做一些更高级的应用，如vmotion、负载均衡、高可用等。当虚拟机或服务器故障，可以 实现故障自动转移，有效的避免了单节点的故障，提供服务器的容错率 。

我们可以在新建的虚拟机部署Web、API等各种应用，而且 虚拟机可以在vCenter图形化界面下统一管理 。这一般是中小公司的在服务器方面的解决方案。

当然，我们对docker比较熟悉，可以使用一套docker解决方案，这比Vsphere更能节省一部分资源。当然这个需要的技能要求也比较高，需要我们不断积累。

2数据库服务器

数据库服务器在此我们单独拿出来，是因为数据库对服务器性能、磁盘IO要求比较高，不太建议使用虚拟机，当然这需要根据业务的实际情况来做选择。 数据库我们需要通过一主一从、一主二从的方式实现高可用，来避免数据库单点问 题，我们还可以选择合适的proxy来进行读写分离、读负载均衡等。另外还要考虑数据的本地备份、异地备份，来确保数据可恢复。

3系统监控

当我们在应用服务器和数据库服务器上线一套系统后， 我们需要通过监控掌握从服务器硬件、基础状态、应用、数据库等从下到上的运行状态 ，以便我们能够对告警及时做出响应。考虑到报警的及时性，我们需要监控接入多种报警渠道，如微信、钉钉、邮件、短信等。监控的目的是发现问题、解决访问，因此我们需要踏实的做好这一步，才能为我们的业务保驾护航。

好了，其实不管服务器多少，我们都需要扎实的把基础打好，这样才能以不变应万变面对各种情形。希望我的回答能够帮到你。

题主没有详细说明具体应用系统的功能，比如是否单一的Web服务？有没有微服务、分布式、集群化扩展的潜在需求？

通常来说，建议使用云服务自动化运维。云服务已经成为IT技术的核心基础设施，充分利用云服务带来的d性和分布式优势，赋能自动化运维。

一，自动构建系统

如果需要构建应用，那么就建议配置使用CI/CD持续化集成和自动化部署，比如常用的Jenkins，配置Git代码提交时触发构建，然后自动部署。

二，日志收集处理系统

1，ELK是常见的日志收集管理系统，包括ElasticSearch, LogStash, Kibana三个服务，架构示意图如下：

2，在ELK系统中，Kibana是一个图形化展示工具，配置查询条件，运维人员随时可以搜索指定日志信息，分析处理故障。

三，服务监控

1，云监控CloudMonitor

主流云服务商都将监控功能集成到了基础架构中，以阿里云为例，云监控提供了多种配置，多维度全方位监控。

比如配置CPU使用率到达80%时，自动触发动作，增加服务器实例，同时邮件通知运维人员。

2，应用监控

以监控宝为例，配置服务地址，选择分布在不同地区和运营商的监测点。当监测点不能正常调用配置的服务地址时，将收到警告信息，可以选择邮件、短信、电话等通知方式。

四，潜在的系统扩展需求

1，是否集群化部署？需要AutoScaling自动伸缩吗？

小型化和集群化并不冲突。如果采用集群化部署，可以配置触发条件，满足时自动增加或者释放服务器资源。比如当CPU使用率达到75%或者内存占用率达到75%时，根据配置好的服务器和数量，自动触发。

2，是否使用Docker容器技术？

Docker将应用以及依赖打包到一个可移植的镜像中，可以实现虚拟化，有助于快捷高效的交付应用，结合Docker-compose资源编排，快速实现自动部署更新，不再需要常用的Jenkins构建服务器。

机器数比较小的话，你可以用云的服务器，这样可以节省好多钱。找一个专门的运维，还不如让开发自己来搞，因为机器少运维他也应付得过来。现在都在搞云计算了，把你的机器放上阿里云或者腾讯云，你自己维护好很多，包括网络贷款都很容易扩容。上面这个我说到的只是说建议你如果你已经是自己的机器了。我建议你从我下面所说的来搞。

认为的整个过程的话一般分为三个阶段，第一的话是手工阶段，什么东西都是手工搞。

第2个阶段就是脚本阶段了，本来手工搞的东西全部脚本化。

第3个阶段就是平台化了，平台化了之后，所有东西都在页面上完成系统完成，不需要人工来干预，甚至不用运维来搞。

有一些人说既然认为就是最后的一个阶段，但是这个很不成熟。所以我就不说了。

针对你这个机器数少的，你可以手工认为，或者说用脚本认为都没问题。

在合适的阶段做合适的事情就是最好的。所以我建议你手工运维或者脚本运维。

我们项目用的 wgcloud运维监控系统 ，它前身是开源项目，后来推出的商业版，也有免费版

wgcloud运行很稳定，性能很好，部署和上手容易

wgcloud支持主机各种指标监控(cpu状态/温度，内存状态，磁盘容量/IO，硬盘smart监控，系统负载，网卡流量，硬件系统信息等)，数据可视化，进程应用监控，大屏可视化，服务接口检测，DOCKER监控，自动生成网络拓扑图，端口监控，日志文件监控，web SSH（堡垒机），指令下发执行，告警信息推送（邮件钉钉微信短信等）

可以装虚拟机代替，在同一个局域网情况下

找服务商外包服务，或者网上托管也不贵收费

服务器数量比较少，比如10台服务器，基本可以不设置运维岗位了，后端开发人员或者架构师就能搞定。

我就是那种曾经在创业的小公司待过的开发人员，开发，运维我都干了。

但是想想如何更科学更高效的运维还是很有必要的。

运维的目的

软件系统的运行时环境：即公司的业务产线，靠它创造业务价值，这个是最核心的功能诉求。

实时监控系统: 任何时候都要对当前公司的产线的压力一清二楚，有问题功能随时解决，有性能问题及时扩容或者回收资源

降低服务器成本：在业务萎缩的情况下，准确评估哪些资源可以回收，降低服务器的支出

这个是当时我认为的运维的三个主要目的。

运维方案

开发半路出家，当时采用的是shell+python+ansible+jekins+elk的方式

首先，我会及时的更新业务产线的物理架构图，根据架构图来规划服务器的资源使用。

比如多少个web服务，数据库多少，zk,kafka,redis集群怎么分布。

集群部署一般是放在多个服务器上的，这个时候ansible就派上用场了。

jekins主要用来自动发布更新程序已经做定时回收磁盘的任务。

elk主要用来做应用的日志系统和监控告警；可以通过看板随时知道产线的请求数量和并发数量；

以上的运维方案适用于小公司。运维工程师看到了可以补充

搞个zabbix刷

数量少。如果配置好可以虚拟化。然后跑容器

是云服务器磁盘中经常提到的概念。
IO是云服务器磁盘中经常提到的概念。I/O（input/output）字面理解就是输入/输出，输入指的是对磁盘写入数据，输出指的是从磁盘读出数据。
云服务器(Elastic Compute Service， ECS)是一种简单高效、安全可靠、处理能力可d性伸缩的计算服务。

1、首先是对于CPU的说明
服务器CPU性能参数主要信息可以通过查看 /proc/cpuinfo 获得。具体查看指令及效果如下：

显示这台服务器上有2个物理CPU

显示这台服务器的物理核数为16个

显示运行模式为64位

显示为Intel(R) Xeon(R) Gold 6226R CPU @ 290GHz

命令：

显示此服务器的线程数为64

top命令是Linux下常用的性能分析工具，能够实时显示系统中各个进程的资源占用状况，类似于Windows的任务管理器。下面详细介绍它的使用方法。top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态如果在前台执行该命令,它将独占前台,直到用户终止该程序为止比较准确的说,top命令提供了实时的对系统处理器的状态监视它将显示系统中CPU最“敏感”的任务列表该命令可以按CPU使用内存使用和执行时间对任务进行排序；而且该命令的很多特性都可以通过交互式命令或者在个人定制文件中进行设定

1．命令格式：

top [参数]

2．命令功能：

显示当前系统正在执行的进程的相关信息，包括进程ID、内存占用率、CPU占用率等

3．命令参数：

-b 批处理

-c 显示完整的治命令

-I 忽略失效过程

-s 保密模式

-S 累积模式

-i<时间> 设置间隔时间

-u<用户名> 指定用户名

-p<进程号> 指定进程

-n<次数> 循环显示的次数

4．使用实例：

实例1：通过 Top 命令显示进程信息

命令：

统计信息区：

前五行是当前系统情况整体的统计信息区。下面我们看每一行信息的具体意义。

第一行，任务队列信息，同 uptime 命令的执行结果，具体参数说明情况如下：

10:38:58 — 当前系统时间

up 39 days, 19:47 — 系统已经运行了39天19小时47分钟（在这期间系统没有重启过的吆！）

1 users — 当前有1个用户登录系统

load average: 000, 000, 000 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。

load average数据是每隔5秒钟检查一次活跃的进程数，然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量，结果高于5的时候就表明系统在超负荷运转了。

第二行，Tasks — 任务（进程），具体信息说明如下：

系统现在共有769个进程，其中处于运行中的有1个，463个在休眠（sleep），stoped状态的有0个，zombie状态（僵尸）的有0个。

第三行，cpu状态信息，具体属性说明如下：

00%us — 用户空间占用CPU的百分比。

00% sy — 内核空间占用CPU的百分比。

00% ni — 改变过优先级的进程占用CPU的百分比

1000% id — 空闲CPU百分比

00% wa — IO等待占用CPU的百分比

00% hi — 硬中断（Hardware IRQ）占用CPU的百分比

00% si — 软中断（Software Interrupts）占用CPU的百分比

备注：在这里CPU的使用比率和windows概念不同，需要理解linux系统用户空间和内核空间的相关知识！

第四行,内存状态，具体信息如下：

65600012k total — 物理内存总量

1785256k used — 使用中的内存总量

62385920k free — 空闲内存总量

1428836k buffers — 缓存的内存量

第五行，swap交换分区信息，具体信息说明如下：

2097148k total — 交换区总量

918340k used — 使用的交换区总量

1178808k free — 空闲交换区总量

备注：

第四行中使用中的内存总量（used）指的是现在系统内核控制的内存数，空闲内存总量（free）是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中，还包括过去使用过的现在可以被重复利用的内存，内核并不把这些可被重新使用的内存交还到free中去，因此在linux上free内存会越来越少，但不用为此担心。

对于内存监控，在top里我们要时刻监控第五行swap交换分区的used，如果这个数值在不断的变化，说明内核在不断进行内存和swap的数据交换，这是真正的内存不够用了。

第六行，空行。

第七行以下：各进程（任务）的状态监控，项目列信息说明如下：

PID — 进程id

USER — 进程所有者

PR — 进程优先级

NI — nice值。负值表示高优先级，正值表示低优先级

VIRT — 进程使用的虚拟内存总量，单位kb。VIRT=SWAP+RES

RES — 进程使用的、未被换出的物理内存大小，单位kb。RES=CODE+DATA

SHR — 共享内存大小，单位kb

S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程

%CPU — 上次更新到现在的CPU时间占用百分比

%MEM — 进程使用的物理内存百分比

TIME+ — 进程使用的CPU时间总计，单位1/100秒

COMMAND — 进程名称（命令名/命令行）

或者通过 free 命令显示系统内存的使用情况，包括物理内存、交换内存(swap)和内核缓冲区内存。

命令：

显示我当前的服务器的物理内存是62G，其中交换内存是2个G，一共剩余是60G的

三、查看Linux内核当前的系统版本号

命令：

显示的当前的服务器Linux内核是Ubuntu系统，版本号是18046

1、查看主机网卡流量
#!/bin/bash
#network
#MikeXu
while : ; do
time=’date +%m”-”%d” “%k”:”%M’
day=’date +%m”-”%d’
rx_before=’ifconfig eth0|sed -n “8″p|awk ‘{print $2}’|cut -c7-’
tx_before=’ifconfig eth0|sed -n “8″p|awk ‘{print $6}’|cut -c7-’
sleep 2
rx_after=’ifconfig eth0|sed -n “8″p|awk ‘{print $2}’|cut -c7-’
tx_after=’ifconfig eth0|sed -n “8″p|awk ‘{print $6}’|cut -c7-’
rx_result=$[(rx_after-rx_before)/256]
tx_result=$[(tx_after-tx_before)/256]
echo “$time Now_In_Speed: “$rx_result”kbps Now_OUt_Speed: “$tx_result”kbps”
sleep 2
done
2、系统状况监控
#!/bin/sh
#systemstatsh
#MikeXu
ip=1921681227
top -n 2| grep “Cpu” >>/temp/cputxt
free -m | grep “Mem” >> /temp/memtxt
df -k | grep “sda1″ >> /temp/drive_sda1txt
#df -k | grep sda2 >> /temp/drive_sda2txt
df -k | grep “/mnt/storage_0″ >> /temp/mnt_storage_0txt
df -k | grep “/mnt/storage_pic” >> /temp/mnt_storage_pictxt
time=`date +%m””%d” “%k”:”%M`
connect=`netstat -na | grep “21923814830:80″ | wc -l`
echo “$time $connect” >> /temp/connect_counttxt
3、监控主机的磁盘空间,当使用空间超过90％就通过发mail来发警告
#!/bin/bash
#monitor available disk space
SPACE=’df | sed -n ‘/ / $ / p’ | gawk ‘{print $5}’ | sed ’s/%//’
if [ $SPACE -ge 90 ]
then
fty89@163com
fi
4、监控CPU和内存的使用情况
#!/bin/bash
#script to capture system statistics
OUTFILE=/home/xu/capstatscsv
DATE=’date +%m/%d/%Y’
TIME=’date +%k:%m:%s’
TIMEOUT=’uptime’
VMOUT=’vmstat 1 2′
users=’echo $TIMEOUT | gawk ‘{print $4}’ ‘
LOAD=’echo $TIMEOUT | gawk ‘{print $9}’ | sed “s/,//’ ‘
FREE=’echo $VMOUT | sed -n ‘/[0-9]/p’ | sed -n ’2p’ | gawk ‘{print $4} ‘ ‘
IDLE=’echo $VMOUT | sed -n ‘/[0-9]/p’ | sed -n ’2p’ |gawk ‘{print $15}’ ‘
echo “$DATE,$TIME,$USERS,$LOAD,$FREE,$IDLE” >> $OUTFILE
5、全方位监控主机
#!/bin/bash
# check_xush
# 0 /home/check_xush
DAT=”`date +%Y%m%d`”
HOUR=”`date +%H`”
DIR=”/home/oslog/host_${DAT}/${HOUR}”
DELAY=60
COUNT=60
# whether the responsible directory exist
if ! test -d ${DIR}
then
/bin/mkdir -p ${DIR}
fi
# general check
export TERM=linux
/usr/bin/top -b -d ${DELAY} -n ${COUNT} > ${DIR}/top_${DAT}log 2>&1 &
# cpu check
/usr/bin/sar -u ${DELAY} ${COUNT} > ${DIR}/cpu_${DAT}log 2>&1 &
#/usr/bin/mpstat -P 0 ${DELAY} ${COUNT} > ${DIR}/cpu_0_${DAT}log 2>&1 &
#/usr/bin/mpstat -P 1 ${DELAY} ${COUNT} > ${DIR}/cpu_1_${DAT}log 2>&1 &
# memory check
/usr/bin/vmstat ${DELAY} ${COUNT} > ${DIR}/vmstat_${DAT}log 2>&1 &
# I/O check
/usr/bin/iostat ${DELAY} ${COUNT} > ${DIR}/iostat_${DAT}log 2>&1 &
# network check
/usr/bin/sar -n DEV ${DELAY} ${COUNT} > ${DIR}/net_${DAT}log 2>&1 &
#/usr/bin/sar -n EDEV ${DELAY} ${COUNT} > ${DIR}/net_edev_${DAT}log 2>&1 &
放在crontab里每小时自动执行：
0 /home/check_xush
这样会在/home/oslog/host_yyyymmdd/hh目录下生成各小时cpu、内存、网络，IO的统计数据。如果某个时间段产生问题了，就可以去看对应的日志信息，看看当时的主机性能如何。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zz/12626192.html

Agilent IO monitor怎么没有信息显示？Start之后是空的

发表评论

评论列表（0条）