服务器运行监控(服务器系统监控)

随着单位信息化的发展,单位机房里面服务器等IT设备越来越重要,有业务系统,WEB系统,APP后台系统,数据库系统等,都在服务器上运行,如何对这些重要服务器的正常运行提供保障,进行实时监控,及时预警,是很重要的运维环节。

服务器的监控主要包括几个方面,

1、 服务器硬件层面的监控

指不需依赖操作系统,实现对硬件运行状态进行监控和管理,监控方式主要包括服务器主板支持的IPMI协议,服务器带外管理接口的SNMP协议,目前大部分服务器厂家,如华为、联想、浪潮、署光、HP、IBM、DELL等品牌服务器主板都支持IPMI协议或管理口支持SNMP协议。华为服务器通过BMC或iMana接口、IBM服务器通过IMM接口、HP服务器通过ILO接口或SIM AGENT程序、 DELL服务器通过IDRAC接口或OMSA都可深入监控服务器硬件运行状态。IBM、HP等刀片服务器设备,可以通过主板管理接口可以监控其硬件状态。

另外LINUX\UNIX\AIX服务器也可以使用SSH的方式监控硬件状态,WINDOWS系统的服务器也可以使用WMI或AGNET客户端的方式监控硬件状态,

服务器硬件状态主要监控内容包括:

监控机箱风扇转速和状态、机箱内部温度和CPU温度、电源电压和状态、电流状态、模块的状态、CPU状态、内存状态、主板状态、RAID卡状态、物理磁盘状态,CMOS电池电压等。

如下图所示,(本文截图以飞思网巡服务器监控产品为例)。

(飞思网巡产品监控截图,华为服务器硬件状态和监控)(飞思网巡产品监控截图,WINDOWS通过AGENT方式监控)

2、 服务器操作系统层面的监控

通过SNMP / SSH / WMI / Agent等方式支持对服务器中操作系统运行及性能状态进行监控。当前支持Windows、Linux、麒麟LIUNX、红旗LINUX、UOS、深度OS、UNIX、AIX、HP-Unix、VMware、Citrix Xen、Solaris 、OS/400等操作系统。

主要监控内容包括:

A、 CPU使用率/内存使用率/磁盘空间使用率/磁盘IO读写速率/网口状态和接口流量等。B、接口错误包率/丢包率/广播包率等。C、系统应用/进程状态/进程负载和系统服务等。(飞思网巡产品监控截图,监控WINDOWS操作系统状态)

3、 服务器上运行软件业务方面的监控

对单位广泛应用的业务系统/OA办公软件/ERP软件/WEB系统/邮件系统/中间件软件等,对服务的详细运行状态和性能参数进行监控。主要包括Apache、Nginx、IIS、Tomcat、WebSphere、WebLogic、ActiveMQ等。模块化的框架设计,让系统通过扩展各种类型监测器,可以对更多应用进行深入监控。

通过模拟访问的方式,对任意操作系统上运行的HTTP、HTTPS、FTP、Telnet、FTP、ICMP、IMAP、Pop3、SMTP、URL及任意TCP端口上的应用服务的可用性、访问质量等进行监控。URL监控,通过模拟访问可以监控任意URL网页是否可以正常访问。

(飞思网巡产品监控截图,监控业务系统运行状态)(飞思网巡产品监控截图,WEBLOGIC运行状态监控)

4、 服务器上运行的数据库进行监控

数据库作为信息化系统重要的组成部分,对业务系统的稳定运行起到关键作用。监控系统主要使用模拟访问方式,对主流的数据库的性能参数进行监控。监控颗粒度非常细,为管理员提供更详尽的信息,更易优化数据库性能。常用数据库包括Oracle、MSSQL Server、Mysql、DB2、Sybase、达梦、Kingbase (人大金仓)、PostgreSQL等。

(飞思网巡产品监控截图,ORACLE数据库运行状态监控)

5、 对服务器进行远程控制

当需要对服务器进行远程维护,或有相应故障时,通过服务器远程带外接口,可以实现对服务器进行远程开机、关机或重启服务器。(授权情况下),也可在WEB界面快速对服务器进行IPKVM / VNC远程桌面/ Telnet/SSH/WINDOWS终端连接等操作。

结合飞思网巡动环监控,当机房温度过高、市电断开,或UPS电量不够的情况下,可以联动服务器进行自动正常关机。以保护服务器的重要数据不受损失。

(飞思网巡产品监控截图,服务器IPKVM远程连接)

6、预警方式

系统可设置多级预警阀值,预警方式,一般包括邮件、短信、弹窗、声音、声光报警、微信报警、电话语音、企业微信、云平台等多种方式预警,可自定义告警信息内容。管理员可进行值班表管理、人员分组和进行告警升级设置。

(飞思网巡产品监控截图,微信及云平台监控预警)(飞思网巡产品监控截图,自动扫描生成网络拓扑,监控运行状态)