服务器是网络中最为关键的一个部分,对于网络的正常运行起着至关重要的保障作用。对服务器的管理,也成为IT部分最为重要的日常工作之一。为了节省工作时间,提高工作效率,减轻IT部门运维人员的工作效率,IT部门逐渐开始引进自动化、智能化的系统管理软件。
下面,我们就通过介绍现在流行的SiteView系统管理软件对服务器的管理,向大家展示系统管理软件的强大功能和作用。在对服务器的管理中,SiteView主要从服务器监测原理和服务器管理方案两个角度展开。其中,服务器管理方案主要从主机运行状况监测、服务与进程管理、网络状况管理、系统端口、日志管理和故障自动恢复等六个方面进行。
为确保服务器高速、稳定运转,SiteView从多个方面对主机服务器的硬件设备及操作系统进行监控管理和性能管理。它通过采集服务器的CPU、内存、硬盘、网卡等硬件的关键运行参数,以及软件和应用程序的进程、服务、端口等的运行状况,对系统日志进行分类扫描查询。通过数据采集和分析,SiteView能够及时对影响服务器运行性能的故障事件发送报警,并采取相应的故障处理措施,保证服务器的正常安全运行。
SiteView与服务器相关的监测器有30多种,其中主要包括采集服务器CPU、内存、磁盘空间、服务、进程、网卡、错误日志、Windows事件日志、UNIX LOG文件、文件和目录等数据的监测器。
服务器监测原理
SiteView的服务器监测模块支持多种协议对服务器系统进行监测,运行在Windows平台,不需要在被监测的服务器上安装任何代理软件(Agent)即可跨平台的监测Linux、Solaris、AIX、FreeBSD、UnixWare、HP-UNIX、OpenServer、DigitalUnix、Cobalt、True64、Slackware 和Windows系统,对于客户特殊的操作系统还可根据客户的需求动态定制我们的监测系统,用户只需按照规定接口生成监测模块,SiteView监测系统会自动识别并装载该模块。SiteView的服务器监测模块不依赖于硬件系统,被监测的服务器系统按照操作系统的类型分为Windows和UNIX两大类:对于Windows系统的监测主要基于WMI技术和RPC协议,此外也提供了基于SNMP协议的监测模块;对于UNIX系统基于TELNET、SSH、HTTP协议。服务器的监测使用模拟用户登陆的原理实现,通常需要用户提供被监测的远程服务器的一个登录账号和密码,用户可以通过SiteView的配置子系统完成登录账号的添加。下图为工作原理图。
跨平台监测使网管人员通过一套系统就可以管理多种操作系统服务器,使管理异构网络环境的管理员非常方便。
主机的CPU、内存、磁盘的使用情况对主机的性能影响很大,如果出现问题,将直接影响到主机的正常运行,进而对服务器上正在运行的重要的应用系统带来不可预料的后果。所以,对主机的CPU、内存、磁盘资源使用情况进行监测是主机管理的首要任务,SiteView的服务器监测模块不但可以监测到Windows系统的相关性能,还可以监测到几乎所有主流的UNIX平台(例如Linux、Solaris、AIX等)的相关性能,对于比较少见的UNIX系统,SiteView提供了易于扩展的监测接口,只需要根据接口的定义添加监测模块即可监测SiteView中暂不支持的UNIX系统。SiteView提供的跨平台的服务器运行状况监测模块可以帮助管理员在第一时间发现主机基本性能的状态异常,并协助管理员对异常做出处理。
服务、进程管理
主机上往往运行着非常重要的应用系统,例如大型的数据库系统、Mail系统、Web Server或特殊业务的应用系统等。应用系统的进程和服务是否正常运行是判断应用系统是否正常的关键,如果这些关键的进程和服务已经停止,则应用系统肯定无法正常工作。所以监测主机上的进程和服务是主机管理的另一个重点。SiteView的服务器监测模块能够监测Windows平台和UNIX平台上运行的进程、服务的运行状况,例如指定进程的运行实例总数,对于Windows平台,不但能监测指定进程的实例总数,还能监测线程总数及内存总占用量。通过对进程和服务的运行状况的监测,SiteView可以对重要的应用系统的正常运行提供有力的保障。
网络状况管理
SiteView的服务器监测模块还包括对服务器的网卡的运行状况的监测。SiteView对服务器的网络状况的监测是基于SNMP协议实现的,SiteView可以监测服务器的网卡的流量(接收速率和发送速率)、状态和丢包率等。通过对服务器网络状况的监测,SiteView可以使网络中的服务器系统维持正常的网络访问和提供正常的网络服务。
系统端口
网络中的服务器系统通常会提供一系列的服务给网络中的其他主机进行访问和使用,例如Web Server服务等,这些服务都是通过一些指定的端口进行通讯的,所以系统业务端口的正常与否对于系统业务有直接的影响。SiteView的服务器监测模块提供了对服务器的系统业务端口的监测模块,通过Connect系统业务端口,发送请求,以监测端口是否能够响应。
日志管理
服务器上的应用系统或重要进程运行时会产生大量的日志文件,这些日志文件对于检查程序运行状态、查找程序出错原因很有帮助。SiteView的服务器监测模块提供了相应的监测功能对这些日志进行监测。SiteView不仅可以监测Windows平台和UNIX平台的日志变化情况,而且对监测结果支持匹配查询、设置过滤条件等方式进行更深层次的分析,通过应用SiteView的服务器日志监测功能,可以帮助管理员更为准确的掌握重要进程或应用系统的运行状况,以保证关键业务的正常运行。
故障自动恢复功能
SiteView的故障自动恢复功能对网络管理人员具有非常重要的意义。当出现一个临时性的标准故障时,自动恢复功能就会自动执行指定脚本或POST数据到指定的CGI程序,使服务恢复正常。比如,把一个挂起的服务器操作通过自动启动功能而使它重新运行;把一个耗费系统过多资源的进程停止或者重新启动设备。
SiteView分别针对Windows平台和UNIX平台提供了不同的故障自动处理的解决方案。对于Windows平台,SiteView提供了重启指定服务、重启Web服务、重启主机、关机等故障自动处理功能,这些功能是通过SiteView中提供的控制脚本实现的,管理员还可以根据管理的不同需要定制这些脚本,脚本的内容是使用了WMI技术规范进行编写的,通过定制不同的脚本可以实现对Windows平台的故障处理功能的扩展。对于UNIX平台,SiteView提供了易于扩展的接口实现其故障处理功能,管理员可以自己定制用于对故障进行处理的UNIX脚本,通过SiteView提供的接口程序,监测系统即可在出现故障时自动调用管理员编写的UNIX脚本对故障进行处理。
【相关文章】
……