带外服务器管理方案

      随着信息的发展,机架式服务器、刀片式服务器以及存储设备的使用也越来越多,目前在使用服务器的品牌主要有DELL、IBM、HP,不远的将来,也许联想服务器也将纳入设备采购范围,存储设备的品牌主要为EMC 和HDS。
      经过多年建设,已经基本实现了涵盖操作系统层、数据库层以及应用层的自动化带内监控系统,基本能满足现有的业务需要,但是在硬件层的监控方面,还缺少一套统一的平台来实现跨厂商、跨硬件平台的集中监控和管理。目前的监控方式只能采人工到机房定时巡检,这种方法效率低下,而且当设备出现问题时发现的实时性不高。
根据新数据中心的建设规划,未来的数据中心将趋向无人值守的管理模式,除基础设施保障人员外,机房系统的基础设施应支持日常系统运维人员实现非现场的系统运维。这包括上述的远程硬件设备监控,远程的设备管理和电源管理、远程的KVM 操作等。
      因此,计划建设独立的带外管理网,通过一套集中式的带外监控管理平台,实时高效的监控这些硬件设备的工作状态,出现硬件设备故障时能及时发现、实时告警。带外方式不需要在每台服务器上安装代理软件,可以减少对操作系统的影响,并实现与操作系统的无关性,而且可以实现远程的电源管理。

 

模块

功能

服务看板信息

  1. 对整个数据中心的所有服务器状态进行整体展示
  2. 对于出现故障的服务器设备能够醒目标记
  3. 对于出现故障的服务器设备能够方便地定位出位置信息、设备用途、负责人、故障的部件信息等
  4. 对关键指标用不同的图表示出来
  5. 定位故障的服务器后,可链接服务器各部件的配置信息、各部件的详细
  6. 工作状态信息、资产管理信息等。

服务信息管理

 

各部件工作状态监控

  1. CPU:各CPU 工作状态
  2. 主板工作状态
  3. 风扇:各风扇转速、工作状态
  4. 电源:各模块电压、工作状态
  5. 内存工作状态
  6. 阵列卡工作状态
  7. 各磁盘工作状态
  8. 带外管理卡工作状态

传感器状态曲线监控

电压:电源电压、CPU 电压

风扇转速:CPU 风扇、电源风扇转速

温度;CPU、内存、主板

日志监控

通过IPMI获取设备硬件日志

可按服务器、日期、警告级别、日志类型(磁盘、RAID、CPU、主板、风扇、电源、内存)进行分类展示

机箱安全检测

机箱状态检测:机箱是打开还是关闭

监控参数配置

  1. 采样频率间隔
  2. 采样配置模板

链接带外管理Web 界面

  1. 提供单点登录方式,点击进入对应的服务器带外管理接口的Web 管理界面。(带外卡web端不支持,共享本地Web session 或cookie,将不支持直接登录,需要输入帐号)

链接带外管理KVM 界面

  1. 提供单点登录方式,点击进入对应的服务器带外管理接口的KVM 管理界面。(带外卡web端不支持,共享本地Web session 或cookie,将不支持直接登录,需要输入帐号)
  2. 可以设定远程操作功能是否可以多人同时登录和控制

故障告警管理

  1. 可以灵活定义监控和故障告警模板,不同的服务器,可以对应于不同的监控和故障告警模板
  2. 能定义系统维护窗口期:在系统维护窗口期,系统采样监控停止,避免系统维护期出现大量的警告日志
  3. 告警模板可设置采用频率、针对传感器获得的数值设置阀值,并持续进行跟踪
  4. 可以设置触发告警的条件,包括:不等于正常值、大于或小于正常值的某个百分比、持续出现的次数和时间,对预警阀值进行实时对比
  5. 可以设置告警取消的条件,包括:回归正常值或范围后自动取消、人工确认后方可取消等;告警信息可以根据设备的状态自动转变,如设备修复好了告警就自动为绿色状态。
  6. 告警动作:可以通过多种方式通知管理员,这些动作包括:语音提示、邮件、短信等。
  7. 语音提示动作:针对不同级别、不同类型的告警信息,可以自定义不同的语音提示信息,语音提示信息由语音引擎根据内容自动生成;语音提示信息的播放可选择为:1、重复播放只至报警信息得到手工确认;2、重复播放指定的时间
  8. 邮件和短信动作:可以设定不同的服务器的告警信息,应通知到不同的人员:设备负责人、机房轮值人员等

日志管理(SEL)

  1. 能分时间获得服务器日志。
  2. 能设定工作计划自动获得服务器日志
  3. 对下载的日志设定关键词报警(如网络终端等)。报警可以反馈到手机和短信上。
  4. 对日志进行备份管理

远程设备管理

  1. 实现单点登录,远程操控服务器屏幕(类似KVM 功能)。需要提供接口
  2. 重定向虚拟介质(远程安装操作系统)。
  3. 可以远程批量开、关和重启服务器。

资产管理

  1. 登记服务器信息时,获取服务器硬件信息,包括:品牌、型号、CPU、主板、阵列卡、硬盘、内存等信息,并进行归类
  2. 登记服务器位置信息:将服务器设备与机房、机房区域、机架编号、机架位置等信息关联
  3. 登记服务器用途信息
  4. 登记服务器机房运维岗(柜台组、外围组。。。等)信息
  5. 登记服务器主负责人信息
  6. 可根据服务器硬件信息(品牌、型号、CPU、主板、阵列卡、硬盘、内
  7. 存等)、位置信息、用途信息、维护岗信息、负责人信息等多种维度的任
  8. 意组合,检索出对应的服务器清单列表。
  9. 可以按机柜位置展示服务器的视图(手工标注服务器所在机柜位)。
  10. 可以标注服务器接入的交换机端口。
  11. 可以批量导入、导出服务器资产信息。
  12. 可以定义服务器的维修级别。
  13. 可以定义服务器的服务级别。

报表功能

  1. 可以从资产管理的多种维度出发(如:厂商、服务器型号、CPU、内存、
  2. 磁盘容量、负责人、机器用途、机架位置等),汇总出各类型的服务器数量和详细信息。
  3. 可以汇总出有哪些服务器将要过了保修期。
  4. 可以从多种维度出发(如厂商、服务器型号、机器用途等),统计并生成
  5. 设备故障发生统计报表
  6. 故障处理和恢复时间报表
  7. 报表条件的过滤可以自定义。

系统管理

  1. 用户的身份验证与AD 整合,实现单点登录,不用屡次登录不同服务器
  2. 所有服务器,可以采用无限级别的树图进行分类,实现对服务器进行无限的分组管理,树图上的任意一级节点可以自由定义,每台服务器只属于某一枝叶节点。
  3. 对系统可以不同用户设置不同权限,能对不同机器进行授权管理(查看,操作,重启,关机,开机)
  4. 用户的权限设置是以下2 个维度的结合,通过这种方式,可以定义不同的用户,对于不同的服务器组,具备不同的功能权限:

a) 应用平台各功能模块的使用权限(比如:监控总图、监控故障历时查询、设备运行状态、设备配置信息、资产管理、报表模块、远程设备管理。。。等等)

b) 服务器树图上的枝叶节点的集合

  1. 用户的权限设置是以下2 个维度

初始化工具

对于大批量服务器上线,提供配置工具,能快速的配置带外卡和带外卡IP地址,将带外卡加入到域管理中。

采集引擎

l  进行IPMI采集引擎与服务引擎封装

l  对IBM,HP,DELL的服务器进行协议封装,便于访问数据。

l  可以设置采集引擎的参数。便于控制控制与管理。

 

 

 

首页| 企业应用| 公司产品| 公司服务| 公司案例| 关于我们|

20156-2019深圳市微阳信息技术有限公司版权所有 (粤ICP备09020264号)