1. 产品简介
OneKeeper运维一体机是主动运维服务的线下服务平台,可以单独使用,也可以作为运维云的线下服务终端。运维一体机实现数据中心运行状态的一体化监控,包括数据库、中间件、操作系统、虚拟机、物理服务器、存储设备、网络设备、安全设备等软硬件节点;主要功能包括:
1) 数据中心一体化监控
2) 大屏展示
3) 与运维云组合实现告警通知,远程DBA服务等
2. 功能特点
2.1 产品架构
2.2 数据中心一体化监控
使用OneKeeper 运维一体机,可实时监控数据中心的数据库、中间件、操作系统、服务器、存储、网络设备等软硬件节点,并提供可视化监控、灵活的数据分析和报警功能。
OneKeeper 运维一体机提供了出色的数据采集性能,同时可以采用分布式部署模式,支持节点数量庞大的环境。
2.2.1 数据库监控
OneKeeper 运维一体机的数据库监控功能,可以直观、有效监视数据库运行状态,支持的数据库类型包括:Oracle、MySQL,SQL Server,DB2。
数据库健康指数
根据多年的数据库运维经验,总结出数据库5大健康指数,用来衡量数据库的运行好坏以及性能优劣。5大健康指数如下:
1) 可用性:监听、实例、表空间。
2) 错误:数据库运行过程中的错误。
3) 性能:提炼数据块逻辑读指标直观反映数据库性能。
4) 变化:对象、权限、空间。
5) 可靠性:备份、容灾系统的运行状态。
**SQL执行监控**<br /> 1) 按 SQL 执行生命周期展示:登录 解析 执行 提交。<br /> 2) 提炼二大指标(执行次数、时间)精确展示执行流程。<br /> 3) 直观凸显性能瓶颈点。<br /> 4) 指标超过阀值,自动预警。
** 关联资源监控**<br /> 1) 数据库资源: processes、session、DB files、jobs。<br /> 2) 影响数据库性能的三大资源锁:Mutex、 Latch、 Lock。<br /> 3) 主机资源:CPU、内存、存储、网络。
**2.2.2 中间件监控**<br /> 利用JMX实现监控Java应用服务功能,无需安装任何第三方软件或插件。使用高效的Java网关监视Tomcat,Weblogic,ACTIVEMQ等,包括运行状态、JVM可用内存、JVM最大内存、JVM总内存、线程等。
**2.2.3 操作系统监控**<br /> 实现对Windows、Linux、AIX、HP-UX、Solaris主机的运行状况监控,包括主机的在线状态、CPU利用率、内存大小及利用率、磁盘空间大小及利用率等状态信息。
**2.2.4 网络监控**<br /> 实现网络设备(包括网络安全设备)的在线状态监控和网络链路状态监控,包括:线路联通性、线路响应时间、线路流量、线路带宽利用率、线路错包率、线路丢包率等信息。对网络设备接口状态进行监管, 包括接口状态、接口流量性能等信息。持续监视、报告网络的运行情况,发现异常及时告警。<br />** 2.2.5 主机硬件监控**<br /> 通过IPMI收集CPU温度,风扇转速、电压和磁盘状态等统计信息,可以独立于操作系统外直接从带外管理口监控硬件状态。<br /> 注: IPMI监控仅适用于支持IPMI的设备。
** 2.2.6 存储监控**<br /> 存储监控的信息包括存储控制器、磁盘、电源、风扇等健康状态,实现对EMC、IBM、HP、NETAPP、DELL等厂家存储设备的监控,。
** 2.2.7 虚拟机监控**<br /> 实现对VMware虚拟机的监控,包括VMware配置数据和VMware性能数据。支持使用自动发现规则来发现VMware虚拟机,并根据预定义的模型创建主机节点来监控它们,包括VMware物理主机硬件状态、虚拟机在线状态、CPU的信息(核心数量、利用率、频率)、内存大小及利用率、磁盘空间大小及利用率等信息。<br />** 2.2.8 可定制化视图**<br /> 提供多种定制化视图,可以线下完成定制图的设计,然后上传到一体机;或者直接可以在运维一体机的管理界面完成定制视图的设计。下图为机柜分布图示例:
2.4 大屏展示
2.4.1 数据库运维视图
大屏展示提供数据库多种类型视图,包括ORACLE\MySQL\SQL Server数据库视图,未来版本还将支持RAC视图以及数据库聚合视图。
ORACLE视图 MySQL视图
SQL Server<br /><br />MySQL<br /><br />**2.4.2 中间件运维视图**<br /> 大屏展示提供Weblogic和Tomact两种视图。<br /> Tomcat视图<br /><br />Weblogic视图<br /><br />**2.4.3 操作系统视图**<br /> 支持Linux、Windows、AIX、HP-UX、Solaris等操作系统监控。<br /> LINUX<br /><br />Windows<br /><br />**2.4.4 虚拟机视图**<br /> 支持VMware虚拟机状态监控。<br /><br />**2.4.5 自定义视图**<br /> 能够创建可以将多个项目组合到一个视图中的自定义图形,自定义屏幕和幻灯片放映,作为仪表板样式的概述。
2.5 运维云
运维云(Onekeeper Cloud)作为运维一体机的线上服务平台,以SaaS服务方式交付,与运维一体机关联,主要功能包括:
1) 告警订阅
2) 告警通知
3) 远程DBA授权:授权方将数据库告警同步推送给远程DBA
** 2.5.1 告警管理**<br /> 运维云支持所有的告警展示以及待处理告警的管理功能。“告警列表”对已处理和未处理的告警进行展示,“待处理告警”展示还未处理的告警。<br /> 告警列表如下图所示:<br /><br />待处理告警如下图所示:<br /><br />** 2.5.2 告警订阅**<br /> 告警订阅功能模块用于7*24小时实时接收到数据中心的告警。具体的订阅规则如下:<br /> 1) 按运维对象的重要性和故障级别,可定义不同的告警通知级别。<br /> 2) 可自定义告警站点、告警接收人和告警接收方式。<br /> 3) 告警通知类型支持:微信、APP方式。<br /> 告警订阅页面如下:<br />
3 部署方式
运维一体机采用旁路方式进行部署,只需要将一体机接入到数据中心内的核心交换机;同时采用无代理模式,通过SNMP\SSH\JMX等标准协议实现数据中心软硬件的状态数据的采集。旁路及无代理的部署模式,保证对业务系统几乎不产生任何性能的影响。
4 产品优势
1. 产品部署方式采用无代理模式,对业务系统性能几乎无影响,同时可以实现产品快速部署和版本升级。
2. 无差别支持数据中心业界主流软硬件设备。
3. 针对不同类型设备,提供大屏视图模板,同时支持大屏视图自主定制,以满足个性化需求。
4. 提供数据库运维工具箱,满足日常的数据库运维场景,简单易用。
5. 数据库监控视图全局展示数据库的健康指数,实时了解数据库的健康状况。
6. 实现SQL全生命周期的监控,采用“流程+时间”的联动方式展示,可以快速定位数据库的故障点。
7. 运维一体机(线下)和运维云(线上)的组合使用,实现7*24小时实时告警,实现主动运维服务。
8. 利用运维云,可以订阅专业的数据库专家服务,更好的保障数据库的正常运行。
5. 运维一体机白皮书(PDF)文件下载:
运维一体机白皮书V3.3.1.pdf
P