更快的为多个监控项目设置常规告警通知

类归于: 产品与使用技巧 — colin @ 10:40 上午 2009年11月27日

以往,我们需要进入每个站点监控项目才可以为其设置常规告警通知,这样在维护较多监控项目的时候稍显麻烦。现在,通过“告警通知->常规告警通知设置”,现在您可以更加直观快捷的设置多个监控项目的常规告警通知。

那么,何时会收到常规告警呢?当站点监控项目不可用或者请求超时,以及从这些故障中恢复正常,都会触发常规告警。具体不同类型的监控项目会有不同的原因导致不可用,比如HTTP响应代码为4XX或5XX,或者HTTP响应正文不匹配预期设置,或者PING丢包率达到100%等。

在监控宝中,所有告警触发后都会首先为您发送站内告警消息,而如果需要其它通知方式,比如Email、MSN、手机短信等,则需要以下的设置。

66

新增每日Ping主机丢包率变化曲线

类归于: 产品与使用技巧 — colin @ 10:33 上午

我们知道,在一些时候,由于网络中局部交换节点不稳定,尽管两台主机之间可以传递数据包,但是却存在或多或少的丢包现象,导致IP数据包需要多次重发,产生了重发数据包的时间开销。

这些情况发生时,大多数时候我们并不知道,通常我们只能手动的执行Ping检查,这无法做到长期持续的观察网络品质。

现在你可以在Ping类型的站点监控项目每日报告中查看丢包率变化曲线图,目前监控点分别来自于电信和联通(网通)的骨干节点,随后会包括更多的国内和国外节点。

63

长期了解主机丢包率,将可以为您在选择主机部署方案时提供参考。

在监控宝中进行HTTP身份验证

类归于: 产品与使用技巧 — colin @ 10:03 上午

监控宝已经支持在网页监控中使用HTTP身份验证,使用非常简单,您可以在创建或者修改站点监控项目的时候填写用户名和密码,如下:

64

那么,一般在什么情况下我们需要进行HTTP身份验证呢?这当然取决于您提供的服务,比如基于Apache的SVN服务,一般我们会设置身份验证,再比如一些需要基本权限控制的系统,也可以配备HTTP身份验证。

在Web服务器上配置HTTP身份验证的方法取决于不同的Web服务器,比如对于大家熟悉的Apache,配置方法可以参考:http://man.ddvip.com/soft/apache2.2/programs/htpasswd.html

对于要求HTTP身份验证的网页,如果我们在监控的时候不填写用户名和密码,便会获得401错误,这代表着Web服务器要求您进行验证。当我们为监控项目填写了用户名和密码后,可以看到,验证通过,返回301,这意味着登录成功并且跳转到其它页面。从以下的历史快照中可以看到身份验证前后的结果。

65

已支持FTP监控

类归于: 产品与使用技巧 — colin @ 4:02 下午 2009年11月24日

监控宝已经支持FTP监控,这对于提供FTP服务的用户来说是一个好消息。

目前的FTP监控支持匿名登录和身份验证,当FTP服务器无法连接或者无法通过身份验证的时候,监控宝会将该监控项目视为不可用,并且发送站内告警消息以及必要的通知。

62

已支持站点DNS监控

类归于: 产品与使用技巧 — colin @ 3:58 下午

你可以在创建站点监控项目的时候选择“DNS”,监控宝已经对其全面支持。

目前,DNS监控支持的DNS记录包括:A、MX、NS、CNAME、AAAA、TXT等,比如我们对jiankongbao.com进行了MX记录的监控,从快照中可以看到如下:

61

如果域名没有任何DNS记录,监控宝便会将它视为不可用,并且发送站内告警消息给你,同时根据告警设置选择其它的通知方式告知。

DNS监控支持多记录解析,比如通过A记录轮询实现负载均衡的站点,可以看到DNS快照中会有多个目标IP地址,当然,如果你采用了智能解析,你可以在电信和联通监控快照中看到不同的解析结果。

在监控项目概述中查看最新告警消息

类归于: 产品与使用技巧 — 标签:, — colin @ 3:42 下午 2009年11月23日

现在,当你进入任何站点监控项目的概述页面后,便会在“综合”视图中看到该监控项目的最新告警消息,这将让我们更加快速的了解该监控项目近期的告警状况。

60

在监控宝中轻松查看网络设备的MTU和带宽

类归于: 产品与使用技巧 — colin @ 7:05 下午 2009年11月15日

你知道服务器上各个网卡的MTU值吗?通常情况下网卡的MTU值为1500字节,这代表了该网卡发送或接收的数据包中最大的字节数。也就是说,如果一段需要在网络上传输的数据超过1500字节,那么网卡就会将它们自动拆分成若干个数据包来发送。

下面给MTU一个完整的定义,Maximum Transmission Unit,即在网络中传输的最大数据包长度,它的单位是“字节”。

在Linux中可以通过ifconfig查看网络设备的MTU,比如:

eth1      Link encap:Ethernet  HWaddr 00:15:17:B2:E6:D1
inet addr:192.168.2.1  Bcast:192.168.2.255  Mask:255.255.255.0
inet6 addr: fe80::215:17ff:feb2:e6d1/64 Scope:Link
UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
RX packets:3938175627 errors:0 dropped:0 overruns:0 frame:0
TX packets:3651640221 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:3476093357672 (3315060.9 Mb)  TX bytes:708752985117 (675919.5 Mb)
Memory:e1a00000-e1a20000

eth1      Link encap:Ethernet  HWaddr 00:15:17:B2:E6:D1

inet addr:192.168.2.1  Bcast:192.168.2.255  Mask:255.255.255.0

inet6 addr: fe80::215:17ff:feb2:e6d1/64 Scope:Link

UP BROADCAST RUNNING MULTICAST  MTU:1500 Metric:1

RX packets:3938175627 errors:0 dropped:0 overruns:0 frame:0

TX packets:3651640221 errors:0 dropped:0 overruns:0 carrier:0

大多数情况下你不需要修改Mtu值,但在一些特殊的场景下,我们需要修改服务器网卡的MTU值来达到一些目的,这里我们不重点介绍这些情况,以后我们会在性能优化方面的日志中专门介绍。

现在,不论是Windows服务器还是Linux服务器,你都可以在监控宝的网卡流量监控中查看这些网络设备的MUT值,如下:

50

可以看到,弹出的信息列表中显示了MTU值,没错,正是默认的1500Bytes。

51

同时,我们还看到了出口带宽的显示,没错,这也是监控宝刚刚推出的功能,准确的说,这里的出口带宽也就是连接该网卡的交换机对其的限制,也就是我们通常在服务器托管时候购买的带宽。

需要注意的是,这里的出口带宽并没有区分“共享”或“独享”,不论你使用的是100M共享带宽,还是100M独享带宽,这里都会显示100Mbps。而如果是共享100M带宽,由于其它服务器的带宽竞争,以及带宽服务商可能采取的其它限制手段,你的实际流量自然不会达到100Mbps,这就需要通过实际流量图来了解了,而通过监控宝的网络流量监控,所有的一切你都将尽收眼底。

为监控项目创建自定义告警

类归于: 产品与使用技巧 — colin @ 7:23 下午 2009年11月11日

经过一段时间的准备和开发,我们终于推出了自定义告警功能,它允许你对站点监控任务和服务器监控任务设置灵活的告警条件,一旦触发这些条件,你便会收到告警消息。

稍后我们再谈如何创建自定义告警,先让我们看看添加了自定义告警后的监控视图,以下是一个例子,可以看到有几个监控项目为红色,另外几个为黄色,剩余的为绿色。通过前边的介绍,我们知道红色代表了严重告警,黄色代表提醒,而绿色代表正常。

38

监控视图中还有各个状态的统计,可以看到,有12个监控项目处于严重告警状态!看来有点不妙,CPU使用率达到了95.5%,而我们设置的告警条件是大于50%,显然,告警条件已经被触发。

39

当然,除了查看状态视图,我们还需要查阅告警消息,不论是触发告警条件,还是恢复正常,我们都可以在告警消息列表中找到这些记录。

34

更有意思的是,一旦有新的告警消息,监控宝会在你当前所在的任何页面右下角弹出一个提示,告诉你有多少条新告警消息,还等什么,快点它看看。

37

这里便是告警消息列表,列表中的每一行记录左边都有一个信号灯,它表示这些消息的类型,同样,有严重告警、提醒和恢复,另外,对于SNMP数据获取失败,会有灰色的信号灯来表示。

35

说到这里,如何创建自定义告警呢?很简单!

首先得说说监控指标,监控宝对不同的监控项目定义了若干个监控指标,比如HTTP当前响应时间、PING当前丢包率、HTTP当日可用率、当前CPU使用率、网卡eth0的当日流入总容量、物理内存使用率、CPU负载最近1分钟平均值等……

有了这些监控指标,我们就可以通过设置告警条件来创建自定义告警。

需要注意的是,要为某个监控项目设置自定义告警,你需要进入这个监控项目的子菜单中,比如对于服务器监控,你可以在CPU负载子菜单中找到“告警设置”。

43

而对于站点监控,你同样可以在某个任务的子菜单中找到“告警设置”。

42

接下来我们看几个例子,比如对于HTTP监控任务,我们在创建自定义告警时,可以选择两个指标:当前响应时间、当日可用率。

32

31

而对于网络流量监控,我们提供了更多的监控指标,包括当前网络流入/流出速率、当日网络流入/流出总容量等,与此同时,告警条件支持“增量比较”,你可以和前一天的网络流量进行对比,比如超过50%便触发告警。

41

对于CPU负载监控,设置告警非常简单,目前有3个指标供你选择,分别为最近1、5、15分钟的平均负载,你只需要指定它们大于某个阈值即可。

除此之外,对于有些监控指标,监控宝支持敏感度的设置,即连续多少次触发即告警,它适用于一些变化幅度较大且不稳定的监控指标,比如PING丢包率等。

40

以上只是对自定义告警的大概介绍,相信你在使用中会有更多的心得,也欢迎你将这些心得告诉我们,或者分享给其它的朋友。

更加紧凑的站点监控项目概述

类归于: 产品与使用技巧 — colin @ 6:32 下午

有不少用户告诉我们站点监控任务左侧的子菜单导航过于复杂,为此,我们将左侧的一部分功能相近的功能转移到了右侧,现在看起来好多了,更加的清晰明了!

33

通过优先级对监控任务进行排序和分类

类归于: 产品与使用技巧 — colin @ 5:19 下午 2009年11月4日

现在,你可以对网页URL和PING等监控任务设置不同的优先级,它的作用在于:

  • 监控任务可以根据优先级排序。
  • 你可以根据不同的优先级来分类查看监控任务。

21

给任务设置优先级的方法非常简单,直接点击不同的星型图标即可。一旦设置优先级后,你便可以根据优先级快速的找到它。

20

早前文章 »