还记得之前提到的通过监控宝来监控服务器CPU使用率吗?再过不久,监控宝将推出更加全面的服务器监控套装,目前这项功能已经基本完成,这其中包括一些基本的监控项目,比如CPU使用率、内存使用率、平均负载、磁盘I/O、网络流量、磁盘使用率等,它们都提供了详细的统计和图表。
目前提供的监控项目包括:
- CPU使用率,监控CPU的使用率比例,包括用户态(User)、内核态(System)、I/O等待(IOWait)、空闲(Idle)等
- 平均负载,监控Linux服务器的平均负载(load average),包括最近1分钟、5分钟、15分钟等
- 内存使用率,监控内存使用率,对于Linux服务器,包括空闲内存、Buffer Cache、Page Cache、应用程序内存等
- 磁盘I/O,监控所有磁盘分区的I/O流量,包括写入和读取
- 网络流量,监控所有网络设备的流量,包括流入和流出
- 磁盘空间使用率,监控所有磁盘分区的空间使用率,包括总空间和已用空间
需要注意的是,以上这些监控项目在Linux/Unix/Mac等平台的服务器上可以全部支持,而对于Windows服务器,暂时只支持网络流量和磁盘空间使用率的监控,随后也将会陆续全部支持,并且随后,监控宝还会增加更多的服务器监控项目,比如进程监控等。
那么,监控宝是如何监控服务器的呢?事实上,监控宝需要通过SNMP协议来监控您的服务器,这要求您的服务器上运行SNMP代理程序,不论是Linux/Unix/Mac,还是Windows,开启SNMP代理程序并且进行必要的设置,都是非常简单的,随后我们会介绍详细的配置方法以及各种安全方面的建议。
接下来,让我们一睹为快,以下是一些预览图片。
这是即将新增的导航,用来快捷的浏览服务器的各项监控统计。

CPU使用率比例饼图,一目了然,下边的CPU显然比较繁忙。

当然还有CPU使用率变化曲线图,这就相当于服务器的心电图,如果你仔细分析,就可以基本了解服务器最近一段时间的活动规律和异常情况。

对于Linux服务器,平均负载是用来反应系统资源的争抢程度,也就是系统是否繁忙,它的数字意义是指一段时间内进程队列中等待进程的平均数量,显然,我们不希望有任何进程处于长时间的等待状态。

下面可以看到详细的内存使用率。


以及Linux的Swap交换分区使用率,一般而言,我们希望它尽量少的使用。

磁盘I/O的监控相当重要,相当多的系统瓶颈都在于磁盘I/O,以下是磁盘I/O数据传输率统计,包括各个磁盘分区的独立统计。


你可能对网络流量更加关心,要想知道当前流量是否接近服务器出口带宽,流量图必不可少。监控宝提供了所有网络接口的流量图,比如以下的etho和eth1,分别是连接外部网络和内部网络的两块网卡设备。


最后,磁盘空间使用率也非常重要,我们经常担心磁盘空间是否已满,以下的磁盘空间使用率监控可以让你快速了解所有磁盘以及各个分区的使用情况。同时,监控宝随后还会在服务器监控中加入各种报警(Email、手机短信、或其它)功能,比如你可以设置磁盘使用率警报线,一旦空间使用率到达警报线,你就会快速收到通知,这样一来,你就可以高枕无忧了。


当然,我们希望监控变得更加简单,你还可以直观的查看多个服务器的常规状态。

如果经常有某些地方的用户抱怨你的网站速度慢,你可能不以为然,因为你不相信这是真的。现在,你可以让这些用户来帮助你收集各地的真实速度,而你要做的很简单,在监控宝中使用服务器访问速度跟踪功能,这是最新推出的服务,已经有很多网站开始试用,并反馈了建议,我们也期待您的建议。
下边的地图足以让你直观的看到不同省份的用户访问速度,不同灰度的颜色反映了不同的访问速度级别,监控宝使用了标准的响应时间作为基准数据,对所有用户的访问速度进行评级,你可以快速的了解不同地域的用户的访问品质,比如0.09秒意味着访问速度非常快,而0.6秒则属于较快级别,当然,如果超过2秒以上,则属于非常慢,如果某个地域的大量用户平均访问时间非常慢的话,你就需要进一步的考虑了。

当然,你也可以查看各个城市用户的平均访问速度。

目前,所有跟踪的用户信息都可以直接查看。

除了提供站点的平均响应时间之外,监控宝还提供了各运营商网络下的响应时间,这样一来,你就可以了解不同运营商网络中用户的响应时间。

在监控任务的详细视图中,提供了各运营商响应时间的比较,你可以了解它们随着时间的变化趋势。

对于大多数中型以上的站点,为了同时兼顾不同运营商网络的用户访问品质,一般会采用各种策略,比如使用双线接入服务器,或者使用DNS智能解析等,这种情况下,通过监控宝来了解不同运营商网络的访问质量是非常重要的。
监控宝提供了大量丰富的统计报表,其中有很多内容会引起你的关注,我们希望这些操作变得更加简单。新的导航体系中,你可以在左侧的层级导航中快速查看某个站点的各种统计报表,如下:

同时还可以快速的切换站点,如下:

一般来说,对于中型以上的Web站点,你可能需要创建多个监控任务,包括多个页面URL或者服务器IP,相信良好的导航会让你更加轻松!
多数用户希望在概述视图了解更多的信息,为此,我们将一些数据进一步细化,分离到了多个视图,如下图,我们在监控任务的初始页面增加了导航,你可以查看更加详细的可用率和响应时间信息。

响应时间视图中,所有监控任务都呈现出最小响应时间、平均响应时间和最大响应时间,同时你还可以选择时间范围。

在可用率视图,你将看到更加详细的统计,包括故障时间、检查次数等。

是不是更加的实用呢?快来体验吧。
很多用户希望站点在较长的时间里达到高可用率,甚至100%无故障,这是非常令人期待的,为此,监控宝增加了时间范围设定功能,目前你可以设置四种时间范围,基本上可以了解最近10天的状况,随后我们还会提供自定义时间范围等功能。

选择不同的时间范围后,监控宝采用异步加载的方式,快速呈现数据。

很多用户通过监控宝来监控站点的响应时间和可用率,这些功能非常的简单易用,丰富的图表和报告帮助用户更加轻松的了解和改善站点应用的服务品质。
与此同时,监控宝将继续提供深层的监控,从而帮助用户获得更加详细的性能报告和改善建议。这其中便包括服务器监控,以下是监控宝实验室的最新快照,我们用监控宝获得了一台远程服务器的CPU使用率。



当然,除了CPU使用率,监控宝还会提供系统负载、内存使用率、网络流量、磁盘使用率等监控,目前这些功能还在开发中,预计将在下个月提供免费试用。
说到这里,也许你开始担心一个问题,监控宝是否需要在被监控服务器上安装代理软件呢?答案是完全不需要,为了不给用户带来任何额外的风险和担忧,监控宝使用成熟的SNMP协议进行服务器监控,而必要的代理软件事实上就是SNMP Agent,目前几乎所有的主流操作系统(Linux,Windows,Mac,Solaris……)都已经缺省安装了它,而你需要做的仅仅是开启它,并且按照我们的指示进行简单的配置,甚至不超过1分钟,随后我们会介绍在常用平台上如何开启和配置它。
有关SNMP的详细资料,你可以阅读 http://en.wikipedia.org/wiki/Simple_Network_Management_Protocol
传统情况下,要实现服务器监控,一般需要在企业内部部署一套专用的监控系统,比如Cacti、Nagios等,但是在未来,你可能不太需要它们,因为监控宝可以帮助你更加快速的完成同样的工作,并且大大减少你的运维开支,这些激动人心的体验,即将到来!
我们发现很多用户热衷于gmail,但是由于gmail对国内邮件的spam策略,导致监控宝的系统邮件很难及时进入用户的gmail信箱。
使用gmail邮箱注册监控宝后,可能无法及时收到激活邮件,这时候,打开垃圾邮件,原来在这里。

为了不影响享受监控宝的完整服务,你可以在gmail中为监控宝添加过滤器。
在gmail的设置中,选择过滤器选项,然后创建一个新的过滤器,在发件人一项中输入“@jiankongbao.com”,这意味你可以接收任何来自监控宝的邮件,这包括必要的可用率报警以及监控报告等,当然,如果你日后不希望收到这些邮件,你也可以在监控宝中关闭相应的功能。

在下一步中,选择最后一项,如下图:

这样一来,所有来自@jiankongbao.com的邮件都将及时的进入你的gmail信箱。

帮助你了解站点性能是监控宝的第一步,当然,我们希望这一切更加的简单和直接,通常你只需要每天查看监控日报即可。
如果使用QQ邮箱注册监控宝,那么你还可以享受QQ客户端的邮件到达通知,这在故障通知的时候更加有利。

在邮件中,你可以直观的看到所有设置了接收性能报告的监控任务。

有意思的是,我们新增了与前日比较的功能,有点股票的感觉,但是红色的涨幅在这里可并不是什么好事情。

除了网页(HTTP)监控,我们还可以创建其它类型的监控任务,这可以帮助我们更加全面的掌握和分析站点的性能和可用性。
这里我们来创建Ping类型的监控任务,非常简单,在创建监控任务的时候选择“Ping”类型。

接下来,填写任务名称,以及接受ping检查的主机名,域名和IP都可以,这里我们填写了“www.baidu.com”。

一切就绪后,监控任务开始运行,来看看检查快照,如下图:

默认情况下,监控宝向目标主机一共发送3个ICMP包,并统计收到的包数以及丢包率。同时,你还可以在结果快照中看到Ping的原始结果。

最近评论