时间:2015-05-05 17:59:51 来源: 复制分享
随着IT系统复杂程度的增加,传统的IT运维方式已不能适应企业快速发展的业务需求。企业需要主动发现、准确定位、快速响应来减少业务损失带来的运营风险。因此,如何帮助企业减小运营风险,帮助企业IT运维人员摆脱繁琐的工作,成为一个企业提升自身竞争力,走向商业成功必须要解决的问题。
对IT从业者来说,APM(应用性能管理)想必并不陌生。作为IT服务管理的重要组成部分,APM在互联网企业应用中扮演着不可或缺的角色,它能对企业的关键业务应用进行监测和优化,提高应用的可靠性和稳定性。从而帮助企业IT运维人员提升工作效率,帮助企业对系统即时监控实现对应用程序性能管理和故障管理的系统化。
在由51CTO主办的WOT2015互联网运维与开发者大会上,APM厂商云智慧公司的资深技术架构师李俐明先生接受了记者的采访。
云智慧资深技术架构师李俐明先生正在接受记者的采访
APM带来了什么?
对于一线的开发工程师而言,APM可帮助他们预知性能问题,避免其成为故障,做到提前处理。并对已有故障问题做到尽早的发现尽早处理,以免故障周期变长,对企业造成严重的损失。而对于管理者来说,APM可以帮助其准确诊断业务症结,并对流程和架构作出可行性的优化。
在云计算、大数据以及移动互联成为主流的今天,APM发挥着积极可靠的作用。云计算方面,对于云端的监控与传统的应用监控指标没有什么大的不同,相对来说只是在云端的云主机对磁盘的I/O性能要求更高。因为要做大量的虚拟化应用,对磁盘的I/O性能更关注。
大数据方面,Hadoop这种大数据架构认为故障随时都会发生。这时除了需要技术大牛外还需要APM这样的工具,利用工具来分析复杂繁多的东西,监测并获知出现问题的地方。比如:消息队列处理不过来了,要及时发现,是不是要扩展消息队列,或者这个消息队列是不是合适,是不是需要再换一个。
此外,移动互联网的发展促使传统的PC用户逐渐转向APP。目前,做APP开发的企业越来越多,APP质量良莠不齐,可能今天上线一百个APP,明天就有九十九个APP死掉。要想APP获得更长的生命周期,必须采用应用性能监控来及时发现APP用户喜欢什么,帮助开发者取优弃劣,并对其进行优化来提升整体水平,从而吸引更多的用户下载使用。
云智慧的APM服务
在李俐明看来,云智慧的APM服务为客户提供了保障用户业务连续性、实时发现系统问题,以及提供系统优化调整的方案和建议几个层面的价值。实现这些价值,做好故障预测是必须要做到的事情。
云智慧的APM可以通过大数据分析通过趋势预警帮助运维工程师去及时处理问题。比如对Web服务器Apache上PC端口状态的监测。假设平常80端口的连接数是几百个,syn是20个。当突然有一天,我们发现连接数突然升高到一万,而且syn的状态特别多,那么APM可以初步判断有性能攻击的行为,并做出预警。这是根据以前的监控数据来进行比对,通过计算平均值,看跃变超过百分比,来判断是否存在异常,达到故障预测的目的。
现在,大部分APM都会涉及到代码层的监测。对此,李俐明做了一个形象的比喻:“如果想了解某户人家的情况,利用望远镜在远处观察不如进入这户人家了解到的情况更多更真实。”
为了让用户踏实放心的使用云智慧的产品,云智慧也将对所有嵌入式的代码进行开源,以确保服务的安全性;此外,云智慧也在做一些合规性的认证。而最终,将通过以上两种方式最终实现开放意义上的性能管理。
APM的未来
李俐明表示:随着互联网的快速发展,移动设备的普及,IT系统的日益复杂化,如何保障系统的可靠运营变得非常重要,因此APM市场发展空间广阔。而未来,云智慧将更加关注业务连续性。通过提升业务性能管理来帮助企业产品的运营,实现更高的投资回报率。
目前,云智慧主要有监控宝与透视宝这两款“宝宝”产品。监控宝经过多年发展已经非常成熟,主要向用户提供基于SaaS的网站性能监控和告警服务,包含网站监控、API监控、服务器监控和服务性能监控等。
透视宝则是云智慧的战略升级产品,是面向业务的基于大数据分析的端到端应用性能管理解决方案。解决运维可视,运营风险可控,从而实现业务增长可期。透视宝主要针对移动和网站应用,提供全面的性能监控、分析与管理解决方案。透视宝能够帮助企业实现应用性能的最优化、改进与优化终端用户体验、加速系统开发及交付进程、规避与减小整体投资风险、提高 IT 生产效率。