加入收藏 | 设为首页 | 会员中心 | 我要投稿 济南站长网 (https://www.0531zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

阿里百川码力APP监控 来了!

发布时间:2016-11-05 04:52:01 所属栏目:动态 来源:阿里百川专区的网站
导读:副标题#e# 阿里百川码力APP监控来了! 这个APP监控 和手淘一起成长 历经千锤百炼 走过千BUG万坑 如今百川起产品 为了让你的APP更好 用户更爽! 在移动互联网时代,一款应用是否成功,用户体验是一个关键的因素。APM的发展使得用户体验越来越完善,本文通过9
副标题[/!--empirenews.page--]

阿里百川码力APP监控  来了!

这个APP监控 和手淘一起成长

历经千锤百炼 走过千BUG万坑

如今百川起产品

为了让你的APP更好 用户更爽!

在移动互联网时代,一款应用是否成功,用户体验是一个关键的因素。APM的发展使得用户体验越来越完善,本文通过90年代互联产品性能优化的发展过程到今天移动互联网时代下的APM可用性监控体系,如何去解决日渐复杂的业务导致功能不断迭代所突发的致命bug,以及日益增长的用户和膨胀的数据导致流量过大所出现的一些问题。

在《黑客帝国》电影中较为经典的一幕是让Neo在红药丸和蓝药丸中做出选择。红药丸作为一个跟踪程序,帮助Neo定位物理身体位置,无论在哪里,出现任何问题都能够第一时间定位并解决。而开发者基本都知道,想解决大部分的功能性问题的难点基本就在定位上,而电影里面出现的一些人工智能、机器学习、虚拟现实的技术,也只能够在科幻电影中才能看到。

阿里百川码力APP监控 来了!

季度活跃设备增长趋势

今天,在移动终端爆发以及用户需求的推动下,移动应用的“数量”和“体量”急速扩大,APP性能数据在优化产品上变得越来越重要,国内大批APM厂商仿佛一夜间遍地开花,整个监控体系也从服务端到APP端再到H5端不断的加强和改变策略来适应不同的场景需求,使得监控和优化的本质上已经发生了变化。

APM的雏形发展

在1996年时,Tivo与HP公司就从应用程序层面出发,他们认为网络无疑就是应用的速度。直至1998年,面向以组件为中心基础建设监控的APM产品出现,直到2011年,移动设备的普及和APP应用市场的爆发,让大家对移动端的性能体验要求也越来越苛刻。

在这个时候,国外的APM行业New Relic和AppDynamics已经在APM领域拔得头筹,国内一些APM厂商看准移动的这个趋势,APM仿佛一夜之间遍地开花,直至今日,作为国内比较具有代表性的APM厂商有:听云、OneAPM、云智慧、博睿等,当前BAT领域也跻身这一领域,阿里百川码力APM(简称“码力APM”)也在云栖大会中发布公测。开发者无需从零开始构建性能探针、数据平台和控制台,就可以通过可视化、可运维的方式长期监控应用性能、及时解决应用中存在的问题。 

阿里百川码力APP监控 来了!

▲ APM 业务与 IT 发展关系变迁

APM可用性度量体系

如今,国内APM业务竞争越来越激烈,大家纷纷在可用性、用户体验上发力。比如,大家用手机淘宝,明显感觉稳定性和流畅度比国内其他电商APP好很多,这不仅仅是因为他们有一堆优秀的开发工程师,更关键是其背后那一套完善的性能监控度量体系。

通过性能监控体系,app上发生的性能指标都会被实时上报,而码力APM服务端会基于这些指标进行聚类和分析,聚合出问题和性能瓶颈,同时完善的日志信息也将支持开发工程师及时修复和优化。

阿里技术专家陈武认为,在性能优化方面,以往的度量是通过APP的打开率来进行对比,很多都是非常主观。而度量体系里面面临的一个很大的问题是常态化。那么,应该如何建立起这一套可视化的性能度量的体系呢?

阿里百川将影响用户使用的性能指标分为可用性度量和体验度量。

1、 可用性度量

可用性包含app可用性和服务可用性。app可用性问题中最常见的就是crash,而用户遇到crash之后,大部分会选择直接卸载app;服务可用性问题则包含网络连接和服务端错误,这类问题往往可能造成用户购买、订阅等关键操作不可用,从而导致资损,而这类问题若长期未能解决,也会导致用户流失。

这类问题需要第一时间被修复,越早修复,止损的效果就越好。

这需要客户端探针具有强大的采集能力。探针SDK将负责采集用户由于线程异常、内存溢出、手机杀进程等各种原因导致的崩溃,并捕获到尽量全面的环境信息,和用户操作轨迹来帮助开发者还原用户操作,定位问题。同时,对网络请求部分也是同样,探针SDK需要支持自动采集网络性能指标,并捕获错误网络请求的日志,来辅助开发工程师解决问题。

但是探针在用户app端采集的均是单一的事件,若有1000个用户出现可用性问题,那么服务端接收到的可能就是1000份日志。让开发工程师在海量的日志中排查问题,显然可行性不高。这就需要APM服务端实时对这些日志进行语义分析以及高效的聚类,比如,将1000条用户日志聚合为3个问题,通过控制台反馈给开发者。这将大大提升开发工程师排查和解决问题的效率。

阿里百川码力APP监控 来了!

2、 APP体验度量

APP体验是影响用户留存和活跃的关键,大家对APP使用过程中“如丝般顺滑”都具有天然的好感。但是目前市场大部分APP的体验依旧非常差,用户常会面对卡顿、图片加载失败、页面长时间等待等各种不良体验。这个时候,非常需要有一个系统体系化的去陈列和度量这些体验类问题。

APM控制台对卡顿的处理方式和崩溃类似,同类型的卡顿将被聚类在一起,发生该卡顿的用户详细日志也聚合在一起可以翻页查阅。而对图片加载失败等,页面元素无法正常显示的问题,则可以关注该图片所在静态资源的服务主机是否异常(单分钟请求量过多、图片过大等)。若该静态资源服务正常,则可以关注请求该图片的URL的错误率,可以反推是否为图片本身的问题。

在性能优化的量化方面,如何帮助企业去做定制?陈武认为,应该串联关键路径所需要的全部URL,从关键路径整体来看服务的健康度指标,而非关注全部的URL。比如通过网络性能监控,开发者无需对所有的URL进行关注,不同的开发者关注的核心业务不同,大家关注的URL也不一样。比如,在电商的场景,一个关键的路径是用户通过登录,打开商品,进入详情,然后下单到支付,通过把对应的关键路径所有的URL整合在一起,保障这条关键链路的性能,才能够强化核心业务的服务以及稳定性。

APM的可用性检测方式

阿里百川码力APP监控 来了!

▲ 阿里百川码力APM的监控体系

(编辑:济南站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!