滴滴全链路压测实践

作者/分享人:张晓庆
向 Ta 提问
现任滴滴技术专家,曾就职于ThoughtWorks,全栈工程师,有多年的软件开发、敏捷咨询经验。

稳定性是技术团队的命根子,滴滴也在搞全链路压测了。虽然才四五年,滴滴内部已经有众多系统,而且号称四大语言,八大框架,改造成本可想而知。如何做到釜底抽薪,支持线上环境的全链路压测?而且与一般电商不同,滴滴的交易是实时的,乘客发单,附近需要有司机能立即接单,顺风车尤为复杂,发压工具又面临着怎样的挑战?本场Chat将一一解开你心中的疑团。

实录提要:

  • 哪些类型的业务适合做全链路压测,运用这样测试方法的产品会有哪些特点?
  • 团队的构成和分工是怎样的,大概投入了多少人力、成本、性价比如何?
  • 压测是对产线的整个集群?还是专门布署了压力服务器 ?
  • 模拟的乘客、司机 App,他们都有独立的 IP 吗?
  • 路径规划服务又是如何压测的呢?
  • 虚拟司机如何虚拟开车移动的效果?
  • 压测完的数据清理做了哪些工作?
  • 支付接口是如何压测的,很多是第三方接口?
  • 怎么保证工具端的性能?
  • 滴滴自研工具的原理,跟 JMeter 类似?
  • 滴滴业务中,长连接通信,http 接口通信分别有哪些? 怎样模拟测试的?
已有354人预订
预订达标
文章出炉
交流日期
     
04月09日
04月23日
04月25日 20:30
查看文章评论/提问
ShenYi
原来真的是在太平洋虚拟之个中国来做压测啊,跟溜啊!
肖鹏: 有没有虚拟钓鱼执法的临时工🙃?
雪娜油菜花
现实的较量被Google、百度、马云搬上了虚拟世界,人类如果在将来的战争中杀人像玩游戏机用鼠标点点点的就完事了,多么可怕呀…
浣溪沙
滴滴压测时有个探索阶段,已经达到了200%,对于线程以及I/O方面的监测工具是什么?滴滴这种系统在100%至200%这个增长阶段中,有没有一些特别需要注意的地方?
DigitalSonic
请问在获得了压测结果后,链路的容量值后续又做了哪些事情?比如建立系统容量大盘和容量记录库,打通监控获得系统容量水位,甚至水位与运维系统联动,自动扩容缩容。 独立的压测集群和生产集群是等比例的,还是1比1?如果等比例缩小的,这个比例设计有何讲究么?
朱雷
我想问一下,对于结果,如何收集的,是否有历史数据的趋势统计。到业务层面的,还是接口层面的。还是有一个面板像K线图一样来展示历次响应时间的变动。测试频次是怎样的,每天还是每次发版
朱雷
每次压测的场景是固定的么?估测出被测系统的容量后,会和开发部门约定各个功能接口的调用频次么?比如A,B,C三个接口依次调用,比例都是1:1:1,如果哪天由于业务需要,比例关系变为1:10:1那么成10的接口可能会影响整个系统容量吧,如何避免这种情况,或者及时更新压测结果与容量模型,从而使数据更有指导性。如果会收集分析这样的数据,想了解一下是如何收集,如何更新,如何分析的。
朱雷
每次测试的压力是固定的么?通过收集响应时间来作为评判标准么?压力,响应时间和系统负荷三者的关系中,固定了那个么?
qian
滴滴业务中,长连接通信,http接口通信分别有哪些? 怎样模拟测试的?
qian
实际系统中,司机和乘客都是手机连接系统,测试中,没有手机,怎样模拟司机和乘客的? 模拟的司机和乘客,不是无线接入系统的,那么是怎样接入系统的?接入的是哪些接口?
liugc
@主持人沈毅 除了压测交易数据实时产生,应该也有很多其他类似用户数据需要提前准备,这部分数据在系统中怎么区分?
liugc: 这种压测方案在系统改造,测试数据准备,数据清理分别占整个压测的多少工作量?
籽藤
方便透露更多压测工具的细节吗?比如,是完全自研,还是基于什么开源框架做的?压测端的配置等。
baobao: 同问 想知道更多隔离方案和测试工具或者框架的实现细节 最后还能有测试结果分析
ShenYi: 同问
Marcus
图二左侧与右侧啥关系?
曹Robin
由于测试数据是在生产环境,想了解一下数据隔离的具体细节,比如不同库,不同表,配置文件等等。另外在数据隔离过程中遇到过什么大bug吗,需要注意些什么,谢谢
国徽Felix
非常值得学习的一个压测案例。能完成这么大的一个测试工程,很好奇你们测试团队的构成和分工是怎样的?
君不賤
设计实施运行这套方案大概投入了多少人力
Mark meng
这样工作量比较大,性价比如何,有哪些是必须通过线上压测才能发现的问题,又有哪些是做好线下压测就可以弥补的?
DLive
冒昧问几个问题 1. 压力数据都是来自线上的采样吗? 2. 压测是对产线的整个集群?还是专门布署了压力服务器 3. 使用的工具是什么? 4. 压测完的数据清理做了哪些工作?
DLive
报一个BUG 评论输入框。如果只粘贴了文字 没进行手动输入。 提交按钮是灰色的。无法点击
ShenYi: 哈哈哈,我上次也发现了,我通知wangyu弄下
王新明
运用这样测试方法的产品会有哪些特点?测试一般会基于哪些前提假设?
晴天
模拟的乘客、司机app,他们都有独立的ip吗? 谢谢。
张晓庆: 一个端会模拟很多司乘,端有自己的ip
你可能还喜欢
Service Mesh 在华为公有云的实践
田晓亮
从零开始,搭建 AI 音箱 Alexa 语音服务
Mike
Web 安全恩仇录:再谈逻辑漏洞
肖志华
如何用 Vue 实现前端权限控制(路由权限 + 视图权限 + 请求权限)
雅X共赏
智能增长:如何用大数据和人工智能实现业务体量的增长
蒋凡
有关 Mock 的是是非非
思考的犀牛
微信扫描登录