Java 线上问题排查思路与工具使用

作者/分享人:蓬蒿
向 Ta 提问
白帽子,安全架构师。2013-2016某杭州信息安全院安全研发部负责人,负责《网站安全监测服务平台》(Web漏洞、敏感词、挂马、暗链等)的架构、设计与实现,熟悉常见web漏洞的渗透方式与防御方式。现为某财税平台的安全团队负责人,负责业务安全开发、安全体系建设、业务风控、API Gateway等工作。熟悉常见dubbo、hsf、spring cloud等分布式服务架构设计与开发。

作为一名 Java 程序猿,平常工作除了 coding 之外,大部分时间(70%~80%)是用来排查线上问题的。掌握 Java 服务线上问题排查思路并能够熟练排查问题常用工具/命令/平台是每一个 Java 程序猿进阶必须掌握的实战技能。线上问题从系统表象来看归结起来总共有四方面:CPU、内存、磁盘、网络。例如 CPU 使用率峰值突然飚高、内存溢出(泄露)、磁盘满了、网络流量异常、FullGC 等等问题。本场 Chat 我将分享:

  1. 总结 Java 服务常见的线上问题
  2. Linux 常用的性能分析工具使用以及分析:top(cpu)、free(内存)、df(磁盘)、dstat(网络流量)、pstack、vmstat、strace(底层系统调用)等
  3. JVM 定位问题工具:jps(进程)、jmap(内存)、jstack(线程)等
  4. JVM GC 日志分析
  5. 实战案列分析

定位问题的能力要与业务场景紧密结合,提升自己解决问题的能力,事后总结每次线上遇到的疑难杂症慢慢形成自己的知识体系,这才是每个对技术有追求同学的核心竞争力。

已有587人预订
预订达标
文章出炉
交流日期
     
17.12.15
01月02日
01月08日 20:30
查看文章评论/提问
李志博
这么好的文章,为什么要卖给大家,单卖我1个不好么。。
míng: ...
蓬蒿: 还会写一篇高级篇,服务化治理脚本
jackson: 第二篇啥时候出来,老师
yonguo
一般线上系统怎么做监控?
super
大佬们,jmap eden space 使用率接近100% 这说明什么呢? concurrent mark-sweep generation: 使用率也30%多说明了什么?
你可能还喜欢
Docker+K8S 集群环境搭建及分布式应用部署
李熠lynn
JVM 精华知识点汇总
胡玉洋
前端游戏框架哪个好
cba
MySQL 数据同步双机互备
小闲丶
Docker 入门之个人博客搭建教程
一念成魔
美团客户端响应式框架 EasyReact 开源
美团技术团队
微信扫描登录