保存成功
保存失败,请重试
提交成功

基于 Netty 实现的 Gateway 遇到的问题总结

作者/分享人:蓬蒿
杭州信息安全院安全研发部负责人(2013 - 2016),负责Web网站安全监测服务平台( Web 漏洞、敏感词、挂马、暗链等)的架构、设计与实现,熟悉常见 Web 漏洞的基本原理与渗透方式。现担任中国互联网最大财税平台的架构师,负责业务安全开发、安全体系建设、业务风控、API Gateway 等工作,熟悉常见 Dubbo 、HSF、Spring Cloud 等分布式服务架构设计与与实现。

API Gateway 初期业务访问的峰值从 10万/min 上升至 12万/min,导致网关出现“too many open files”错误,即打开最大文件句柄数超过最大值。经过排查发现 Jupiter 网关出现该错误时设置的句柄数值为 65535,运维尝试将具柄数值设置为 655350。

网关服务在修改完句柄数之后重启 Java 进程,某几台网关服务在重启后具柄数值快速上升至 20 万。由于单台机器服务实例打开的句柄数过多占据了大量物理内存,导致 JVM 进程被 Linux 系统给 OOM Killer。

本场 Chat 将分享该线上问题完整的排查过程:

  1. Netty 服务假死排查过程;
  2. 分析并解决 Netty4 的 IO 处理线程池遇到耗时业务容易把后端的 NIO 线程挂死的问题。
已有119人预订
预订达标
文章出炉
     
02月15日
03月04日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张蓬蒿的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
被动收入 101 :使用云开发和 Taro 开发一个小程序
白宦成
数据结构算法常见的 100 道面试题全解析:2019 版
攻城狮
史上最全 Redis 面试题及答案,搞懂这套题征服面试官
ilomilo
10 个代码细节助你培养大牛思维
zaqweb
支付宝支付流程与服务端实现
江水
不把握好这 3 个原则,你的简历就是废纸
白朔天
快速成长:大学期间 0 到 100000 + 、拿到阿里 offer,我都做了什么?
latent
Zookeeper 详解与实践,你面试工作都绕不开的必考题!
latent
Java 编程(程序可靠性的 30 点建议)
OverWrite
深入浅出华为鸿蒙操作系统
闪客sun
轻松 TDD 之旅 2.0
张晓龙
进击的 Java ,云原生时代的蜕变
阿里巴巴云原生
Vue 实操指南
Fengy
基于爬取的 GitChat 平台数据进行分析
大数据和远方
Redis 数据库详解
小天空
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效