网站首页 > 资源文章 正文
系统可用性差的主要原因有哪些?
整理总结下来主要有以下几个方面:
- 系统间依赖没有设置超时时间,导致资源耗尽;
- 系统发生频繁FGC、OOM、CPU负载过高等;
- 业务请求量激增,没有做好流量控制;
- 服务版本迭代进行发版过程中;
- 下游依赖发生故障;
- 系统硬件异常、磁盘故障、DNS故障、机房断电、光纤被挖坏、网络异常抖动等。
如何保证系统的稳定性?????
主要有4大利器:服务治理平台、全链路压测、故障演练和可观测系统。?
一般可分为事前、事中和事后。?????????
- 事前:梳理全压链路或者混沌注入的目标,确定可观测指标大盘,预期结果???????。??
- 事中:进行全压或者故障演练,并进行监控大盘观察???????。??
- 事后:分析是否符合全压或者演练预期,在服务治理平台进行服务稳定性加固,比如核心服务要对接口进行限流、核心服务对下游弱依赖配置熔断器、合理的超时和重试配置以及兜底配置。?????????
系统质量保障手段又有哪些手段?
- Code Review
- 严格控制发布流程?
- 完善的监控报警机制???????
- 混沌工程???????
- 完备的SOP预案???????
- 故障Review???????
- 服务高可用架构Review????????
----------------------------
不断分享开发过程用到的技术,如果您也对IT技术比较感兴趣可以「关注」我,让我们共同学习,共同进步!
- 上一篇: 干货|如何保证系统的高可用性?(怎么保证系统的安全性)
- 下一篇: 手把手教你如何进行可用性测试汇报
猜你喜欢
- 2024-11-04 系统设计:性能指标、伸缩性、扩展性、可用性、安全性
- 2024-11-04 企业如何通过熔断降级增强服务稳定性和系统可用性?
- 2024-11-04 对高可用系统的一点理解(高可用系统设计)
- 2024-11-04 分布式系统设计原则:如何实现高可用性和高性能
- 2024-11-04 保障网络版防火墙系统可用性的三个关键要素
- 2024-11-04 分布式系统中的CAP理论,面试必问,你理解了嘛?
- 2024-11-04 2022年信息系统项目管理师考点网络存储技术,软考高项学霸笔记
- 2024-11-04 如何编写自主式可用性测试脚本?(自动化测试脚本编写规范强调)
- 2024-11-04 分布式系统面试题之:消息队列的高可用性如何保证?
- 2024-11-04 如何做车载HMI可用性测试,看完你不会可以揍我
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 电脑显示器花屏 (79)
- 403 forbidden (65)
- linux怎么查看系统版本 (54)
- 补码运算 (63)
- 缓存服务器 (61)
- 定时重启 (59)
- plsql developer (73)
- 对话框打开时命令无法执行 (61)
- excel数据透视表 (72)
- oracle认证 (56)
- 网页不能复制 (84)
- photoshop外挂滤镜 (58)
- 网页无法复制粘贴 (55)
- vmware workstation 7 1 3 (78)
- jdk 64位下载 (65)
- phpstudy 2013 (66)
- 卡通形象生成 (55)
- psd模板免费下载 (67)
- shift (58)
- localhost打不开 (58)
- 检测代理服务器设置 (55)
- frequency (66)
- indesign教程 (55)
- 运行命令大全 (61)
- ping exe (64)
本文暂时没有评论,来添加一个吧(●'◡'●)