网站首页 > java教程 正文
怎么尽可能的减少线上故障带给自己的损失?
语雀这一波是阿里近几年最严重的故障没有之一,估计又有不少人要被离职,不少人要被降级了。雨雀是阿里推出的一款在线笔记软件,10月23日无法访问长达了8个小时。从公告上来看是由于运维升级工具导致。
为什么我说这是阿里近几年最严重的?是因为这次时间特别长,做过稳定性保障的应该都知道,SLA也就是服务等级协议。大的互联网公司都号称自己的系统可用性是4个9,也就是99.99。
什么意思?一年8760个小时,只有0.0001的停机时间,也就是全年停机档期的时间不超过52.6分钟。而这次雨雀故障了8个小时。
对于这种故障,阿里内部有专门的故障定级委员会,这次肯定是最高的P0级别。我记得上次这种大规模故障,十阿里云导致很多公司业务直接停止运行几个小时,那次大团队全部没有了年终奖和晋升的机会。有的高p从P11降到了P10,有的P10降到P9,这雨却公告上来看,这个故障运维工具升级确实是没有做足,上线后影响面的评估以及没有足够的时间去做恢复,这些都是造成这次故障的原因。
对于阿里这种规模来说要想全面的评估和测试也确实比较难。但是对于个人来说应该如何避免这种事发生在自己身上?也不好避免。避免涉及到可能影响到资损,线上故障的功能,你不要参与开发,不要参与上线,肯定没问题。但是系统稍微复杂一些,这些是没有办法完全评估到的,发生故障其实是在所难免。
如何保障自己的利益不被甩锅?教你一招就是转移风险。做技术评估的时候和产品技术测试都同步,可能会引起什么样的问题,什么样的风险,风险就会转移给项目组。测试的时候和测试同步,这里可能会产生问题,需要测试各种case。风险转移给测试上线之前可能出问题的地方做code review,让领导帮你把把关,风险转移给领导。
最后上下如果还出了问题,这锅产品开发测试领导都得背,这样可能罚你罚的就轻一些,实在不行还能和领导一起换工作。
关注我一个分享干货的技术博主。
- 上一篇: Java后端学习路线是什么?(java后端课程)
- 下一篇: Java后端需要学什么?收好这篇干货
猜你喜欢
- 2024-10-22 2023年底了,打算转行Java后端还有未来吗?
- 2024-10-22 Java后端开发常用规范(java后端开发常用规范有哪些)
- 2024-10-22 一款轻量级,可快速上手的开源后台系统
- 2024-10-22 Java程序员学习必备的19本书籍(java初学者必看的十本书籍)
- 2024-10-22 从零开始搭建JAVA后台管理系统——集成MybatisPlus
- 2024-10-22 程序员的快速开发框架:Github上 10 大优秀的开源后台控制面板
- 2024-10-22 这个Java开源后台管理系统,真牛!
- 2024-10-22 Java后端开发一年经验,跳槽如何准备?
- 2024-10-22 揭秘Java后端学习路线!快收藏(java后端教程)
- 2024-10-22 大数据方向的研究生,如果找不到大数据岗位,能否从事Java后端
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)