事故报告(2018某月)

时间

2018年某月

事故描述

半夜某业务操作超时

事故原因

业务操作mysql,表中存储了历史大量数据,查询速度变慢。

说这个问题,是因为临时接手项目,代码都不熟悉,突然来一个线上问题,头皮发麻,只能半夜打开电脑,现场看代码,用户又催的急,还好代码结构清晰,又有其他项目组员查看相关模块日志。

数据库设计时有定时清理功能,但是没想到业务发展快速超过了当时的设计速度,所以清理没有跟上,导致sql查询变慢,cpu 100%。 手动进行强制清理,问题修复。

总结

良好的编码习惯,清晰的代码逻辑 是一个优秀工程师的重要素质。