CPU异常飙升这个问题,说大不大说小不小,有时候就是一个死循环,有时候是一个隐藏很深的GC问题,有时候甚至是一行正则表达式搞的鬼。但不管根因是什么,排查思路其实是有套路的。今天我就把这几年在生产环境中积累的CPU排查经验整理出来,从告警接入到最终定位,全流程走一遍。先搞清楚:CPU到底在忙什么...
前阵子 AWS 在 2026 年的 What's Next 大会上发布了 Amazon Quick,一个 AI 工作助手。说实话刚看到新闻的时候我没太当回事——又是一个 ChatGPT 套壳?但后来发现它有个桌面端应用 Amazon Quick Desktop,能直接访问本地文件、连接 Sla...
上个月我负责的业务线出了一次不大不小的事故,事后复盘发现一个很尴尬的事情:告警其实提前 20 分钟就触发了,但当时值班的同事压根没看到。为什么?因为那天光钉钉群里的告警就有 400 多条,绝大部分是无意义的抖动和重复,大家早就免疫了。这事之后我花了两周把告警体系重新治理了一遍,从每天 500 ...
上周末 Linus 把 7.1 推出来了。说实话,一般 .1 版本我不太会单独写文章聊,但这次翻了一下 changelog,发现几个改动还挺有意思的,尤其是搞存储和运维的兄弟可能会比较关注。先说最让我兴奋的——新的 NTFS 驱动终于合进主线了。NTFS 驱动重写:不只是"能写了"这么简单做过...
上周刷技术新闻,看到一条消息差点以为是恶搞:微软在 Build 2026 上正式发布了 Coreutils for Windows,把 75+ 个 Linux/Unix 命令原生搬到了 Windows 的 CMD 和 PowerShell 里。ls、grep、cat、cp、mv、rm、find...
热爱技术的云计算运维工程师,Python全栈工程师,分享开发经验与生活感悟。
欢迎关注我的微信公众号@运维躬行录,领取海量学习资料