说个真事儿。上个月客户大促,流量刚上来,客服那边就炸锅了。说是有个核心下单页面,部分用户点了“支付”没反应。我们一群人在会议室里大眼瞪小眼。后端看监控,QPS 正常,报错率为零;前端在复现,怎么点都能跳出二维码。要是搁以前,这锅大概率就得运维背,什么“网络波动”、“CDN 缓存没刷”之类的理由...
昨天晚上又被客户叫去处理线上问题,服务器连不上,重启后排查是什么导致故障,我在那里一顿操作猛如虎,top、free、iostat轮番上阵,但总感觉看不到全貌。后来想起来用sar一分析,嘿,问题马上就清楚了。说起sar这个工具,可能很多朋友都听过,但真正用好的人不多。我刚开始做运维那会儿,也是对...
最近总有朋友问我Docker到底是个啥,怎么用,感觉很高大上但又不知道从哪里下手。说实话,我刚开始接触Docker的时候也是一脸懵逼,各种概念搞得头大。不过用了几年下来,现在回头看,Docker真的是个好东西,能解决很多实际问题。今天就来聊聊Docker的实际使用,不讲那些虚头巴脑的理论,直接...
第一卷:混沌初开 —— 启动、工具链与构建系统 (深度展开版)本卷目标:在代码还没跑起来之前,理解代码是如何变成二进制,以及二进制是如何被加载并控制 CPU 的。第一章:从按下电源到 Login Prompt (The Boot Process)大多数工程师只知道“BIOS -> MBR...
昨晚有个做开发的朋友请我撸串,几瓶黄汤下肚,抱着我哭。说他们组自己搭的 Kafka 集群,最近老是莫名其妙的 Rebalance,消费端卡得跟PPT似的,运维又不给力,锅全扣他头上了。我一听,这剧本我熟啊。很多公司不管大不大,都喜欢用 Kafka。为啥?吞吐量大啊,削峰填谷神器啊。但是,Kaf...
热爱技术的云计算运维工程师,Python全栈工程师,分享开发经验与生活感悟。
欢迎关注我的微信公众号@运维躬行录,领取海量学习资料