最近在GitHub上发现了一个非常不错的AI Agent项目——hello-agents,这个项目是由Datawhale团队开源的,专门用来帮助大家快速上手AI智能体的开发。作为一个天天和各种开源项目打交道的运维人员,我觉得这个项目特别适合想要入门AI Agent开发的同学。说实话,之前我对A...
SMTP 与 IMAP ,这俩协议天天见,结果很多朋友只知道“收件服务器、发件服务器”那两栏要填啥,真正出问题了,全是一脸懵。既然问得多,我干脆把这几年在生产环境里折腾邮件系统的经验捋一遍,写成一篇文章。别讲那些教科书式的定义了,咱就从“问题怎么排”和“系统怎么设计”角度,把 SMTP 和 I...
说起金丝雀发布,我自己也是吃过亏的。之前在一家电商公司,有一次大促前夜做版本更新,直接全量切换,结果新版本有个缓存的 bug,商品价格显示异常,虽然只持续了十几分钟就回滚了,但那十几分钟的订单全部要人工核对,运营那边差点没把我们骂死。后来我们就开始研究灰度发布的方案,金丝雀发布就是其中最经典的...
说到线上排查问题,我想起前段时间遇到的一个头疼事。有个服务突然变得特别慢,用户投诉一大堆,领导也在催。各种监控指标看起来都正常,CPU、内存、网络都没啥异常,但就是慢得要死。这种时候你说慌不慌?表面上风平浪静,实际上程序内部不知道在搞什么鬼。传统的监控工具告诉你的信息有限,日志也没发现啥异常。...
说实话,搞安全这块东西,很多运维同学是又爱又恨。爱的是确实能帮你挡住不少事儿,恨的是部署起来各种坑,配不好还一堆误报,搞得你天天看告警看到想吐。我之前在客户公司负责过一套NIDS的完整落地,从前期调研到最后稳定运行,前前后后折腾了差不多两个月。今天就把这个过程掏出来跟大家聊聊,尽量把踩过的坑和...
热爱技术的云计算运维工程师,Python全栈工程师,分享开发经验与生活感悟。
欢迎关注我的微信公众号@运维躬行录,领取海量学习资料