SRE
未读
2025年,SRE在企业中可以做哪些事
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 一、前言 在当今时代,AI 浪潮正以汹涌之势席卷各行各业,深刻地改变着我们的生活与工作模式。从医疗领域的智能诊断,到金融行业的风险预测,AI 的身影无处不在,它为各个行业带来了前所未有的机遇与变革。 在这场变革中,SRE(Site Reliabi
云原生
未读
k0rdent:重构云原生时代的分布式集群管理范式
在云原生技术蓬勃发展的当下,Kubernetes 已然成为容器编排的事实标准。然而,随着企业数字化转型加速,构建和管理大规模、多环境的 Kubernetes 基础设施面临诸多难题。k0rdent 的出现,为这些困境提供了创新性的解决方案,重塑了 Kubernetes 集群管理的格局,助力企业高效构建
随笔
未读
《我写酉阳,不仅是写酉阳》
我写酉阳,不仅是写酉阳,是写大山深处那一抹晨雾里的炊烟,是写童年时母亲站在吊脚楼前唤我回家吃饭的声音。 我写酉阳,不仅是写酉阳,是写武陵山脉千百年来沉默的守望,是写那些在悬崖峭壁间生生不息的生命力。 我写酉阳,不仅是写酉阳,是写河湾山寨里老人口中流传的摆手歌谣,是写那些被岁月打磨得发亮的民族记忆。
AI
未读
【转】使用Go开发MCP服务
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 MCP是什么 MCP,全名是Model Context Protocol,它是一个开放的、通用的、有共识的协议标准。 MCP是标准的协议,就像给AI大模型的一个万能接口,让AI模型能够与不同的数据源和工具进行无缝交互。 MCP 旨在替换碎片化的
【转】Kafka稳定性保障
要确保Kafka在使用过程中的稳定性,需要从kafka在业务中的使用周期进行依次保障。主要可以分为:事先预防(通过规范的使用、开发,预防问题产生)、运行时监控(保障集群稳定,出问题能及时发现)、故障时解决(有完整的应急预案)这三阶段。 事前预防 事先预防即通过规范的使用、开发,预防问题产生。主要包含
运维故事
未读
【转】人人都是质量工程师
01 产品业务差异 “知己知彼,百战百胜”,要想做的好,首先要认清B端产品与C端产品的差异: 产品使用人群不同,B端产品的用户几乎都是领域内专业人士,对业务非常熟悉,而C端产品的用户多属于泛行业,该领域的专业人士相对少很多,因此B端产品业务定制相对会多,业务要求往往也更高; 用户体量不同,B端用户由
运维故事
未读
运维是必需品,安全是奢侈品
最近在某群听到这句话:运维是必需品,安全是奢侈品。 安全,一直是大部分公司想引起重视,又不引起重视的存在。想引起重视的原因是安全问题不断出现,经常会听到某某云厂商的服务器不可用了,某某公司的服务器被入侵了,某某公司的数据库被前员工删了,层出不穷的安全问题让安全人员防不胜防。 就算如此,大部分
基于Prometheus的自动化巡检平台
✍ 道路千万条,安全第一条。操作不规范,运维两行泪。 前言 目前,大部分公司都采用Prometheus + Grafana这一套来做指标监控,所以在Prometheus中也有大量的指标数据。为了满足日常工作中的巡检,可以基于Prometheus实现自动巡检,减轻部分运维压力。