现今,以 Kubernetes 等容器技术为底座的云原生架构已成为广泛流行的新一代企业 IT 基础设施。在互联网、金融、制造等关键行业,越来越多的云原生业务应用在生产环境中运行。
随着企业业务的发展,Kubernetes 集群数量和规模不断扩大,集群状态每时每刻都在发生变化,各个组件也在不断更新和升级,CPU 异常、内核死锁、容器运行时守护程序无响应、etcd 健康状况异常等各种难题让集群管理员叫苦不迭。
青云科技于近期正式发布 Kubernetes 集群巡检 SaaS 服务,完美解决集群管理员的苦恼,通过即时或周期性检查 Kubernetes 多云环境中的集群节点、组件等配置是否符合最佳实践,帮助用户及时发现集群组件、服务、端口中的容器漏洞和暴露(CVE),分析 Kubernetes 中的运行风险,并推送报告,从而保证业务持续稳定运行,尽早地降低企业风险。
集群巡检 SaaS 服务的发布,进一步丰富了 KubeSphere Cloud 云原生应用服务体系,与云原生备份容灾服务、轻量集群服务共同加速企业云原生转型。
本篇目录
集四大特性于一体,保证集群健康安全稳定
相较于基于白盒监控集群数据的传统巡检方式,集群巡检 SaaS 服务能够一键诊断 Kubernetes 集群健康状况,并具有四个显著特性:
跨云统一管理 Kubernetes 集群
支持一个统一平面管理任何云上的 Kubernetes 集群,对所有巡检结果进行集中监测,并配置定时巡检,让用户对集群、节点、应用的健康状态可以随时掌控。
全面满足业务级健康检查需求
能够全面满足集群控制平面、节点的问题检测等业务级需求,包括 Kube-APIServer、Etcd、Kube-Controller-Manager 等核心组件、CPU 利用率、Memory 与 Disk 压力,以及验证 Yaml 规范等。
定期检查集群存在的风险预警
支持定时(按小时、按天、按周、按月)对集群的节点和服务进行健康检查并生成巡检报告,以便周期性掌握集群健康情况,及时对异常或风险点进行处理。默认支持 28 个巡检项。
提供巡检结果可视化展示与报告
支持一键评估集群健康分数,巡检结果图形化展示,支持巡检报告导出与周期性邮件总结,一目了然,极大便利用户观察、监测集群安全状态,提前发现风险,尽早介入问题,完成配置变更。
面向四大应用场景,保证业务持续稳定运行
无论是对集群管理员还是对开发人员,集群巡检服务都可以带来极大帮助,让用户在放心使用 Kubernetes 的同时,减少人工检查和定位各种疑难杂症的工作量,提高工作效率,主要体现在四大应用场景:
日常运维排查
通过集群巡检 SaaS 服务,能够帮助用户消除 Kubernetes 集群日常运行中的安全漏洞和盲点,助力 DevSecOps 机制形成,确保 Kubernetes 上云原生业务应用持续可用,保障业务连续性。
安全合规审计
遇项目验收需第三方评测机构安全合规审计时,可通过集群巡检 SaaS 服务预先检测容器漏洞、安全配置与应用合规性,规避合规审计纰漏,尽早降低安全风险。
客户环境扫描与报告
基于集群巡检 SaaS 服务,能够定时、定向对客户 Kubernetes 集群或链路进行扫描,如 Etcd 冷热备多集群覆盖、风控配置、限流配置等,并周期性推送邮件报告,针对风险提供修复建议等。
资源成本优化
通过集群巡检 SaaS 服务,用户能够尽早了解业务中各资源消耗的情况,以便动态调整使用配置,优化 Kubernetes 成本,提升计算资源效能,助力降本增效。
为便于用户尽快体验使用,KubeSphere Cloud 集群巡检服务发布之际,推出“标准版”30天免费试用,用户可享受每月 50 次集群保护数、多至 3 个集群同时巡检、巡检报告可留存 30 天,以及体验巡检报告导出、邮件报告订阅、定时巡检等功能。
扫描下方二维码
🔻进群即可沟通、体验,期待您的使用反馈🔻