如果说我们从与 Kubernetes 用户的交谈中了解到一件事,那就是在大规模的情况下,优化可靠性、性能和成本效率是很困难的。

这就是为什么在不久前我们发布了 GKE 成本优化见解的预览版,这是 Google Cloud 控制台中的一个功能,可帮助您在 Google Kubernetes Engine 集群和工作负载中自动发现大规模优化机会,并将摩擦降到最小。

该功能允许您在选定的时间段内通过实际使用、请求和分配的资源来确定集群的当前状态。对于在您的集群上运行的工作负载,它会显示您实际使用和请求的资源,以及设置的限制,因此您可以进行精细的、工作负载级别的大小调整并实现合适的优化。

事实证明,GKE 成本优化见解一开始就受到用户的欢迎。例如,酒店搜索平台提供商 Trivago 的站点可靠性工程师 Arne Claus 说:“新的 GKE 成本优化见解视图帮助我们识别集群和工作负载级别的成本优化机会,并指导我们采取行动。在使用它的前几周,Trivago 团队发现并改善了多个集群的成本/性能平衡。”

今天,我们将 GKE 成本优化见解从预览版变为正式发布。它经历了多项改进,我们相信这些改进将帮助您完成日常优化任务。例如,我们可以更轻松地发现因资源请求不足而可能面临不稳定风险的工作负载。

现在您已经掌握了优化的机会,让我们回顾一下哪些功能对 GKE 的可靠性、性能和成本效益帮助最大,以及您的团队可以使用哪些资源来加快 GKE 成本优化的速度。

在公有云托管的 Kubernetes 服务中,存在会导致 Kubernetes 集群的使用没有得到优化的四大陷阱:

文化 —— 许多采用公有云的团队以前从未使用过像 GKE 这样的按需付费服务,因此他们不熟悉对资源分配和应用程序部署过程中如何影响成本。新的 GKE 成本优化见解可以帮助团队更好地了解这样的环境,并通过提供平衡成本、可靠性和性能需求的见解来帮助组织提升业务价值。

装箱 —— 将应用程序打包装箱到节点中的效率越高,成本节省就会越多。通过确保根据实际利用率请求正确数量的资源,您可以有效地将应用程序打包装箱到节点中。 GKE 成本优化见解可帮助您通过查看集群视图中的灰色条来识别装箱差距。

调整应用程序大小 —— 您需要能够为集群中部署的对象配置适当的资源请求和工作负载自动扩缩目标。您为 Pod 设置的准确资源量越精确,您的应用程序运行就越可靠。并且在大多数情况下,您在集群中打开的空间就越多。借助 GKE 成本优化见解,您可以通过查看集群和工作负载视图中的绿色条来可视化正确大小调整的信息。

基于需求的缩减 —— 为了在夜间等低需求时段节省成本,您的集群应该能够根据需求进行缩减。但是,在某些情况下,您可能无法缩减它们,因为存在无法驱逐的工作负载或因为集群配置错误。

GKE 成本优化见解可帮助您更好地理解和可视化这些陷阱。为了解决它们,或者让它们从一开始就不会成为问题,Google Cloud 提供了一系列解决方案。例如,您可以使用新的 GKE 成本优化见解来帮助监控并向 FinOps 进行文化转变。如果不想处理装箱问题,可以使用 Autopilot 操作模式。设置节点自动配置以及优化利用率配置文件也可以帮助优化装箱。为了帮助调整应用程序大小和基于需求的缩减,您可以利用 GKE Pod 自动扩缩器——除了经典的横向 Pod 自动扩缩器之外,我们还提供纵向 Pod 自动扩缩器和多维度 Pod 自动扩缩器。

我们在 GKE 最佳实践中介绍了有关 GKE 功能的文章,例如 Autopilot、优化的 VM 类型、节点自动配置、pod 自动扩缩器和其他功能,以减少过度配置。 这是学习如何解决新发现的优化机会的好地方。

如果您想更深入地了解技术细节,请浏览在 GKE 上运行成本优化的 Kubernetes 应用程序的最佳实践,这是一份 GKE 最佳实践的详尽列表。


相关推荐