什么是 CloudOps(云运营)?

国际空间站 (ISS) 在亚马逊河上空的太空轨道

作者

Camilo Quiroz-Vázquez

IBM Staff Writer

什么是 CloudOps(云运营)?

CloudOps(云运营)是一个框架,结合了用于管理、交付和优化基于云的 IT 服务和工作负载的工具和最佳实践。

它可以跨公有云私有云混合云多云以及边缘使用,以提高基于云的应用程序和服务的性能、可用性、成本效率和安全性。

CloudOps 对于云计算的作用就像 DevOps(开发运维)对于应用程序开发和交付的作用一样,后者定义了一组操作流程和协议并监督它们的日常实施。CloudOps 强调使用自动化、跨团队协作和持续改进来提高云环境的价值、效率和可扩展性。一个组织的 CloudOps 方法通常由其整体云管理战略决定。

CloudOps 用于帮助组织维护云基础设施和服务、自动化软件交付和更新以及遵守服务级别协议 (SLA)。CloudOps 还可以帮助组织管理云安全性与合规性、改善应用程序和服务器管理,并在整个云资产中使用自动化(例如使用自动化来实时配置云资源以满足需求)。

DevOp(开发运维)类似,CloudOps 主要关注可见性和可观察性。CloudOps 团队使用分析、监控和报告(通常借助 AI 工具)来更深入地了解云性能和资源使用情况。借助这种洞察分析,CloudOps 团队可以实现系统自动化,从而改善云环境,减少 IT 蔓延和浪费,并帮助组织在云投资中实现更高的投资回报率。

高速公路鸟瞰图

在云端保持清醒头脑 


获取每周 Think 时事通讯,了解有关在 AI 时代优化多云设置的专家指导。

CloudOps 团队做什么?

CloudOps 团队专注于管理云资源的各个方面,他们的主要目标可以分为三个类别。

建立云治理

CloudOps 团队制定用于管理整个企业云资源的规则、策略和程序。此类策略包括设置网络安全协议,例如灾难恢复计划(以应对发生中断或恶意软件攻击的情况)以及监控和配置资源的指标。

当资源在云中迁移原生构建时,CloudOps 团队会确保云服务针对性能进行优化、满足业务和财务目标并且安全且符合法规要求。

实施云编排

对于许多组织来说,CloudOps 流程始于将传统资源迁移到云。云迁移过程包括选择适合组织的云平台(例如私有云、公共云、混合云或多云环境)、迁移数据和应用程序以及确保始终满足服务、安全和合规性要求。

云编排的一个重要部分是云资源的自动配置和取消配置。此过程允许组织快速扩展和删除不需要的资源,同时减少浪费和成本。

管理日常运营

制定云治理协议后,CloudOps 团队会与 IT 团队和 DevOps 团队合作实施。CloudOps 团队在整个应用生命周期中工作,并自动执行应用和服务的部署、监控和优化。

CloudOps 团队监控可观察性工具,以了解应用程序的性能,并努力解决出现的任何错误。通过这些洞察分析,CloudOps 团队开发补丁并部署到系统中,以优化其性能。

AI 学院

利用混合云实现 AI 就绪

本课程由 IBM 资深思想领袖带领,旨在帮助企业领导者获得所需的知识,以便划分可以推动增长的 AI 投资的优先级。

CloudOps 的优点

CloudOps 团队帮助组织实现云计算的优点,即与传统的本地 IT 基础设施相比,云技术提供的更好的灵活性、效率和战略价值。

成功的 CloudOps 实践可帮助组织实现以下目标:

持续运营和持续改进

通过采用 CloudOps 实践,组织可以最大限度地提高业务连续性,或者减少停机时间并为用户提供一致服务的能力。CloudOps 团队自动执行服务交付和软件开发流程,包括新代码的开发和测试。他们还监督将物理资源迁移到云端的过程,确保在此过程中工作流程和服务交付不会中断。

自动化和标准化工作流程可以快速配置资源以满足实时需求,最大限度地缩短部署时间并增强整体运营敏捷度。这种加速交付意味着更快的上市时间和更高的竞争力。

高可用性

CloudOps 非常重视可观察性、数据管理和编排流程,有助于实现服务和应用程序的不间断可用性,即使跨不同的云基础设施也是如此。通过实施强大的监控、故障转移机制和自动修复协议,组织可以最大限度地减少停机时间并保持高水平的服务可靠性。

高可用性对于向用户提供优质服务非常重要,并且对于服务提供商来说可能也是一个履约要求。通过以指标和日志来监控性能,CloudOps 团队可确保组织满足约定了服务条款(包括可用性)的服务级别协议 (SLA)。不满足 SLA 中规定的条款可能会导致罚款、处罚和组织声誉损失。

简化可扩展性

存储在数据中心的物理服务器进行维护、存储和在不再需要时退役的成本高昂且效率低下。相比之下,云资源可以按需提供,并且运行所需的物理硬件更少。

虚拟化可以抽象物理硬件,从而可以将单个服务器划分为多个虚拟机 (VM)云自动化工具使高效配置虚拟机成为可能。

CloudOps 团队还可以实时配置和取消配置存储空间和带宽,满足需求并移除昂贵的未使用资源。简化的可扩展性意味着组织可以采用敏捷模式来促进业务增长并适应不断变化的运营需求。

提高安全性

云解决方案为组织提供了新的机遇,但也给 CloudOps 团队带来了安全挑战。云环境容易受到网络安全威胁的影响,包括恶意软件、错误配置、弱凭证、不安全的 API 等。CloudOps 团队结合使用安全实践和第三方供应商工具来识别和缓解这些威胁,包括:

  • 数据加密:此过程将任何人都可以读取的明文数据转换为需要代码或密钥才能读取的数据。数据加密并不能防止数据泄露,但可以使泄露的数据难以破译,从而有助于减少损失。

    应用程序编程接口 (API) 使软件应用程序能够相互通信并跨云环境传输数据。加密通过 API 传输的数据流量是保护组织数据和客户数据的关键
  • 恶意软件保护:涉及恶意软件的网络攻击可能会导致大量数据泄露、扰乱服务交付,并可能导致组织不得不支付大额金钱来取回数据。CloudOps 团队实施各种战略,例如零信任网络架构,该架构验证所有网络用户、双因素身份验证 (2FA) 并创建事件响应计划,以在发生网络攻击时引导团队。

    CloudOps 团队还使用监控工具来发现网络流量中的异常行为。AI机器学习驱动的异常检测工具可以分析大型数据集并识别异常数据。发现异常数据可以识别安全风险或潜在的系统错误。CloudOps 团队负责监督安全更新(称为“补丁”)的发布,这些更新旨在修复通过监控流量发现的安全漏洞。
  • 安全访问管理:设置和监控谁可以访问特定 IT 运营的严格控制措施,帮助 CloudOps 团队保护敏感数据。它还可以通过确保更改默认密码并在整个企业范围内实施适当的密码协议来帮助 CloudOps 团队防止弱凭据。

成本节省

未经检查的云环境可能会导致云蔓延,或不需要的云服务和实例的增长。CloudOps 在优化资源分配、提高成本效益以及最大限度提高云基础设施和服务的投资回报率 (ROI) 方面发挥着至关重要的作用。

例如,CloudOps 团队使用各种工具来监控资源使用情况和性能指标,并确定其环境所需的资源。然后,他们可以自动化动态配置和取消配置资源的过程,以便只为所需的资源付费。这也是 CloudOps 跨学科性质的一个很好的例子。虽然 CloudOps 专注于云环境的运营和技术方面,但他们的工作与 FinOps 和其他团队有重叠,都能实现创建经济高效的云架构的业务目标。

CloudOps 最佳实践

CloudOps 的指导原则包括:

  • 提高利益相关者的可见性:建立成功的 CloudOps 实践的关键一步是为利益相关者提供对组织工作流程和资源的全面可见性。创建一站式界面或业务数据的集中视图(通常是提供对数据、图形和图表的轻松访问的仪表板)是消除孤岛并使 CloudOps、DevOps 和 FinOps 团队能够协同工作的关键。

    而隐藏的资源可能会造成浪费和安全漏洞,全面的可见性会促进 CloudOps 的协作性,并鼓励分享洞察分析和机构知识以推动创新。
  • 改进监控技术:借助云监控跟踪基于云的应用程序和系统的性能,CloudOps 团队能够收集和分析来自基于云的应用程序和服务的数据,并就如何提高运营效率提供洞察分析。

    云监控工具可帮助深入了解潜在的瓶颈、API 流量模式、网络配置和云特定的关键绩效指标 (KPI)。它们还使团队能够设置警报,以便在系统未达到指定阈值时自动发送通知。
  • 实施系统自动化:云架构需要持续监控以保持安全和高效。自动化可以改进云的多个运营方面,包括资源配置、修复错误和检测安全威胁。通过基础设施即代码 (IaC) 自动配置 IT 基础设施有助于提高云环境的效率。

    例如,CloudOps 团队可以自动化监控网络流量和云资源配置的系统,以帮助避免瓶颈并保持服务交付。
  • 提供随处访问:CloudOps 团队依赖数据以及可访问、易理解的仪表板和报告。云管理工具允许从任何符合组织安全协议的设备访问基于云的系统。增加对云系统的访问可以提高灵活性并增强团队之间的协作。随处访问是云原则的延伸,可以减少或消除对本地工作和资源的依赖。

CloudOps 与 DevOps

DevOps(开发运维)是一种将软件开发和 IT 运营团队的工作结合起来的方法。DevOps 原则允许所有利益相关者实时了解软件开发生命周期并提供输入。通过这种经过强化的合作,DevOps 致力于消除运营孤岛,加快开发工作流,缩短新产品的上市时间。

此外,通过称为持续整合和持续部署 (CI/CD) 的自动化工作流,DevOps 团队可以优化软件和应用程序的开发和部署流程。CI/CD 使团队能够实现构建、测试、整合和交付新代码的自动化,从而更快、更可靠地更新和发布新应用程序。当组织执行云迁移,或将本地资源转移到云时,IT 运营团队需要更多支持来维护云基础设施。

CloudOps 沿袭 DevOps 协作和自动化的实践并将其应用于云架构。DevOps 专注于软件开发,而 CloudOps 则专注于应对云计算的挑战,包括云资源的编排、可扩展性、安全性和减少云支出。强大的 CloudOps 战略有助于 DevOps 团队的工作,尤其是在开发基于云的应用程序时。

相关解决方案

IBM Cloud 免费套餐

创建免费 IBM Cloud 帐户并访问 40 多种始终免费的产品,包括 IBM Watson API。

创建帐户
IBM Cloud

IBM Cloud 是专为受监管行业设计的企业云平台,提供 AI 就绪、安全的混合解决方案。

深入了解云解决方案
云咨询服务

利用 IBM 的云咨询服务发掘新功能并提升业务敏捷性。了解如何通过混合云战略和专家合作共同制定解决方案、加快数字化转型并优化性能。

云服务
采取后续步骤

利用 IBM 安全可扩展平台释放 AI 和混合云的全部潜力。首先深入了解我们的 AI 就绪解决方案,或创建免费帐户,以访问始终免费的产品和服务。

深入了解 IBM® Cloud AI 解决方案 创建免费的 IBM Cloud 账户