数据中心是承载 IT 基础架构的实体房间、建筑或设施,用于构建、运行和交付应用和服务,以及存储和管理与这些应用和服务相关的数据。
近年来,数据中心已从专供一家企业使用并受到严格控制的私有本地设施,发展成为由云服务提供商拥有的远程设施或这些设施构成的网络,这些设施容纳虚拟化的 IT 基础架构,供多家企业和客户共享使用。
存在不同类型的数据中心设施,根据工作负载和业务需求,一家企业可能使用多种类型的数据中心设施。
在这种数据中心模式中,所有 IT 基础架构和数据都位于本地。 许多企业选择建立自己的本地数据中心,因为他们觉得自己可以更好地控制信息安全,并且可以更方便地遵守《欧盟通用数据保护条例》(GDPR) 或《美国健康保险可移植性与责任法案》 (HIPAA) 等法规。 在企业数据中心内,公司负责所有部署、监控和管理任务。
云数据中心(也称为云计算数据中心)包含 IT 基础架构资源,可供多个客户(从数十个到数百万个不等)通过互联网连接共享使用。
许多最大型的云数据中心(称为超大规模数据中心)由主要的云服务提供商运营,包括 Amazon Web Services (AWS)、Google Cloud Platform、IBM Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure。 事实上,大多数主要的云提供商都在全球范围内运行多个超大规模数据中心。 通常,云服务提供商在比较接近云客户(以及云客户的客户)的地方,维持较小的边缘数据中心。 对于大数据分析、人工智能 (AI) 和内容交付应用等数据密集型实时工作负载,边缘数据中心有助于最大程度减少延迟,从而改善整体应用性能和客户体验。
对于因缺乏空间、人员或专业知识而无法在本地部署和管理部分或全部 IT 基础架构,又不想使用公有云数据中心的共享资源来托管该基础架构的组织而言,管理型数据中心和主机托管设施是理想之选。
在管理型数据中心内,客户企业从数据中心提供商那里租用专用服务器、存储和网络硬件,并由数据中心提供商为客户企业处理监控和管理工作。
在主机托管设施中,客户企业拥有所有基础架构,并租用该设施内的专用空间来托管基础架构。 在传统的主机托管模式中,客户企业拥有对硬件的唯一访问权和管理硬件的全部责任。这对于确保隐私和安全非常理想,但往往不切实际,特别是在发生停运或紧急情况时。 目前,大多数主机托管提供商都为有需要的客户提供管理和监控服务。
管理型数据中心和主机托管设施通常用于为中小企业 (SMB) 运行远程数据备份和灾难恢复技术。
大多数现代数据中心(甚至是企业内部的本地数据中心)已从传统 IT 架构(每个应用或工作负载都在自己的专用硬件上运行)发展成为云架构(CPU、存储、网络等物理硬件资源都已实现虚拟化)。 虚拟化 技术将这些资源从其物理限制中抽象出来,并汇集成容量池,可以根据需要的数量分配给多个应用和工作负载。
虚拟化还支持软件定义的基础架构 (SDI),即无需人工干预即可通过编程方式进行置备、配置、运行、维护和关闭的基础架构。
云架构与 SDI 的结合为数据中心及其用户带来了诸多优点,包括:
使计算、存储和网络资源实现最优利用率。 虚拟化技术使企业或云能够使用最少的硬件为最多的用户提供服务,并且最大程度减少未使用或闲置的容量。
快速部署应用和服务。 SDI 自动化使置备新基础架构就像通过自助式门户网站发出请求一样简单。
可扩展性。 与传统 IT 基础架构相比,虚拟化 IT 基础架构更易于扩展。 即便是使用本地数据中心的企业,也可以在计算需求激增时临时将工作负载部署到云端,按需增加容量。
各种服务和数据中心解决方案。 企业和云可通过同一基础架构,为用户提供一系列使用和交付 IT 的方式。 可根据工作负载需求选择服务,包括基础架构即服务 (IaaS)、平台即服务 (PaaS) 和软件即服务 (SaaS)。 这些服务可以在私有数据中心内提供,也可以在私有云、公有云、混合云或多云环境中作为云解决方案提供。
云原生开发。 容器化和无服务器计算,以及强大的开源生态系统,帮助加速完成 DevOps 周期和应用现代化,并支持开发“一次开发,随处部署”的应用。
服务器是向最终用户设备提供应用、服务和数据的功能强大的计算机。 数据中心服务器有多种外形规格:
机架式服务器 是宽大的扁平式独立服务器(尺寸相当于一个小比萨饼盒子),可在机架中相互堆叠,从而节省空间(与塔式或台式服务器相比)。 每台机架式服务器都有自己的电源、散热风扇、网络交换机和端口,以及常规的处理器、内存和存储设备。
刀片服务器 旨在节省更多空间。 每个刀片都包含处理器、网络控制器、内存,有时还包含存储器。它们安装在可容纳多个刀片式服务器的机箱中,机箱具有电源、网络管理和其他资源,供所有刀片服务器使用。
大型机 是具有多个处理器的高性能计算机,一台大型机可完成整个机房的机架式或刀片式服务器的工作。 作为第一种可虚拟化的计算机,大型机可以实时处理数十亿次计算和事务。
外形规格的选择取决于许多因素,包括数据中心的可用空间、服务器上运行的工作负载、可用电力和成本等。
大多数服务器都包含本地存储功能,称为直连存储 (DAS),以使最常用的数据(热数据)能够保留在靠近 CPU 的位置。
还有另外两种数据中心存储配置,即网络连接存储 (NAS) 和存储区域网络 (SAN)。
NAS 通过标准以太网连接为多台服务器提供数据存储和数据访问。 NAS 设备通常是具有多个存储介质(硬盘驱动器 (HDD) 和/或固态驱动器 (SSD)) 的专用服务器。
与 NAS 一样,SAN 支持共享存储,但 SAN 对数据使用单独的网络,由多个存储服务器、应用服务器和存储管理软件的复杂组合构成。
一个数据中心可使用所有三种存储配置:DAS、NAS 和 SAN,以及文件存储、块存储和对象存储类型。
数据中心网络由各种类型的交换机、路由器和光纤组成,在服务器之间传输网络流量(称为东/西流量),以及在服务器和客户端之间传输网络流量(称为北/南流量)。
如上所述,数据中心的网络服务通常是虚拟化的。 因此能够基于网络的物理基础架构创建软件定义的覆盖网络,以满足特定的安全控制或服务级别协议 (SLA) 的要求。
数据中心必须能够在各个层面都永续运行。 大多数服务器都具有双电源。 电池供电的不间断电源 (UPS) 可防止电涌和短暂停电。 如果发生更严重的停电事故,则会启动大功率发电机。
由于成千上万的服务器通过各种电缆连接,因此电缆管理是数据中心设计的一个重要问题。 如果电缆彼此靠得太近,可能会产生串扰,从而对数据传输速率和信号传输产生负面影响。 此外,如果太多的电缆挤在一起,则会产生过多的热量。 数据中心的建设和扩建必须考虑建筑规范和行业标准,以确保高效而安全的布线。
数据中心宕机会给数据中心提供商及其客户造成严重损失,因此数据中心运营商和架构师会竭尽全力提高系统的弹性。 这些措施包括独立磁盘冗余阵列 (RAID)(用于在存储介质发生故障时防止数据丢失或损坏),以及备用数据中心冷却基础设施(即使主冷却系统发生故障,也能使服务器在最佳温度下运行)。
许多大型数据中心提供商将多个数据中心分布在不同的地区,因此,当一个地区发生自然灾害或因政治原因导致运营中断时,可将运营“故障转移”到另一个地区,以确保不间断的服务。
Uptime Institute (链接位于 IBM.com 之外)使用四层系统,对数据中心的冗余和弹性进行评级:
第一层 — 提供基本冗余容量组件,如不间断电源 (UPS) 和 24/7 式持续冷却,以支持办公室环境或更高级别的 IT 运营。
第二层 — 增加了额外的冗余电源和冷却子系统,如发电机和储能设备,以提高安全性,防止中断。
第三层 — 添加了冗余组件,这是区别于其他数据中心的关键。 当设备需要维护或更换时,第三层设施不需要关闭。
第四层 — 通过实施多个物理隔离的独立冗余容量组件,提高容错能力,因此当一台设备发生故障时,不会对 IT 运营造成任何影响。
数据中心的设计和装备必须能够控制环境因素,大多数因素是相互关联的,它们可能会损坏或破坏硬件,并导致损失惨重或灾难性的宕机。
温度: 大多数数据中心采用空气冷却和液体冷却的某种组合,以确保服务器和其他硬件在适当的温度范围内运行。 空气冷却基本上是指空调,具体来说,是指针对整个服务器机房或特定的服务器排列或服务器机架的计算机机房空调 (CRAC)。 液体冷却技术将液体直接泵入处理器,或者在某些情况下将服务器浸入冷却液中。 数据中心提供商越来越多地使用液体冷却,以获得更高的能效和可持续能力。与空气冷却相比,液体冷却所需的电力和水资源更少。
湿度: 高湿度会导致设备生锈;低湿度会增加静电电涌的风险(见下文)。 湿度控制设备包括上述的 CRAC 系统、适当的通风和湿度传感器。
静电: 只需 25 伏的静电放电就会损坏设备或破坏数据。 数据中心设施配备了用于监测以及安全释放静电的装置。
火灾: 由于显而易见的原因,数据中心必须配备防火装置,并且必须定期进行测试。