什么是数据中心？| IBM

什么是数据中心？

数据中心是一个物理房间、一座建筑物或一处设施，其中容纳着用于构建、运行和交付应用程序和服务，以及用于存储和管理与这些应用程序和服务相关的数据的 IT 基础设施。

近年来，数据中心已经从私有的、受到严格控制的本地设施演变为云服务提供商拥有的远程设施或设施网络，其中包含虚拟化 IT 基础设施，供多家公司和客户共享使用。

战略应用程序现代化推动数字化转型

战略应用程序现代化是转型成功的关键之一，可以提高年收入并降低维护和运行成本。

企业（本地）数据中心

在这种数据中心模型中，所有 IT 基础设施和数据都托管在本地。许多公司选择拥有自己的本地数据中心，因为他们觉得这样可以更好地管控信息安全，并且更易于遵守《欧盟通用数据保护条例》(GDPR) 或美国《健康保险流通和责任法案》(HIPAA) 等法规。在企业数据中心中，公司负责所有部署、监控和管理任务。

公共云数据中心

云数据中心（也称为云计算数据中心）存储 IT 基础架构资源，供多个客户（从数十个客户到数百万客户）通过 Internet 连接共享使用。

许多大型云数据中心（即超大规模数据中心）由 Amazon Web Services (AWS)、Google Cloud Platform、IBM® Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 等主要云服务提供商运营。事实上，大多数领先的云供应商在全球范围内运营多个超大规模数据中心。

通常，云服务供应商会维护较小的边缘数据中心，这些数据中心位于更靠近云客户（和云客户的客户）的位置。对于诸如大数据分析、人工智能 (AI) 和内容交付应用程序等实时、数据密集型工作负载，边缘数据中心可以帮助最大限度地减少延迟，从而提高整体应用程序性能和客户体验体验。

托管数据中心和主机托管设施

托管数据中心和主机托管设施适用于没有空间、人员或专业知识在本地部署和管理其部分或全部 IT 基础设施，但又不想使用公有云数据中心的共享资源托管基础设施的组织。

在托管数据中心中，客户公司从数据中心提供商处租用专用服务器、存储和网络硬件，数据中心提供商负责为客户公司进行管理、监控和维护。

在主机托管设施中，客户公司拥有所有基础设施，并租用专用空间将其托管在设施内。在传统的主机托管模式中，客户公司对硬件拥有唯一访问权，并全权负责管理硬件；这种模式对于隐私和安全来说是理想的选择，但通常不切实际，尤其是在停电或紧急情况下。如今，大多数主机托管提供商都为需要它们的客户提供管理和监控服务。

托管数据中心和主机托管设施通常用于为中小型企业 (SMB) 提供远程数据备份和灾难恢复技术。

数据中心架构

大多数现代数据中心（甚至本地部署数据中心）已经从传统的 IT 架构（即每个应用程序或工作负载都在自己的专用硬件上运行）演变为虚拟化的云架构（其 CPU、存储器、网络等物理硬件资源）。虚拟化使这些资源能够从其物理限制中抽象出来，并汇集到可以根据多个应用程序和工作负载的需要量进行分配的容量中。

虚拟化还能实现软件定义的基础设施 (SDI) - 这种基础设施可以通过编程方式调配、配置、运行、维护和“停机”，无需人工干预。

云架构和 SDI 的结合为数据中心及其用户提供了许多优势，包括：

最佳利用计算、存储和网络资源。虚拟化使公司或云能够使用最少的硬件为最多的用户提供服务，避免出现未使用或闲置容量。
快速部署应用程序和服务。SDI 自动化使配置新基础设施就像通过自助服务门户提交请求一样简单。
可扩展性。与传统 IT 基础架构相比，虚拟化 IT 基础架构更容易扩展。即使是使用本地数据中心的公司，也可以在需要时通过将工作负载突发到云来按需增加容量。
多种服务和数据中心解决方案。公司和云可以为用户提供多种使用和交付 IT 的方式，所有这些都基于同一基础设施。根据工作负载需求进行选择，包括基础结构即服务 (IaaS)、平台即服务 (PaaS) 和软件即服务 (SaaS)。这些服务可以在私有数据中心提供，也可以作为云解决方案提供在私有云、公有云、混合云或多云环境中。
云原生开发。容器化和无服务器计算，以及强大的开源生态系统，可以支持并加速 DevOps 开发运维周期和应用程序现代化，并实现了“一次开发，随处部署”的应用程序。

数据中心基础设施组件

服务器

服务器是功能强大的计算机，可向终端用户设备提供应用程序、服务和数据。数据中心服务器有多种形式：

机架式服务器是一种宽大的平板式独立服务器，大小相当于一个小号披萨盒，其设计可在机架上相互堆叠，以节省空间（相较于塔式或台式服务器）。每台机架式服务器都有自己的电源、冷却风扇、网络交换机和端口，以及通用处理器、内存和存储空间等。
刀片服务器旨在节省更多空间。每个刀片都包含处理器、网络控制器、内存和存储空间；其安装在可容纳多个刀片的机箱中，并包含所有刀片的电源、网络管理和其他资源。
大型机是具有多个处理器的高性能计算机，可以完成整个机架式或刀片式服务器的工作。作为第一批可虚拟化的计算机，大型机可以实时处理数十亿次计算和事务。

外形规格的选择取决于许多因素，包括数据中心的可用空间、服务器上运行的工作负载、可用功率和成本。

存储系统

大多数服务器都包含一些本地存储功能，称为直连存储 (DAS)，以使最常用的数据（热数据）保持在 CPU 附近。

另外两种数据中心存储配置包括网络直连存储 (NAS) 和存储区域网络 (SAN)。

NAS 通过标准以太网连接为多个服务器提供数据存储和数据访问。NAS 设备通常是一台专用服务器，配备多种存储介质，包括硬盘驱动器 (HDD) 和/或固态硬盘 (SSD)。

与 NAS 一样，SAN 支持共享存储，但对数据使用单独的网络，并由多个存储服务器、应用程序服务器和存储管理软件组成，结构更加复杂。

单个数据中心可以会同时使用三种存储配置（即 DAS、NAS 和 SAN）以及 File Storage、Block Storage 和 Object Storage 类型。

联网

数据中心网络由各种类型的交换机、路由器和光纤组成，负责在服务器之间传输网络流量（称为东/西流量）以及在服务器与客户端之间传输网络流量（称为南/北流量）。

如上所述，数据中心的网络服务通常是虚拟化的。这使其可以在网络的物理基础设施的基础上创建软件定义的叠加网络，以适应特定的安全控制或服务水平协议 (SLA)。

电源和电缆管理

数据中心需要在各个层面始终保持在线。大多数服务器都配备双电源。电池供电的不间断电源 (UPS）可防止电力激增和短暂停电。如果发生更严重的停电情况，可以启动大功率发电机。

由于数千台服务器通过各种电缆连接，电缆管理是数据中心设计的一个重要考虑要素。如果电缆彼此靠得太近，它们可能会导致串扰，进而对数据传输速率和信号传输产生负面影响。此外，太多电缆挤在一起，也可能会产生过多的热量。数据中心的建设和扩建必须考虑建筑规范和行业标准，以确保电缆布置高效且安全。

冗余和灾难恢复

数据中心停机时间对数据中心提供商及其客户来说都成本高昂，因此数据中心运营商和架构师会不遗余力地提高系统的弹性。这些措施包括从独立磁盘冗余阵列 (RAID)（用于在存储介质发生故障时防止数据丢失或损坏）到备份数据中心冷却基础设施（即使在主冷却系统发生故障时也能保持服务器在最佳温度下运行）。

许多大型数据中心提供商在地理理上不同的区域设有数据中心，因此，如果一个地区发生自然灾害或政治动荡，可以将业务故障切换到其他地区，以保证提供不间断服务。

Uptime Institute（ibm.com 外部链接）使用四个级别的系统对数据中心的冗余性和弹性进行评估：

第 1 级 - 提供基本的冗余容量组件，例如不间断电源 (UPS) 和全天候 24 小时冷却，以支持办公室或其他场所的 IT 运营。
第 2 级 - 增加额外的冗余电源和冷却子系统，例如发电机和储能设备，以提高对中断的安全性。
第 3 级 - 增加冗余组件，作为与其他数据中心的关键区别。第 3 级设施在设备需要维护或更换无需停机。
第 4 级 - 通过实施多个独立的、物理隔离的冗余容量组件来增加容错性，因此，当某个设备出现故障时，不会对 IT 运营产生影响。

环境控制

数据中心必须设计并配备用于控制环境因素（这些因素大多数是相互关联），这可能会损坏或破坏硬件，并导致高昂或灾难性的停机时间。

温度：大多数数据中心采用风冷和液冷的组合，以保持服务器和其他硬件在适当的温度范围内运行。风冷基本上就是空调，具体来说，是针对整个服务器机房或特定行或机架的机房空调 (CRAC)。液冷技术将液体直接泵送到处理器，或者在某些情况下将服务器浸入冷却液中。数据中心提供商越来越多地转向液冷技术，以提高能源效率和可持续性。与风冷相比，它需要更少的电力和水资源。

湿度：湿度高会导致设备生锈；湿度低则会增加电力激增的风险（见下文）。湿度控制设备包括上述 CRAC 系统、适当的通风和湿度传感器。

静电：只要 25 伏的静电放电就足以损坏设备或数据。数据中心设施配备了监测静电并安全放电的设备。

火灾：显而易见，数据中心须配备防火设备，并且定期进行测试。