直播是通过互联网实时或近乎实时地传输视频和音频内容的过程。
直播重塑了人们传递和连接内容的方式。观众获得对⾳乐会、体育⼴播、产品发布、⽹络研讨会和视频游戏流等活动的实时、全球访问,⽽企业和内容分发者可以轻松进⾏直播,以提供更沉浸式(和即时)的内容。
与传统广播相比,直播有以下不同之处:
随着流媒体技术和能力的发展,直播的收视率及其对企业的实用性可能会继续扩大。2024 年第三季度,全球近 30% 的互联网用户会每周观看某种形式的直播内容。1 此外,2025 年至 2029 年间,全球直播市场规模预计将超过 200 亿美元。2
因此,对于希望凭借创新的“沉浸式”娱乐、教育和商业产品吸引全球受众的企业来说,直播是一个强大的工具。
延迟(即直播活动和观众屏幕之间的滞后)一直是直播主播面临的挑战。然而,超低和亚秒级延迟的内容分发网络 (CDN) 帮助企业克服了这个问题。
CDN 是地理位置分散的服务器网络,通过将 Web 内容的副本放在更靠近最终用户的位置来实现更快的 Web 性能。这些边缘服务器也称为“缓存”或“缓存服务器”是用户与源(主)服务器之间的网关。
CDN 中的每台服务器都存储来自源服务器的内容副本,包括 HTML 文件、图像、音频和视频。这样,当用户请求实时流内容时,他们可以从距离其位置最近的服务器接收流,而不是从可能距离数百或数千英里的主服务器接收流。
假设一组主题专家从纽约的一台笔记本电脑上开始进行直播,而包括悉尼观众在内的全球观众则通过智能手机加入直播。每个观众都通过离其位置最近的 CDN 服务器访问内容,而不是连接到一个中央服务器。在此示例中,悉尼观众可能会从悉尼或东南亚的 CDN 服务器访问内容。
CDN 服务器拉近了文件与客户的距离,减少了数据在网络中传输所需的时间,缩短了用户的加载时间,并将成本和带宽消耗降至最低。CDN 还提高了可扩展性,以便数千(甚至数万)名观众可以同时观看流媒体,而不会出现缓冲问题。
直播涉及几个向用户提供低延迟内容的关键流程:
直播活动始于内容源(连接到智能手机、网络摄像头和其他录制设备的摄像头和麦克风)所捕获的原始音频和视频数据。
在流式传输之前,必须将原始视频和音频信号编码为数字格式(一系列 1 和 0)并进行压缩,以使其适合通过互联网传输。编码是将数据转换成各种设备都能理解的数字格式的过程。常见的编码标准包括 MP3、AAC、H.264、H.265、VP9 和 AV1e3。
直播平台可以使用专用编码设备(硬件编码器)对数据进行编码,提供高性能专业直播所需的流媒体容量。不过,它们也可以使用计算机应用程序作为编码器(称为软件编码器),这为流式传输较小规模的制作提供了更灵活、更具成本效益的选择。
压缩是通过消除冗余元素来减小视频和音频数据大小的过程。例如,如果视频的第一帧显示一个人在紫色背景下说话,则可以在后续帧中重复使用紫色背景,而无需再次完全渲染。
此过程类似于在图书馆为书籍进行编目。图书管理员在新书到达图书馆时对其进行处理和编目,并将基本出版信息(书名、作者、出版商和出版日期)存储在图书馆网络内易于访问的位置。
如果图书管理员获得图书馆已经拥有的书籍系列的新版本,则他们不必对整个系列重新编目。他们只需在现有记录中添加丛书新卷的信息即可。
数字媒体内容(尤其是直播视频内容)包含海量数据。为了保持直播,流媒体工具将数据分成更小的片段(通常每个片段几秒钟)并将它们作为内容片段进行传输。
内容经过压缩、编码和分段后,就可以分发给观众了。为了向潜在的数百万用户提供高质量、低延迟的直播,流媒体服务依赖于 CDN。
CDN 服务器位于网络边缘,代表源服务器交付内容。因此,不是源服务器处理所有用户请求,而是由最靠近直播查看器的 CDN 服务器处理数据请求和路由。
参与直播的每个用户设备都使用专用的媒体播放器、基于浏览器的播放器或嵌入社交媒体平台(例如 Facebook Live、Instagram Live 或 TikTok 直播)的媒体播放器来接收、解码和解压缩分段直播数据。此过程使直播内容能够连续播放。
许多流媒体服务和媒体播放器提供自适应比特率流媒体功能,可以根据观众的互联网速度动态调整视频质量。自适应比特率有助于最大限度地减少缓冲问题。
直播的起源可以追溯到互联网的早期。20 世纪 90 年代初,随着互联网速度的提高和第一批能够支持直播的媒体播放器的出现,工程师们开始尝试在线直播视频。这些进步使人们能够实时观看和收听内容,但他们也面临着重大障碍(技术限制、带宽受限和视频质量差是常见的挑战)。
最早的直播成功案例是 1993 年 Severe Tire Damage 乐队的演唱会。随后在 1995 年,RealNetworks, Inc. 使用 RealPlayer 软件直播了一场棒球比赛,为未来的体育赛事直播和其他流媒体创新奠定了基础。
2005 年,随着 YouTube 的推出,环境再次发生变化。该视频共享平台继续在 2008 年举办了其⾸次全球直播活动,嘉宾包括流⾏ YouTube ⼈物,如说唱歌⼿ will.i.am、歌⼿ Esmée Denters 和喜剧演员 Bo Burnham。
时至今日,流媒体直播已无处不在,这主要归功于社交媒体和专用流媒体平台的兴起。Facebook Live、YouTube Live、Twitch、Instagram Live 甚至 LinkedIn 等服务让任何拥有智能手机或电脑的人都可以轻松向全球观众进行现场直播。
直播现在涵盖广泛的用例,例如从游戏锦标赛和现场音乐表演到教育课程和线上会议,而 CDN 的引入则彻底改变了流媒体内容的分发。如今,流媒体平台通常同时使用多个 CDN,这进一步体现了它们对于提供无缝、高质量流媒体的重要性。
其他显著趋势包括多流媒体直播(在多个平台上同时直播同一赛事)以及在“直播”中使用预先录制的视频,这使得创作者能够事先完善其内容,并将其作为“直播活动”进行播出。
区块链技术与直播平台的集成也带来了新的功能。区块链是一种不可更改的共享数字分类账,可在多个节点上存储数据,从而使区块链支持的直播流能够抵御篡改和网络威胁。它还能帮助企业建立分散的 CDN,在计算机上分发直播内容,这样流媒体平台就能更轻松地管理需求激增和波动。
直播应用程序可以使用各种协议通过互联网传输实时音频和视频内容。每种协议都有特定的应用程序,适合特定直播的协议取决于目标观众、设备兼容性、网络条件和特定用例等因素。
最广泛使用的协议包括:
RTMP 是最早用于直播流媒体的协议之一。它是一种有状态协议(在交互之间存储用户数据),主要用于在互联网上传输音频、视频和数据流。RTMP 通常与 Adobe Flash Player 一起使用,但自从 Flash 过时后,RTMP 的使用已经减少。
RTSP 是一种网络控制协议,允许客户端通过启用暂停、后退和快进功能来控制流媒体的播放。RTSP 可与实时传输协议 (RTP) 协同配合,将媒体数据传输到用户设备,特别是运行监控功能和正在监控应用程序的设备。
HLS 协议由 Apple 开发,可在标准 HTTP 上运行,因此对防火墙友好且易于实施。HLS 通常用于向各种设备(包括智能手机、平板电脑和智能电视)提供视频点播和直播视频文件,尤其是那些使用 iOS 和 macOS 操作系统的设备。
DASH 是由媒体编码标准联盟,即动态图像专家组 (MPEG) 开发的国际标准。DASH 可实现各种编解码器和格式的自适应流式传输。DASH 使用清单文件(包含一组文件的元数据的简单文本文件)来描述媒体片段位置及其属性。此功能有助于在直播和点播流媒体环境中实现高质量的流媒体直播。
SRT 是一种高度可靠的开源代码流式传输协议,可帮助企业在不可预测的网络中提供流畅的直播。SRT对数据进行加密,以便在传输过程中保护内容,并能很好地从数据包丢失中恢复。因此,它非常适合在专业环境中进行流媒体直播。
WebRTC 是一种安全的 开源协议,可使用简单的应用程序编程接口 (API) 在 Web 浏览器中实现实时点对点通信。WebRTC 可帮助内容提供商提供安全的视频、音频和数据流,而无需下载新的应用程序和插件。
对于个人用户来说,直播只需要一个录制设备(例如手机或笔记本电脑)和适合其内容的流媒体平台。但是,对于经常需要提供高质量、无摩擦流媒体体验的企业来说,直播流媒体可能需要:
企业需要能够处理多种输入并提供高级制作功能的专业流媒体软件,例如下三分之一(位于屏幕下部的图形叠加)、图形和远程访客集成(使远程参与者能够加入广播或活动)。
流媒体软件通常支持各种视频和音频源,包括用于传输未压缩视频的网络设备接口 (NDI) 源和用于压缩视频的串行数字接口 (SDI) 源。
对于内容交付,企业通常依赖企业视频平台,该平台提供精细分析、内容管理工具等功能,并能够与其他企业系统集成,例如客户关系管理系统 (CRM)。
全球 CDN 有助于以最低延迟面向全球观众分发数据流。
企业级直播需要稳定的高速互联网连接。组织通常需要至少 50 Mbps 的上传速度,尤其是对于高质量的多比特率或 4K 流媒体场景。为了确保最高的可靠性,组织可以设置来自不同提供商的冗余互联网连接,或使用搭载 4G/5G 调制解调器的蜂窝故障转移。
带宽(即网络在既定时间段内可传输的数据量)也是高质量直播的关键要素。更高的带宽意味着更高的数据传输量。为了实现高清流式传输,企业至少需要 5 Mbps 的带宽,但大规模直播可能需要 5 Gbps 以上的带宽来优化数据流质量。
直播流通常进行端到端加密,通常使用 AES-256 加密,以保护传输中的内容。如果需要,IT 团队可以实施访问控制(以及基于角色的权限、密码保护和地理封锁协议)来限制谁可以观看直播。
直播软件改变了媒体内容的消费和共享方式,其多功能性使其能够应用于各个商业领域和用例。
Twitch、YouTube Live 和 Facebook Gaming 等社交媒体游戏平台围绕内容创作者及其受众创建了充满活力的社区。游戏玩家可以直播他们的游戏玩法,提供评论、洞察分析以及与观众直接互动。
直播演唱会、戏剧表演和音乐节可以帮助主播触达全球受众,从而为用户提供幕后内容和交互体验。
直播应用程序为客户提供一种与客户互动并提高品牌忠诚度和客户信任度的创新方式。公司可以将其用于产品发布、演示、赞助公告和虚拟活动,以展示他们的产品并与客户实时互动。
它们还可以直播网络研讨会和现场问答环节,以帮助开发潜在客户、提供客户支持并建立思想领导力。
直播流媒体可支持新闻组织实时报道事件和突发新闻。记者可以从现场进行直播,让观众立即了解重大事件。观众还可以使用流媒体平台观看电视直播。
这种即时性增强了新闻报道的影响力,并推动观众通过现场采访和讨论小组进行直接互动。
公司通常使用视频会议软件(例如 Zoom)直播内部沟通活动,例如员工大会、公告、入职和培训会议。
战略性地使用直播提供重要的沟通,使所有员工无论身在何处,都能同时接收信息,并直接与公司领导层互动。
播放网络、体育联盟和各个团队通过直播在全球范围内播放游戏和比赛,让粉丝们能够像亲临现场一样体验赛事的精彩。流媒体平台还提供多角度摄像、实时分析和互动聊天等功能,以增强观看体验。
直播是促进客户和消费者之间联系和互动的宝贵工具。直播服务为企业带来几个主要优势:
但是,直播可能会带来一些挑战。
例如,如果用户在直播中遇到严重的延迟,他们可能会停止直播互动。对于游戏和体育直播来说尤其如此。此外,高质量直播具有大量的带宽和互联网连接要求。网络带宽不足和连接不稳定会降低用户的观看体验。
直播的演变重塑了企业和客户及媒体交互的方式,同时持续为全球娱乐、教育和商业交流开辟新的途径。
虚拟现实 (VR)、增强现实 (AR)和混合现实 (MR)(均支持用户与部分或完全模拟的数字环境进行交互)比以往任何时候都更容易实现。当与先进的直播工具相结合时,这些技术让观众能够在完全沉浸式的数字空间中参加现场活动,模糊了物理世界和虚拟世界之间的界限。
5G 网络的推出也有可能增强直播体验,在移动设备和其他联网设备上提供更高质量、更可靠的播放效果。
多平台流媒体,也称为多流媒体或跨平台流媒体,可以帮助内容创建者跨各个平台向观众进行直播。主播无需设置单独的流,而是可以使用专门的软件同时跨多个频道进行广播。
直播解决方案也开始融入人工智能 (AI) 和机器学习技术,以创造更流畅、更安全、更易访问的体验。AI 功能包括自动字幕和交互式叠加、个性化内容推荐、优化流质量和自动内容审核。
利用 AI 和 IBM® Automation 重新思考您的业务,让 IT 系统更具主动性,提升流程效率和员工的工作效率。
利用生成式 AI 提高 IT 自动化和运营水平,确保 IT 基础设施的各个方面与业务重点保持一致。
1 Share of internet users worldwide watching live streaming content on a weekly basis from 2nd quarter 2021 to 3rd quarter 2024, Statista.com, 24 February 2025.
2 Live streaming market to grow by USD 20.64 billion (2025-2029), driven by smartphone penetration & internet access, with AI redefining landscape, PR Newswire, 12 February 2025.