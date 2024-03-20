什么是网站监控

作者

Keith O'Brien

Writer

IBM Consulting

网站监控的定义

网站监控是跟踪网站和 Web 服务性能，以确保最大可用性和最佳用户体验的做法。

组织使用网站监控来帮助减少或避免停机、延迟 和安全漏洞等问题。 快速、可访问的网站有助于提供更加无缝的最终用户体验，而缓慢或响应迟缓的网站和服务可能会导致糟糕的客户体验。糟糕的网站体验会削弱组织的品牌声誉，并可能严重影响其盈利。

随着企业通过网站为更多客户提供服务，网站监控（也称为网站性能监控）变得越来越重要。理想情况下，这些实践超越了监控，扩展到可观测性，或者根据其输出来衡量系统内部状态的能力。

随着新技术的出现，网站功能变得更加复杂。例如，许多组织现在使用机器学习和其他 AI 工具来服务客户，并使用 API 与外部来源的内容进行交互和整合。复杂性的增加意味着可能出错的地方更多，问题的影响也会更大。

此外，网络安全攻击呈上升趋势，给组织带来了更多潜在的陷阱。现代组织需要实时了解其网站的性能，以确保能够为客户提供快速、安全的服务。深度可见性还可以在事件和问题产生更实质性的影响之前对其进行适当的故障排除。

网站监控工具和技术

组织可以使用多种类型的网站监控解决方案和技术来优化其网站，并确保在适当的端点提供适当的服务。这些网站监控功能有助于识别组织在维护窗口期间解决的问题，避免对网站用户造成不必要的干扰。

大多数网站监控工具都使用自动化和即时警报，使 IT 和开发运维团队能够立即解决问题。此外，许多监控提供商使用基于云的技术，可以更轻松地根据需要扩展或缩减工具并在全球范围内监控网站。

应用程序性能监视 (APM)

APM 工具可帮助组织确保其应用程序以最佳方式运行，并提供有价值的用户体验。此类工具在使用相互依赖的技术（如容器和独立微服务）的组织中尤为重要。在这些环境中，一个应用程序或服务的故障可能会对许多其他应用程序产生级联影响，从而导致更严重的问题。APM 工具可以帮助缩短网站响应时间、优化应用程序性能并加速 CI/CD 管道

基础设施监控

基础架构监控包括跟踪、分析和管理组织后端组件的性能、可用性和运行状况。

真实用户监控（RUM）

真实用户监控工具将代码注入应用程序，以跟踪实际用户与应用程序交互时的运行情况。RUM 工具可帮助团队更好地了解数字用户体验，并识别实时环境中的问题。

综合监测 (SM)：

综合监控类似于 RUM，但它不是监控与应用程序交互的真实用户，而是使用模仿潜在用户行为的脚本来确定应用程序的工作方式。综合监控（也称为综合测试）创建客户行为的模拟，以确定应用程序对各种情况的反应。它可以根据位置、网络类型、设备类型等因素模拟用户交互。

Ping 监控

Ping 工具向域或 IP 地址发送重复的 ping 或短消息，以测量响应时间和网站可用性。

Webhook

Webhook 是一种回调函数，允许在两个 API 之间进行事件驱动的通信。 Webhook 用于在发生特定事件时自动触发指定的 IT 操作。

网络应用防火墙

此安全工具可监控 HTTP 流量，并有助于阻止恶意活动，例如分布式拒绝服务 (DDoS) 攻击、SQL 注入和网络钓鱼尝试。

重点监控领域

组织可以配置网站监控服务和工具，以广泛或狭窄的范围跟踪整个网站的性能。它们还可以关注特定领域或服务器和协议等外部因素。

服务器和传输控制协议/互联网协议 (TCP/IP)

TCP/IP 是一套通信协议，可在互联网上实现服务器之间以及服务器与客户之间的通信。服务器监控可以帮助确定是否是服务器配置导致了问题，或者服务器与其他设备之间是否存在通信问题。

单个网页

并非所有网站性能问题都是系统范围的。 组织必须能够跟踪页面级别的性能，以识别诸如错误代码的问题。他们还应该监控诸如插件和附加组件过多导致性能降低，或与全局脚本冲突的页面特定脚本问题。

购物车

直接在线向消费者销售产品的组织可能在其网站上有一个购物车，用户可以在其中输入他们的付款信息并完成产品或服务的订单。对于企业来说，监控购物车页面非常重要，因为结账问题会对销售和收入产生负面影响。

此外，结账安全问题可能会给组织和消费者带来重大问题。恶意行为者经常以网站的金融处理服务为目标来窃取信用卡号和其他信息。

SSL 证书

SSL 证书使用称为安全套接字层（通常称为 TLS 或传输层安全性）的安全协议来验证网站的身份。该协议在 Web 服务器和 Web 浏览器之间建立加密链接，确保安全通信。 SSL 证书确认客户端正在与经过身份验证的域服务器通信，这有助于防止欺骗攻击。SSL 证书还使企业能够使用 HTTPS（安全超文本传输协议），这是一种更安全的 HTTP 形式

所有 SSL 证书都有到期日期，组织必须重新授权才能延长该日期。如果 SSL 证书过期，访问者可能无法访问网站，或者可能会收到连接不安全的通知。这两种结果都会对网站流量产生负面影响。

域名系统 (DNS)

DNS 使用户能够使用人类可读的域名访问网站，而不必使用复杂的数字 IP 地址。配置正确且安全的 DNS 在网站性能方面起着重要作用，可确保用户快速访问他们正在搜索的网站。

事务监控

事务监控工具可帮助组织从用户的角度了解其网站的高级功能的表现。事务的示例包括表单提交、电子商务交易和用户身份验证。事务监控包括响应时间监控（跟踪操作发生所需的时间）和事务跟踪（确保事务按预期发生）。

网站监控指标

Web 性能监控会产生多个指标，组织可以使用这些指标来衡量其网站的性能并优化其在线状态。正常网站服务中断可能与事件或问题有关；事件是一个独立的问题，通常有一个简单的解决方案，而问题则往往与重复发生的事件有关。

在这两种情况下，组织都需要正确的信息和正确的工具来识别根本原因。借助这些信息，开发运维团队可以找到问题的解决方案以及未来预防此类问题的方法。

正常运行时间

网站正常运行时间反映了网站可供用户使用的时间百分比。正常运行时间监控是所有网站监控方法的关键组成部分 。如果网站出现故障，组织可以通过状态页面通知访问者，该页面会描述故障情况并提供预计恢复时间。它们还可以提供其他途径，让您了解更多关于组织及其产品或服务。 然而，即便使用最清晰的通信策略，也最好能保持最长的正常运行时间。

页面速度

这是用于跟踪页面加载速度的指标。页面速度不佳会影响搜索结果的排名，使用户更难找到组织的网站。企业可以设置阈值警报，当页面速度减慢到影响用户体验的程度时就会发出警报。页面速度是影响网页性能的几个关键决定因素的涵盖性术语：

  • 首字节时间 (TTFB)：TTFB 是浏览器发出请求与从响应服务器收到第一条信息之间的持续时间。

  • 网页加载时间：加载时间跟踪网页的响应时间，即到网页可供用户访问所需的时间。当用户遇到加载速度慢的问题，原因可能有很多。有些是用户端问题：由于互联网连接不良或用户硬件问题，导致页面加载缓慢。但服务器、配置或安全问题也会导致页面加载缓慢。一个在加载时间上遇到问题的组织可能会因为竞争对手能够提供快速（且一致）的网络体验而失去客户。

  • 最大内容绘制 (LCP)：此指标确定加载页面主要内容（如最大的图像或文本文件）需要多长时间。

错误率

错误率是指发生的错误数量与向网站发出的请求数量之比。该指标跟踪几个问题，例如 404 错误（未找到网页）和 500 错误（内部服务器错误）。

带宽使用

它跟踪每秒在组织的服务器和用户设备之间传输多少数据。带宽过少会导致性能明显降低，而为过多的带宽付费会增加不必要的成本。准确的带宽使用量计量可以帮助组织找到适当的平衡点。

网站监控的优势

优先考虑网站监控并制定全面计划来提高网站性能的组织可以通过多种方式受益，包括：

减少停机时间

当网站问题影响整体服务交付时，IT 和网络服务团队会收到自动即时警报，以便最大限度地减少停机时间。最大限度减少停机时间对客户满意度有积极影响，并有助于确保组织遵守其 服务级别协议 (SLA)
增强安全性和数据完整性

网络攻击 呈上升趋势，确保网站安全需要时刻保持警惕。考虑到有很多组织在线获取客户的支付信息，增强的威胁预防措施尤为重要；这种交换会创建多种形式的数据，此类数据对犯罪分子来说可能是有利可图的。安全和数据完整性问题可能会产生巨大的财务和声誉影响；保护客户数据必须是组织的首要任务。
改进搜索引擎结果

保持最佳加载时间和网站速度，并最大限度地减少延迟 和其他性能问题，有助于网站在搜索结果中获得高排名， 从而增加网站流量。
更高的转化率

对网站进行监控的组织更有可能解决页面加载缓慢、服务问题和结账问题，这些问题会降低转化率。通过主动解决问题（或完全预测和预防问题），组织可以提高其转化率。
性能优化

网站监控为组织提供了识别和消除瓶颈所需的信息，并在性能问题和事件成为更大的问题之前解决它们。此技术 有助于优化性能并改善用户与网站的交互。
