需要云计算吗? 即刻开始体验

TrafficPeak 如何助力提供出色的足球观赛体验

Nathan Hoffmann

寫於

Nathan Hoffmann

June 28, 2024

Nathan Hoffmann 在流媒体和电子商务工作流程的设计与优化方面拥有超过 20 年的丰富经验。作为 Akamai 的一名企业架构师,Nathan 在架构评估方面具备广泛的技术专业知识,能够出色地构建健康的优化路线图、识别恢复能力方面存在的风险和差距,并使项目与客户业务目标和投资回报率保持一致。在加入 Akamai 之前,Nathan 曾在 Walt Disney Studios 和美国国家橄榄球联盟担任过各种云架构师职位。

TrafficPeak 使我们能够实时监测媒体客户的数据,并据此平衡不同地理位置的流量。
TrafficPeak 使我们能够实时监测媒体客户的数据,并据此平衡不同地理位置的流量。

在重大比赛日,实时排除故障并解决潜在问题是确保赛事成功的关键。 TrafficPeak 使我们能够实时监测媒体客户的数据,并据此来平衡不同地理位置的流量,提供超出观众预期的流畅、可靠体验。

业务挑战

对 Akamai 来说,大型体育赛事是一年之中至为重要的活动之一,尤其是本年度的大型足球赛事。众多大型媒体公司都在使用我们的解决方案,向全球观众直播这些比赛。然而,为了确保每位观众都能在不受缓冲和中断困扰的情况下享受比赛,我们需要实时收集详细的数据。

本年度的足球决赛规模更甚以往。据报道,这是自阿波罗 11 号登月以来收视率最高的直播活动,平均观众人数接近了 1.24 亿。 流媒体 和广播公司是 Akamai 的两大客户领域,这也意味着确保他们在赛事期间大放异彩是我们的一项首要任务。

需要快速解决性能问题

在服务于一家媒体提供商时,我们的 Akamai 团队需要查询 CDN 日志,而这就必须在数秒之内完成数据检索。不走运的是,在流量达到峰值时,收集和分析 DataStream 2 及 CMCD 数据需要花费 20 分钟时间。无论是大型赛事还是其他任何直播活动,20 分钟都太过漫长,观众无法接受。

为了快速解决性能和安全问题,我们需要在观众还没感受到影响之前就实时获取数据洞察。我们需要实时准确地收集、分析和直观展示数据,例如地理位置、城市、州/省、自治系统编号 (ASN) 和服务器详细信息,才能更轻松地发现并修复错误。 

如果我们能立即发现哪些问题只发生在一个提供商身上,哪些问题散布在整个 ASN 网络中,就可以快速确定解决方法,例如将流量转移到不同地区以绕过受影响的传输路径。

在直播活动结束后的分析当中,我们还需要深入探究性能异常并查看其来源。这样,我们就能清晰了解它们的影响,并在数据驱动之下确定未来的应对方法。

大型赛事

由于 TrafficPeak 是由 Akamai 托管的一项 可观察性 服务,并 由 Hydrolix 提供支持,所以我们自然而然地将其用于大型赛事直播之中。该服务部署起来非常容易,自定义也毫不费力。

我们实现了对常用 ASN、响应代码和错误的直观展示,还能查看交付性能指标并发现某些地区的性能下降情况。例如,可以轻松地按城市筛选以查看性能是否符合要求,或者是否存在异常,然后在观众受到影响之前予以修复。

对我们来说,TrafficPeak 在以下三个方面提供了极大的价值:轻松自定义、实时数据和架构。

轻松自定义

作为一名技术人员,编写复杂的查询对我来说是一件很容易的事。即便如此,也能借助 TrafficPeak 在定制仪表板中自定义任何数据洞察,这是一种令人惊叹且印象深刻的能力。

实时数据

尽管有类似的解决方案(如 ELK Stack)可用于提取、处理和直观展示数据,但它们的速度却比不上 TrafficPeak。在流量高峰期,我们每秒收集的记录接近 1100 万条,并可在亚秒级时间内对数据进行切分和查询。如果是使用其他工具,恐怕很难达到这种速度。

架构

TrafficPeak 的设计适合在 Kubernetes之内工作。作为 Kubernetes 用户,我了解如何扩展和部署服务。其设计特别适用于云部署。很明显,围绕软件设计和后端架构产生了很多想法。

结果

我们收集了 530 亿条记录,将 41 TB 的原始数据压缩成只有 5.76 TB 的压缩数据并进行了存储。

大型赛事取得了巨大的成功。我们收集了 530 亿条记录,将 41 TB 的原始数据压缩成只有 5.76 TB 的压缩数据并进行了存储。我们遇到的错误极少,这要归功于 TrafficPeak 针对所发生的错误提供了实时监测能力,让我们能够立即作出改进。

此外,能够监测我们的所有数据也是一件极有助益的事。在直播活动中,一般很难实时查看并了解发生了什么。我们的媒体客户需要掌握平均比特率等指标,以便能够确保大多数用户享受到最高等级的性能。TrafficPeak 为我们提供了这些指标,使我们得以实时解决这些问题。

在活动结束后,我们还使用了 TrafficPeak 来深入探究已发生的任何性能问题。分析结果显示了我们下次可以在哪些方面作出改进,例如,重写筛选器以更好地发现类似问题。现在,我们已经知道了如何针对未来的活动构建合适的筛选器,同样的问题就不会再次发生了。

获享优势

利用 TrafficPeak 来发现并解决性能和安全性问题,始终做到先发制人。在提高盈利的同时,维护品牌的信任度和吸引力。



Nathan Hoffmann

寫於

Nathan Hoffmann

June 28, 2024

Nathan Hoffmann 在流媒体和电子商务工作流程的设计与优化方面拥有超过 20 年的丰富经验。作为 Akamai 的一名企业架构师,Nathan 在架构评估方面具备广泛的技术专业知识,能够出色地构建健康的优化路线图、识别恢复能力方面存在的风险和差距,并使项目与客户业务目标和投资回报率保持一致。在加入 Akamai 之前,Nathan 曾在 Walt Disney Studios 和美国国家橄榄球联盟担任过各种云架构师职位。