了解我们在中国开展业务的承诺。 阅读全文

利用人工智能打造卓越的 Web 应用程序防火墙

Akamai Wave Blue

寫於

Maxim ZavodchikTom Emmons

February 03, 2025

Maxim Zavodchik 是 Akamai 应用程序和 API 威胁研究部门的高级经理。

Tom Emmons

寫於

Tom Emmons

Tom Emmons 是一名数据爱好者,领导着一支专研机器学习和自动化的团队。他专攻 DDoS 和应用程序安全领域的专业知识。

 

我们不再被动应对威胁,而是利用 AI 技术主动出击。
我们不再被动应对威胁,而是利用 AI 技术主动出击。

对于攻击者来说,人工智能 (AI) 无疑为他们增添了助力。AI 不仅能让攻击者以更快、更创新的方式对公司发起最初的攻击,还能让那些更老练的攻击者在攻击被发现后迅速调整策略,并在几分钟内发起新的攻击,远超以往数小时甚至数天的反应速度。

好消息是 AI 和机器学习 (ML) 不仅仅可以为攻击者所用。自创立以来,Akamai 就一直走在 ML 和先进启发式创新领域的前沿,而且不断尝试利用 AI 和 ML 来抢先一步抵御攻击并消除漏洞。

一场技术的变革:AI 驱动的 Web 应用程序安全解决方案

安全负责人日益期望安全服务供应商能够将 ML 与 AI 结合起来,从而进一步加强网络安全防御。通过将 AI 集成到安全解决方案中,企业可以增强对各种 Web 应用程序网络威胁(包括 OWASP 十大安全风险中的威胁)的检测和应对能力。这些企业还可以在网络安全对抗中获得竞争优势。

这是一场向 AI 驱动的 Web 应用程序安全解决方案的技术变革,标志着相对于基于规则的传统系统的重大演进,将为应用程序安全等方面带来了更具动态性、前瞻性和更高效的防御机制。AI 可以提供一种先进、自适应的安全方法。由于 AI 可以分析海量数据集并以极高的准确率识别并应对潜在威胁,因此融合了 AI 功能的安全解决方案更有可能检测出零日威胁并实时自动更新保护措施,从而减轻安全团队的负担。

本博文将介绍相关的技术细节,让大家了解 AI 驱动的 Web 应用程序防火墙 (WAF) ,以及它如何通过提供出色的自动化防护和洞察力来确保您的应用程序安全无虞。

WAF 静态检测无法满足要求

基于云的传统 WAF 无法快速检测或阻止新的攻击,这会给企业带来不必要的风险。在从初始检测到延迟的抵御措施之间的时间内,攻击者可以造成重大损害。

这是因为其他提供商的 Web 应用程序防火墙严重依赖于静态 WAF 规则集和基于特征的检测机制——本质上是硬编码模式识别能力。只要攻击者做出了微小的改动,这种传统的方法就会产生检测漏洞,从而增加风险。每次检测到新的模式时,都必须手动更新依赖于硬编码模式识别的检测方法。

虽然对已知威胁很有效,但这些系统难以应对复杂的 零日攻击或者动态和多态攻击媒介。例如,基于正则表达式的规则是很多传统系统的基石,它们本身就存在局限性并且很容易出现漏洞。它们需要细致的手动管理,并且如果它们过于宽泛,则可能会导致误报。

考虑以下示例:

  • SQL 注入模式

‘UNION SELECT+user_pass+FROM+wp_users+WHERE+ID=
  • 良性模式

Select from the following menu options where available

如果一条正则表达式规则用于查找“select.*from.*where”,则上述两种模式都可能成为匹配项,从而导致误报。因此很难编写出不易受到此类问题影响的前瞻性正则表达式。尤其是零日攻击,往往需要创建额外的规则,这会导致威胁抵御出现延迟。

人工智能的优势

为了应对静态检测所带来的挑战,现代 WAF 使用 AI 来自动完成检测和抵御。AI 可以通过几种方式来实现此目的,包括:

  • 模式识别
  • 自适应学习
  • 零日和异常检测
  • 缩短响应时间

模式识别

机器学习算法擅长识别传统系统所遗漏的模式和异常。例如,它们可以通过识别静态规则无法识别的细微模式来增强或取代基于正则表达式的方法。此外,基于 AI 的算法还特别擅长从海量数据集中发现模式,而这些模式可能过于精细,导致静态技术无法发现它们。模式识别对于主动安全(识别良好输入的特征)和被动安全(识别不良输入)都非常重要。

自适应学习

启用了 AI 功能的系统可以随着攻击的出现而不断适应、优化和学习,并且能够自动增强检测和响应能力。 Akamai App & API Protector 会不断地向 Akamai 平台数万亿的请求学习,并利用得到改进的知识针对您的特定保护措施提供建议(可在我们的自适应自主调整中看到),同时还可以对 Web 应用程序和 API 防护应用自动更新。

零日和异常检测

AI 模型可以识别与正常行为的偏差,而静态模型通常无法做到这一点。例如,Web 流量模式的突然改变可能表明遭到攻击,即使它与已知特征不匹配也是如此。特别是被动安全从 AI 中受益匪浅,因为传统上规则集和特征定义了不良输入是什么样的,这意味着先前从未见过的不良输入不会触发抵御措施。即使 AI 算法先前从未见过某种新行为,它也可以将其识别为不良行为。

缩短响应时间

人工智能处理和分析数据的速度比人类更快。Akamai 使用 AI 来加快检测告警的速度,并且还可以缩短向您的帐户提供自动更新和主动自适应建议的时间。我们新推出的快速威胁检测功能能够快速部署针对新兴威胁和知名 CVE 的防护措施。客户随后可以使用我们的 CVE 查找工具来验证其防护措施。

利用多层机器学习策略保护 Web 安全

Akamai 采用多层策略来有效保护 Web 应用程序的安全。这种分阶段方式带来了诸多优势,例如精确识别触发告警的具体文本模式,以及准确地对多媒介攻击进行分类。这种多层方法可检测出已知攻击模式且误报率低,并且能够在训练过程中学习新的模式而无需明确的指令。

多层策略:

  • 使用自然语言处理 (NLP) 将 HTTP 请求词元化为 n-gram
  • 使用知名的算法将 n-gram 转换为向量
  • 将向量投射到攻击空间(SQLi、XSS 等)
  • 使用梯度提升树 (GBT) 模型分配攻击概率
  • 使用神经网络模型对攻击类型(SQLi、XSS 等)进行分类

使用自然语言处理 (NLP) 将 HTTP 请求词元化为 n-gram

我们对 HTTP 请求进行词元化以创建键值对,并从每个值中提取 n-gram(例如,“Give”、“the”、“cat”、“/etc/password”)。

使用知名的算法将 n-gram 转换为向量

我们使用 Skip-gram Word2Vec 模型等知名技术来获取 n-gram 的向量表示,从而加深对请求的上下文理解(图 1)。

Word2Vec 模型 图 1:CBOW 模型和 Skip-gram 模型的图形表示(来源:https://arxiv.org/pdf/1309.4168v1)

使用主成分分析 (PCA) 将向量投射到攻击空间

我们使用知名的降维技术 PCA 将向量投射到攻击空间,从而提取攻击特征。这对于数据分析和预处理都很有用。

使用梯度提升树 (GBT) 模型分配攻击概率

我们的 GBT 分类器结合了通过交叉验证优化的多个决策树(图 2)。此方法可以提高分类准确率,并且可以更有效地分配攻击概率。

我们的 GBT 分类器结合了通过交叉验证优化的多个决策树(图 2)。
我们的 GBT 分类器结合了通过交叉验证优化的多个决策树(图 2)。 图 2:这些方程表示 GBT 模型的迭代学习过程,其中弱决策树依次进行了优化,以最大程度减少损失

使用神经网络分类器对攻击类型(SQLi、XSS 等)进行分类

我们使用多类分类器来分配攻击类型,例如结构化查询语言注入 (SQLi)、跨站点脚本攻击 (XSS)、本地文件包含 (LFI)。我们的多层神经网络模型可通过选择概率最高的攻击组来确保分类的准确性。

扩展基于 AI 的应用程序和 API 安全:AI 驱动的 Client Reputation 集成

虽然基于云的 WAF 是 Web 应用程序和 API 安全的核心,但保护应用程序和 API 免受恶意流量的影响需要一组更广泛的 AI 功能。

在 Akamai 广泛的产品组合中,AI 驱动的 Client Reputation 系统是扩展解决方案的一个主要示例,该系统由 XGBoost 提供支持,用于检测共享 IP 地址,并提供适用于网络攻击者、DDoS 攻击爬虫程序、内容抓取程序和扫描器等类别的专用模型。通过从各个行业所遭受的历史攻击中收集见解,这些模型可以更快、更广泛、更准确地跨产品识别攻击者基础架构。

AI 的优劣取决于其训练时所使用的数据以及指导它的安全协议

Akamai 的人工智能和机器学习模型使用了数十亿的日常事件进行训练,以确保卓越的准确性和速度。我们的 AI 和 ML 平台遵循 MLOps 最佳实践——实现一致、可扩展且安全的模型部署。

但是,AI 需要有防护措施,并且其结论也需要进行确认。我们的 AI 实现方法建立在四个旨在确保准确性和安全性的层面上。

  1. 研究 — 促进实验、模型持久性和性能验证

  2. 制作 — 包括预处理转换、特征存储和模型版本控制

  3. KPI — 利用广泛的可视化工具监控模型性能

  4. 自动重新训练 — 通过使用经过验证的数据集进行重新训练,确保模型始终有效

确保安全。抢先一步防范攻击。

在 Akamai,我们致力于利用生成式人工智能和机器学习来重新定义保护 Web 应用程序的方式,以此塑造网络安全的未来。我们不再被动地应对威胁,而是利用 AI 来抢先一步防范攻击者的攻击、主动预防威胁,并确保我们的客户免受不断变化的风险侵扰。



Akamai Wave Blue

寫於

Maxim ZavodchikTom Emmons

February 03, 2025

Maxim Zavodchik 是 Akamai 应用程序和 API 威胁研究部门的高级经理。

Tom Emmons

寫於

Tom Emmons

Tom Emmons 是一名数据爱好者,领导着一支专研机器学习和自动化的团队。他专攻 DDoS 和应用程序安全领域的专业知识。