查看原文
其他

AI如何改变数据保护:可能带来一轮革新

常华Andy Andy730 2024-03-16

【ANDY】AI可能帮助解决的问题:1.数据保护(备份/归档)最大的问题是保存的数据除了做恢复不能用作它用。2.对于上规模的用户,备份/恢复/应急管理/业务连续性管理的细节过于复杂。3.要选择哪些数据进行备份/恢复。

Source: Christophe Bertrand, How AI might change the data protection space, 25 May 2023

众所周知,如今人人都在谈论AI,包括生成式AI。最近,我与企业战略小组的首席分析师 Mike Leone 进行了一次讨论。我很好奇他对AI如何改变数据保护策略以及如何与备份和恢复工具相结合或应该如何使用的看法。

首先,我对AI在备份和恢复环境中的当前角色特别感兴趣:它是否会带来新的数据保护或合规需求?从运营效率的角度来看,它能做些什么?AI在恢复过程中可以做些什么?

AI作为防勒索病毒工具

AI在防勒索病毒方面的作用是为运营团队提供更高效地完成日常任务的能力。这可能包括自动监控和管理,以及在出现问题时更快地做出响应。让我们以网络韧性(cyber-resiliency)为例。

AI使您能够更智能地应对勒索病毒攻击,例如通过检测并积极使用预测分析来使用现有数据。AI还可以帮助大规模地完成所有这些工作,这是关键。

组织可以以几种不同的方式利用AI来帮助防范勒索病毒攻击或在攻击发生后做出响应。恢复准备是一个方面,但实际上,组织不希望首先发生成功的攻击,而是希望防止攻击发生。

将准备工作提升到更高的水平,能够测试对抗性反应,并能够利用数据模拟不同类型的攻击,这将非常强大。

这凸显了基本建模和监控的重要组成部分。如今,异常检测和预测发挥了作用。它帮助组织了解数据中的一些正常模式和行为。组织正在分析大量数据,但您必须跟上这样的事实,即其中一些攻击将非常智能。

注意数据泛滥问题

不幸的是,不法分子也将使用AI。生成式AI可以通过两种方式在此处使用。首先,了解现有数据的模式和行为。其次,生成具有微小变化的合成数据集,以模拟和测试用于监控方法的算法。这是否意味着会有更多的数据泛滥?

仔细观察组织已经面临的数据泛滥问题,总的来说,AI的使用实际上可能是大规模数据创建的另一个来源。当在组织内部使用定制的大型语言模型提供私密合规的ChatGPT式体验时,将会产生大量数据。组织将使用越来越多的数据来支持AI。实施越成熟,应用场景越多,使用的数据越多。您需要确保所有数据都受到保护并可恢复,以通过审计。合规性组件在这个领域将变得非常重要。

这引出了关于数据保护方面的许多疑问和事情:它是否都重要?是否应该备份所有数据?这将是数据保护领域的一个全新机会,为组织内部由这些大型语言模型生成的数据制定备份计划。

智能数据恢复

我们明白您需要恢复并重新恢复业务的问题是迟早会发生的。我们相信,AI可以帮助加速恢复过程,使恢复计划更容易实施。它可能需要与安全流程和团队完全集成,例如使用算法来通过真正理解数据的关系和依赖关系来加快恢复速度并提高准确性。

当您了解数据之间的关系时,机器学习模型可以理解依赖关系并确定需要恢复的内容的优先级。这本质上是恢复的下一个阶段,我们可以称之为“智能数据恢复”。这个阶段的目标是减少恢复关键系统所需的时间并最小化停机时间。

利用备份数据实现更多

随着AI的更多使用,包括生成式AI能力,我们预计将看到超出当前场景范围的扩展应用,例如我们提到的勒索病毒和预测场景。更好地理解数据组件之间的关系不仅有助于智能恢复,还有助于满足合规性需求,例如电子发现。利用AI进行类似机器人功能的能力可能会开启简单明了的全新报告时代。

AI治理和负责任的AI的更大图景也在此讨论中变得重要起来。通过从备份和归档基础设施中访问组织的几乎所有数据,您应该允许用户执行哪些操作?您可以构建的(私有)模型是否有一些限制?

我们预计在接下来的几个季度中,备份和恢复供应商将在这个话题上有更多的表述,但同时也要注意:不要仅仅"AI化"您的信息。明确阐述您的观点、策略、场景和治理规范。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存