查看原文
其他

集中式与分散式的数据系统 - 哪种最好?

常华Andy Andy730 2024-03-16

Source: David Weldon, Centralized vs. decentralized data systems —which choice is best? September 12, 2022

医疗保健和保险公司每年在支付和保险相关成本上花费近4960亿美元,由现代网络之父Tim Berners-Lee 创建的Inrupt安全架构主管Bruce Schneier 指出。随着数据量的持续增长,医疗保健服务商在治疗患者时越来越难以访问必要的信息。

Schneier认为,服务商通常转向集中式手段,例如医疗保健信息交换,但这些手段带来了一系列潜在问题。

“集中式系统面临安全漏洞的风险,以及道德和保密问题,”Schneier说“分散的数据系统可以为医疗保健服务商提供更好的重要数据和信息,并使民众能够控制共享哪些数据以及共享给哪些服务商。例如,一个人可以拥有自己的数据配置文件,并允许他们的医生访问他们预约所需的相关信息,从而获得更好的护理。”

在医疗保健领域使用集中式还是分散式数据的问题只是一个行业例子。为了帮助首席信息官们(无论行业如何)更好地了解每种方法的利弊,我们要求 Schneier详细说明利弊。对话的略微编辑版本如下:

问:请您尽可能详细地描述您认为以下每种情况中的关键因素:

集中式数据的优点

Schneier:中心化可能意味着很多不同的东西,这取决于应用场景。当我们在 Inrupt 谈论集中式数据架构时,我们指的是与其数据库紧密耦合的应用程序或在线服务。这是当今大多数事物的构建方式。来自应用或服务的所有用户的所有数据都虚拟地存储在同一位置,如果不是物理上。好处是,服务的制造商和运营商更容易优化其性能。

集中式数据的缺点

Schneier:你可以从多个层面来思考这个问题。在组织内部,当服务与其数据库紧密耦合时,会导致数据孤岛。每个大型组织都通过多个在线渠道或应用程序与其用户进行交互。但是对于集中式架构,在系统之间共享数据变得非常困难。很难将同一段数据重用于多种用途。集成会带来复杂性和不安全的风险。因此,用户数据最终会在孤岛中衰减,使用户感到沮丧并阻碍组织运行。

在更高层次上,集中化导致垄断。单个个人、一群人或公司对集中式数据系统的功能拥有权力,使其容易产生风险。还缺乏隐私,因为一些集中式数据系统与第三方共享用户数据。集中式数据系统也是黑客的大目标,使他们更容易受到破坏和数据盗窃的影响。

分散式数据的优点

Schneier:重要的变化不是关于数据的物理位置,而是关于应用程序和数据的分离。这有很多好处。在组织内部,系统自然是可互操作的。数据可以重用于新目的,而无需复制到其他位置,并且有关用户的所有数据都可以围绕用户进行组织,而不是绑定到它最初来自的应用程序。当这种重组是在用户的合作下完成的,它可以提高信任度和客户体验。

在更高层次上,分布式数据使人们重新控制自己的数据。从某种意义上说,您的数据是分布式的,没有一个组织可以控制它,但在某种程度上,它也“集中”在您周围。您可以与任何您想要的人共享,也可以不共享。

因此,当我们在线时,我们经常会在不同的网站上一遍又一遍地输入相同的数据,通常会忘记在此过程中我们与谁共享数据。除了作为一种更加私有和安全的模型之外,Solid(Inrupt的一项技术)的互操作性使系统具有生成性。新的想法来自将事物链接在一起,但我们今天无法将来自我们生活不同部分的数据链接在一起,因为它被困在集中式系统中。

集中式数据的缺点

Schneier:管理不包含用户个人信息的单一用途、仅限内部的数据集的公司可能不会看到像Solid这样的分布式数据系统的好处。

问:集中式系统与分散式系统相比,数据管理面临的最大挑战是什么?

Schneier:除了遵守隐私法规方面的挑战之外,集中式数据系统还创建了高价值的攻击目标-例如,包含1000万个信用卡号的单一数据库-这些目标吸引了拥有大量资源的黑客。以用户为中心的分布式数据完全改变了黑客的动机,因此对于大多数不属于网络安全核心业务的组织来说,破坏威胁更容易管理。

问:贵公司通常建议客户走哪条路线,在什么情况下?

Schneier:Inrupt的业务是围绕 Solid 的分布式数据方法构建的。我们在Inrupt的方法是帮助公司和政府看到将用户数据存储在“pod”中的好处 - 即以个人用户为中心的数据存储。这里的关键区别在于互操作性、数据质量和大规模合规性。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存