查看原文
其他

​数据囤积可能会阻碍您的业务发展

常华Andy Andy730 2024-03-16
Source: Preston de Guise, Data Hoarding is Probably Holding your Business Back, March 27, 2023

如果你在IT行业工作了一段时间,你无疑会听说过Data Gravity。对我来说,这是一个强有力的理论,与我看到数据在许多组织中积累的方式产生了共鸣。

但问题是:数据引力同样适用于财务上有用的数据和垃圾数据。也就是说,我们经常在企业积累的有用或有价值的数据的背景下考虑数据引力,但管理数据积累的相同原则也适用于没有价值的数据。

一段时间以来,我一直在思考数据囤积。在2022年12月的最后几天,我父亲去世了。他很多东西,但他也是一个强迫性的囤积者。他囤积东西的方式没有任何健康之处。在他去世的前一年,他设法丢弃了超过40000张收藏的LP,但这对家庭来说是一次罕见的胜利。他坚持一种信念(我们一再有时温和有时直截了当地试图消除他的想法),即一旦他去世,我和我的兄弟将抽出6-12个月的时间,整理他积累的一切,并可以拍卖所有“最大的”价值。相反,在他去世后,我的亲戚们进行了艰苦的努力,清除了几吨垃圾。

现实生活中的囤积是一种疾病,它对囤积者或囤积者周围的人都没有帮助。

我认为,企业内部的数据囤积也不例外。特别是,囤积垃圾数据与现实生活中的囤积没有什么不同。充其量,这是一个不健康的组织的标志;在最坏的情况下,它可能会拖累业务的财务和速度。

当企业未正确遵循数据生命周期时,就会发生数据囤积。这应该如下图所示——强调了关键的两个步骤。

数据生命周期

为避免数据囤积,您必须:
  • 对传入数据(或已发生重大变化的数据)进行分类,以便您知道它是真实数据还是垃圾数据,以及
  • 在不再需要数据时将其删除。

您仍然需要关注数据生命周期的其余部分——使用、存储和归档——但是如果您不准备对数据进行分类(即,弄清楚它是什么,以及它对业务代表什么价值),或者在不再需要时将其删除,那么您就是在囤积数据。

囤积并非没有后果。我父母的房子很宽敞,街区上有多个储藏室——但当爸爸在世的时候,你真的不能移动超过一两步,而不会被垃圾和碎屑淹没。我在三月份清理后访问了这里,就像走进了某人刚刚搬进的新房子——有这么多的自由空间,令人叹为观止。

数据囤积也是如此。假设您在主存储上囤积了1TB的数据——如果这些数据被正确分类并被视为垃圾,这些数据可能会被删除。相反,您担心它以后可能会有价值,因此您继续存储它。但它位于一个存储平台上,该平台可以获取常规快照并复制到另一个站点——因此假设主存储消耗至少为2TB(假设数据没有更改,因此快照最少)。因此,在我们退出主存储平台之前,1TB已经变成了2TB。

然后,您就有了保护副本——您可以每周保留4个副本,并进行复制——即另外8TB(4TB本地备份,4TB复制备份)。(如果没有更改,我们可以假设每日增量备份无关紧要。而且因为你在囤积——因为你不知道它是否是以后可能好的数据——你正在每月备份并保留7年,并复制这些备份。(因此,每月备份为84TB,每月复制备份为84TB。)

您囤积的1TB未分类数据?在主副本和辅助副本之间,您将在7年内维护178TB的数据。
当然,重复数据删除将在缩小占用容量方面创造奇迹。事实上,也许占用的存储空间最终会相当低。但是逻辑副本大小仍然是我上面概述的。无论实际占用情况如何,存储大小都不是故事的结束——您还得到了:
  • 购置成本(对于本地化系统)
  • 支持/维护成本
  • 运营成本(对于本地:电源、冷却等。对于云:每月计费成本)
  • 管理成本(员工运营、培训和流程文档或托管服务)
  • 潜在的法律费用(如果有法庭案件并且数据被打包在数据发现过程中怎么办?)

不过,这1TB的未分类囤积数据不仅仅是企业的成本。这是一种分心。您要么让员工或托管服务团队花费一小部分时间来管理这些数据以及与之关联的所有副本,而这些成本和管理时间可能最好花在业务的某些已确定的有形需求上。

更糟糕的是,这就是数据引力的用武之地——但不是由围绕数据构建的应用程序和流程驱动的,当它是垃圾数据时,你会得到冷漠的数据引力:数据看起来很混乱,它只是一大堆,所以你最终会积累其他垃圾和伪垃圾数据,因为有一个方便的存储桶没有被测量。

您可能认为数据存档可以成为囤积的解决方案,但事实并非如此。或者更确切地说,它可以非常有效地将罐子踢到路上——但这不是一个解决方案,它只是推迟不可避免的事情(或将其传递给其他人)。事实上,归档囤积的垃圾数据只是一种成本转移;使用和管理存档平台仍然会产生成本(直接和间接)。而不是删除数据后的成本为零。

数据囤积的唯一真正解决方案是数据删除。您的企业会因此而感觉更健康。
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存