大数据还是小数据?我们有选择吗?(二)

版主
版主

大数据还是小数据?我们有选择吗?(二)

大数据还是小数据?我们有选择吗?(二)

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese Weibo Icon.gif                       

介绍

1120-1700.jpg


最近,法律界就数据存储的相关内容正上演一场风暴。双方就下面的问题进行了激烈的争论!

即我们应该寻找更好的管理数据的方法,使我们能够尽快摆脱已过期的数据呢?还是我们应该把所有的数据尽可能长时间的保留,依赖存储和搜索的改进来满足我们的业务和法规遵从性的要求呢?

大数据还是小数据?我们有选择吗?(一)

大数据还是小数据?我们有选择吗?(二)

更多信息

上一篇系列一文章介绍了正方的过期数据应及时删除的论据。

系列二文章将介绍反方观点。反方的观点为数据应尽可能的保留。下面是反方的论据。

所有的数据,甚至过期数据,如果它们可以被适当的利用,都可能是有价值的。在新的“大数据”的倡议和工具的背景下,许多组织利用搜集的数据能够更好地理解或预测趋势,确定最优库存水平和购买模式,甚至识别高风险员工的行为等等。

实际操作层面,存储成本在继续下降。所以,当前还有费用来保留数据的时候,许多人还是会毫不犹豫的将数据存储下来。因为他们认为,相比数据的潜在价值,存储成本是比较低的。随着存储和数据保护平台与软件的不断完善,需要管理和保护这些信息的时间越来越少。

法规遵从性的要求可以用更好的搜索和检索工具来满足。预测编码(Predictive Coding,一种“大数据”工具)保证,随着技术变得更好,eDiscovery审查的成本将显著降低。甚至还有一个更好的论据,经常删除“过期”数据的架构可能会产生毁灭数据的风险,此风险就等于或大于保留数据的所增加的成本。很多律师认为,对他们来说很难为组织进行辩护的原因是,大量的电子邮件和文件在案子审理之前已经被删除了。

以上为反方的论据。

双方都有各自的论据。那么,数据是应该保留,还是删除呢?

保留大量的数据,总是会伴随着高成本和高风险,特别是美国和国际上的法律在隐私和安全问题上的持续变化。然而,我们开始使用新的工具和算法帮助我们从大的数据集中搜索、管理和提取信息。所以,请考虑借鉴双方的观点:

·         良好的信息治理 – 映射您的数据源(可能是你的数据流)。了解什么样的信息被存储在哪里,它是如何被保护和保证安全,使用了哪些保留策略,以及有哪些可用的搜索工具等等。你不需要实际删除数据,除非你想。

·         相比其它,某些数据集反而可能是有用的,或者它能为你业务提供洞察力。例如,相比旧的电子邮件消息,生产制造、订单系统或财务等数据可能会洞察到更加深刻的内容。

·         当心“暗数据”(Dark data) – 离线或旧有的系统数据,通常很少有有洞察力的信息。暗数据可以是一个真正的法规遵从性和 eDiscovery 问题。至少暗数据从分析的角度无法为企业提供任何价值。

无论你的组织倾向于尽量长时间的保留数据还是尽早删除数据,围绕你的信息提供一些管理方法都是值得的。只要充分了解正反双方提到的论据相关的知识,你就可以做出一些明智的决定,获得最好的方法。

参考

Big Data or Little Data: Do We Have To Choose?

版本历史
修订号
1 / 1
上次更新时间:
‎11-23-2014 06:03 PM
更新依据: