大数据还是小数据?我们有选择吗?(一)

版主
版主

大数据还是小数据?我们有选择吗?(一)

大数据还是小数据?我们有选择吗?(一)

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese      Weibo Icon.gif                   

介绍

jim-shook-150x150.jpg

最近,法律界就数据存储的相关内容正上演一场风暴。双方就下面的问题进行了激烈的争论!

即我们应该寻找更好的管理数据的方法,使我们能够尽快摆脱已过期的数据呢?还是我们应该把所有的数据尽可能长时间的保留,依赖存储和搜索的改进来满足我们的业务和法规遵从性的要求呢?


大数据还是小数据?我们有选择吗?(一)

大数据还是小数据?我们有选择吗?(二)

更多信息

其实,辩论的双方都有他们各自充分的论据。

首先,让我们来看正方观点。他们的观点是过期数据应及时删除。下面是他们的论据。

组织保留了大量过期的、无用的数据。所以,摆脱它们是有道理的。因为,只有大约 1/3 的保留数据具有业务或法规遵从性的价值。

保留数据是有操作成本的。如用于生产和数据保护的存储,许可证,人员的时间等。这些随着管理的数据量的变化而变化。所以,定期删除数据可以帮助节省或至少推迟组织数据的增加量的支出。

当删除旧数据后,搜索新的和有用的信息是更容易和更有效的。我们在搜索结果中的数据浏览或审查是更方便的。那么,存储在部门的目录中的电子表格或 PowerPoint 就更容易地查找、更新和使用。同时,很多程序都有内置的搜索工具想做好搜索,但太多的数据量容易导致启动失败或崩溃,或者需要很长时间才能返回结果。使用较少的数据,我们可以有更好和更快速的搜索。

较小的数据量也更容易移动和操纵。当前,许多应用程序和数据集都移动到云中。这个过程的成本在很大程度上是基于数据量的。如果大量的数据需要来回移动,带宽的限制(数据已进入云)也可能会产生延迟等问题。

支持删除的另一个论据是基于 eDiscovery 的,因为它审查一个GB 的文件的成本约为 18000 美元。虽然新的工具正在开始改变这种模式,但一个组织持有越多的数据,相比限制旧数据,将为 eDiscovery 承担很大一笔开支。

最后,法规遵从性和隐私可能都朝着一个不好的方向移动。因为持有过期或不正确的数据将承担更大的责任,甚至可能违反某些法律。欧洲隐私法的原则之一是,一旦数据收集的目的已经完成,应该删除数据。大致相同的原则也存在于美国,尽管它只是信息公平原则的一部分。然而,数据集的特定信息丢失或被盗,如金融、信用卡、健康或社会安全号码,则会导致罚款、民事责任或尴尬的(可能非常昂贵的)通知程序。如果存储数据只是一种义务,那为什么还要保留所有数据呢?

以上就是正反观点。

那么,有关反方观点,即数据应尽可能的保留的论据,请看后续的系列二文章。

参考

Big Data or Little Data: Do We Have To Choose?

版本历史
修订号
1 / 1
上次更新时间:
‎11-18-2014 11:39 PM
更新依据: