tomcat8890
1 Copper

云计算和大数据的2个问题

转到解答

花了两天时间看完,佩服楼主的用心!

不知道能否谈谈对以下两个问题的看法,也许问题不专业:

1、云计算和网格(grid)计算有啥区别和进步?

2、大数据和数据挖掘相比有何区别和发展?

0 项奖励
6 条回复6
Yanhong1
4 Germanium

Re: 云计算和大数据的2个问题

转到解答

lz,我把你的问题分支出来,这样更多的人可以看到并参与讨论。谢谢

0 项奖励
版主
版主

Re: 云计算和大数据的2个问题

转到解答

我在维基百科上分别查了一下这些词汇的解释,以及找了一些文档,个人觉得下面这部分讲的还算比较容易理解,供参考。

云计算与网格计算的区别:

概念方面

在概念上,两者的各有侧重,网格计算主要强调的将一个巨大的问题分成许多个子问题,并通过许多个子节点分别对这些子问题进行计算。而云计算则强调通过后端的大型云计算中心来同时为多个用户服务。

领域和需求方面

网格计算这个概念是诞生在学术界,主要是为了解决处理大型的计算难题,比如,寻找并发现对抗艾滋病毒更为有效的药物或查找那个地方会存有石油等。而云计算则诞生在工程界,也就是Google的数据中心,主要是为了满足用户海量的搜索请求等。

架构方面

在架构方面,网格计算和云计算都可分为后端和前端这两部分,但在网格计算中计算工作主要由前端来完成,后端主要用于调度任务。而在云计算中计算工作则主要由后端的大型云计算中心完成,其前端是用来接受后端的计算成果并显示。还有,在网格计算中参与计算的设备经常是异构的,比如,运行Windows的笔记本和运行Unix的小型机等,而在云计算中参与计算的设备往往是同构的,比如运行LinuxX86服务器,这样的做法不仅能简化管理,而且能提升运行效率。

至于大数据与数据挖掘的区别,先看维基百科的解释。

大数据(Big data),或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。

数据挖掘(Data mining),又译为资料探勘、数据挖掘、数据采矿。它是数据库知识发现(英文:Knowledge-Discovery in Databases,缩写:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。

所以,个人认为数据挖掘应该就是实现大数据的价值的途径。即通过数据挖掘技术,将大数据中所包含的有用的价值挖掘、转化并显示出来。

Roger_Wu
5 Tungsten

Re: 云计算和大数据的2个问题

转到解答

云计算刚出来的时候,讨论比较多的还有它与并行、网格、集群计算的区别。一般说法是云计算是分布式计算、并行计算和网格计算的发展,是过去这些技术在商业上的实现。由于理念和软件的进步,云计算可以运行于廉价的服务器或PC上,降低单个节点故障的成本。

关于大数据和数据挖掘,还有一种说法是,大数据是为了迎合市场而推出的新名词。数据挖掘的目的是从数据集中摄取有价值的信息并将其转化成可理解的结构,大数据的目的也不外如是。包括商业智能(Business Intelligence)、商业分析(Business Analytics),很多时候销售卖的都是一套东西,而现在他们开始用Big Data来替代BI、BA。

Jeffey1
4 Ruthenium

Re: 云计算和大数据的2个问题

转到解答

云计算就是利用在Internet中可用的计算系统,能够支持互联网各类应用的系统。云计算是以第三方拥有的机制提供服务,为了完成功能,用户只关心需要的服务,这是云计算基本的定义。云计算拥有明显的特点:

第一是低成本,这是最突出的特点。

第二是虚拟机的支持,使得在网络环境下的一些原来比较难做的事情现在比较容易处理。

第三是镜象部署的执行,这样就能够使得过去很难处理的异构的程序的执行互操作变得比较容易处理。

第四是强调服务化,服务化有一些新的机制,特别是更适合商业运行的机制。

网格计算是跨地区的,甚至跨国家的,甚至跨洲的这样一种独立管理的资源结合。资源在独立管理,并不是进行统一布置、统一安排的形态。网格这些资源都是异构的,不强调有什么统一的安排。另外网格的使用通常是让分布的用户构成虚拟组织(VO),在这样统一的网格基础平台上用虚拟组织形态从不同的自治域访问资源。此外,网格一般由所在地区、国家、国际公共组织资助的,支持的数据模型很广,从海量数据到专用数据以及到大小各异的临时数据集合,在网上传的数据,这是网格目前的基本形态。

网格计算和云计算有相似之处,特别是计算的并行与合作的特点;但他们的区别也是明显的。主要有以下几点:

首先,网格计算的思路是聚合分布资源,支持虚拟组织,提供高层次的服务,例如分布协同科学研究等。而云计算的资源相对集中,主要以数据中心的形式提供底层资源的使用,并不强调虚拟组织(VO)的概念。

其次,网格计算用聚合资源来支持挑战性的应用,这是初衷,因为高性能计算的资源不够用,要把分散的资源聚合起来。

第三,在对待异构性方面,二者理念上有所不同。网格计算用中间件屏蔽异构系统,力图使用户面向同样的环境,把困难留在中间件,让中间件完成任务。而云计算实际上承认异构,用镜像执行,或者提供服务的机制来解决异构性的问题。当然不同的云计算系统还不太一样,像Google一般用比较专用的自己的内部的平台来支持。

第四,网格计算用执行作业形式使用,在一个阶段内完成作用产生数据。而云计算支持持久服务,用户可以利用云计算作为其部分IT基础设施,实现业务的托管和外包。

第五,网格计算更多地面向科研应用,商业模型不清晰。而云计算从诞生开始就是针对企业商业应用,商业模型比较清晰。

总之,云计算是以相对集中的资源,运行分散的应用(大量分散的应用在若干大的中心执行);而网格计算则是聚合分散的资源,支持大型集中式应用(一个大的应用分到多处执行)。

Zhang_Jiawen
4 Beryllium

Re: 云计算和大数据的2个问题

转到解答

概括性的区分大数据与数据挖掘:数据挖掘是确定的归因分析,针对仔细采样并重整的数据。而大数据是趋势分析或相关性分析,针对从大量人群收集到的既有数据。

tomcat8890
1 Copper

Re: 云计算和大数据的2个问题

转到解答

感谢大牛们的回答,我就挑字数最多的点个“赞”吧

0 项奖励