Roger_Wu
4 Ruthenium

【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

原文出处:36大数据,http://www.36dsj.com/archives/29930

近日,在Teradata大数据峰会上展出了由Teradata数据科学家及数据顾问提供的一系列的”数据分析艺术”数据分析视觉化展,继阿姆斯特丹Teradata Universe后,中国是全球范围内第二次展出的国家。这些美轮美奂的图画让参观者感叹数据分析竟然如此之美。

数据的艺术

本次“数据分析的艺术”展览展出了20幅数据分析视觉化的图片,它们来自世界各地Teradata数据科学家及数据顾问为各行各业的真实分析。通过这种艺术展览的形式,人们可以用一种全新的方式与分析技术互动。这些令人惊奇的图画同时也是美丽的艺术作品,人们被它吸引、进一步探索它们的真正含义及背后的洞察。

欺诈入侵者

1.jpg

这幅图的作者是:Christopher Hillman,Teradata高级分析团队首席数据科学家。此分析是一种检测潜在保险索赔诈骗的快速方法。可疑的索赔就像外星人侵略一个星球,或虫子细菌感染一个纯细胞。

骗子通常会在索赔细节中留下微小的数据痕迹。呼叫中心指出的像一个共同的地址、电话号码、电子邮件、银行账户、注册信息、医生或律师等。这个数据可视化显示了所有正当保险索赔和欺诈保险索赔之间的联系。

风暴之眼

2.jpg

这幅图的作者是:Christopher Hillman,Teradata高级分析团队首席数据科学家。

这一张可视化图表则记录了英国前首相玛格丽特·撒切尔夫人离世时的“推特风暴”。拥护者与反对者在Twitter上发表正反言论的状况。图中每个点都是Twitter的一个用户,凡是提及或是转推的行为,便会在点与点间产生连线,图的中心则是柴契尔夫人,很明显的这个图分出了上下两群立场不同的人。

而这个图的前身始于另一个在Twitter上的大事件,一个数位媒体IAC通讯部的全球主管Justine Sacco,在搭上前往非洲的飞机之前,发了一篇带有种族歧视的短文给他的朋友,在她下飞机后,发现这篇短文在全球被疯狂转载并加以谴责,而Justine Sacco原本幸福的人生就这么被摧毁了,此为有名的推特风暴事件由来。而风暴之眼就是由推特风暴发想而来。

星条旗

3.jpg

这幅图的作者是:Christopher Hillman,Teradata高级分析团队首席数据科学家。

我们把在美国执行的临床药物试验收集到的结果资料视觉化成图表。药物试验通常非常复杂且牵涉了在长时间累积的资料。

图表上的四个星星呈现出同一个药物试验资料利用不同视觉化方式所得的结果。每五个形成星星的点都表示一种药物或药物变种在试验中施用在队伍中每个病人。在中间的点代表病人体验到的一种不希望有的副作用。不同药物及副作用间的连结用线条来表示。

通话圈

4.jpg

这幅图的作者是:Christopher Hillman,Teradata高级分析团队首席数据科学家。这幅画是从行动电话使用者的通话模式资料所制作的。每个点都代表一个使用者拨出的手机号码,愈大的点就代表这个号码被拨打愈多次。每条两点之间的线都代表着从一个号码拨打到另一个号码。

叶子

5.jpg

这幅画的作者是Alexander Heidl -Teradata跨行业客户经理。

“叶子”融合了现实生活中的图像与数据可视化生动展示了未来的分析方向。随着在图形和速度的技术改进及资料视觉化的方便化,一种新兴形式是使用现实生活中的图像取代传统的图表。

在“叶子”图像使用的“单一麦芽采样”数据集。在该图中,形成了叶片的脊柱的点(节点)是威士忌品牌,类似口味的威士忌会接近在一起。每个品牌链接到其他品牌的线(边缘),它们有一样的口味特征。其结果是这个近乎完美的树叶图像。

查询系列

6.jpg

这幅画的作者是Yasmeen Ahmad,她是Teradata数据科学家。查询系列:显示用于银行整合数据仓库(IDW)的数据库查询记录

社会问题的影响

7.jpg

这幅画的作者是Yasmeen Ahmad,她是Teradata数据科学家。这张图片总结了在英国的社会问题和孩子们的需要之间的复杂关系。

单一麦芽取样员

8.jpg

这幅画的作者是Kailash Purang,Teradata新加坡公司首席数据科学家。这张图用来分析单一麦芽威士忌的口味,对12位专家对86种口味评定。

担保圈之谜

9.jpg

这幅画的作者是张玉瑞,大中华区大数据事业部华东区的高级顾问。

‘担保圈之谜’揭示了房地产开发行业所产生的潜在风险。首先房地产公司是银行的重要客户,开发住宅需要银行的资金支持,房屋建成后,银行给购房者提供住房抵押贷款,延伸和拓展了银行业务,同时,帮助房地产公司销售产品。

‘担保圈之谜’让银行展现和监控风险暴露的规模和真实的特性。银行可以对高风险客户采取措施,这些措施包含收紧贷款审批,甚至拒绝贷款。

资金喷泉

10.jpg

这幅画的作者是石棋玲,她是Teradata大中华区高级顾问。图表显示了不同的公司之间的所有金钱流动。

这个匿名的可视化是分析的一系列映射在中国大型企业之间的资金流动量的关系,这是一家中国大型银行的企业银行业务的风险分析项目之一。分析使用转账交易数据以了解风险和发现市场机会。

在此图中点(节点)代表公司。线(边缘)代表两家公司之间的资金转移和箭头显示这笔钱流向。它还有助于识别欺诈。银行可以检查公司的真正的商业活动,并可以验证借出的资金用于其目的。

星门

11.jpg

这幅画的作者是:Peter Wang,Teradata大中华区资深大数据顾问。次分析是用于分析电信客户端阻止恶意网络攻击。

“星门”的目的是发现并阻止黑暗的力量在网络世界滋长- APT攻击。进阶持续威胁(APT)是一组隐身和连续的计算机骇客过程,往往是由人们策划针对特定的实体。APT通常针对组织和/或国家的商业或政治动机,也用于欺诈和犯罪目的。

标签 (1)
标记 (3)
0 项奖励
8 条回复8
Yanhong1
3 Cadmium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

挺有意思的一组图解

0 项奖励
liulei_it
4 Germanium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

请教前辈们,怎样才能成为那样的 data analysis & data scientist 呢?

0 项奖励
Roger_Wu
4 Ruthenium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

我们来看看Teradata这几位专家Linkedin上自述的Skills:

Chris Hillman | LinkedIn

Data Warehousing, Hadoop, Dimensional Modeling, Big Data, OLAP, Business Intelligence, Analytics, Data Modeling, ETL, Data Warehouse..., Data Integration, Predictive Analytics, Business Intelligence..., Teradata, Database Design, Data Mining, Business Analysis, Data Quality, Master Data Management, Dashboard, Data Marts, Business Analytics

Yasmeen Ahmad | LinkedIn

SQL, Business Intelligence, Database Design, Software Development, Data Warehousing, User Experience, Python, Data Science, Data Analysis, Business Analytics, Databases, Data Management, Analytics, Visualization, Life Sciences, Proteomics, Data Visualization, Lifesciences, Big Data, R, Agile, Methodologies, MapReduce, Computer Science, Data Mining, Data Modeling, Dimensional Modeling, Programming, ETL, Human Computer..., SSRS, Data Warehouse..., Microsoft SQL Server, Predictive Analytics, Hadoop, SSIS, 3D visualization, OLAP, Algorithms, Artificial Intelligence, Relational Databases, Machine Learning, Natural Language..., Teradata

Kailash Purang | LinkedIn

Predictive Analytics, Customer Segmentation..., Predictive Modeling, Business Strategy, Analytics, Customer Insight, Segmentation, Data Mining, Business Analytics, Loyalty Analytics

Wang Peter | LinkedIn

Data Mining, Big Data, Hadoop, Machine Learning, Tableau, Data Analysis, Data Warehousing, Statistical Data..., Telecom BSS, Telecommunications..., Data Warehouse..., Hadoop instructor, Asterdata instructor, IT Security Best..., System Architecture, Teradata, Unix Shell Scripting, Algorithms, Solution Architecture, Solution Selling, R

数据科学家要求的Skills基本上清楚了,于是问题简化为,要怎样才能掌握上面这些技能?

0 项奖励
liulei_it
4 Germanium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

有的时候真的希望自己可以不用睡觉

0 项奖励
Yanhong1
3 Cadmium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

身体是革命的本钱。我要睡觉去了,哈哈

0 项奖励
liulei_it
4 Germanium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

前辈话说这个linked in 的确对于一般人来说不友好且要花钱  钱不少呢  不会玩

0 项奖励
Roger_Wu
4 Ruthenium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

应该是free的吧?主要是要有足够多的connections来认可你的skills

0 项奖励
liulei_it
4 Germanium

Re: 【大数据应用】数据的艺术:Teradata数据科学家数据可视化作品集

刚刚玩善了资料,search一下 老外比较多

0 项奖励