您现在的位置是:首页 > IT基础架构 > 计算存储 >

大数据:形式大于内容

2013-08-01 11:15:08作者:来源:

摘要中国传媒大学电视与新闻学院教授、可视化小组指导老师沈浩坚定地阐述了自己的观点:“我一直以来都强调形式大于内容,当然是在有内容的前提下。”从这个角度来说,确实如此,在内容一致的情况下,形式就成为决定胜负的关键。...

  弥漫在整个互联网行业的大数据浪潮冲击着数据楼房的每一块砖石,数据挖掘、数据分析以及数据可视化逐渐被卷入到这股浪潮中。舍恩伯格所预言的大数据即将带来“生活、工作与思维的大变革”正在扩散,越来越多的领域都开始面临复杂或大规模异性数据集。商业分析、财务报表、人口状况分布、媒体效果反馈、用户行为数据等数据的可视化需求越来越高,形式与内容斗争的号角也愈发响亮。

  对此,中国传媒大学电视与新闻学院教授、可视化小组指导老师沈浩坚定地阐述了自己的观点:“我一直以来都强调形式大于内容,当然是在有内容的前提下。”从这个角度来说,确实如此,在内容一致的情况下,形式就成为决定胜负的关键。

  Andrew Vande Moere在其博客Information Aesthetics中对于数据可视化在审美领域中前沿应用的探讨,也从侧面证明了这个观点。数据可视化及其相近意义的信息可视化的成果,经常会让人震惊。从基于东京地铁线创造出的2007年互联网上最成功的200个网站的联系图,到美国时代周刊使用峰值形状的分布来强调地图上美国人口的稠密程度,都以一种非常美丽的形式直观地展现出数据之美以及数据所蕴含的信息与联系。

  有人这样评价数据可视化,把它称之为“创造性设计美学和严谨的工程科学的卓越产物”,它是用极美丽的形式呈现可能非常沉闷繁冗的数据,其表现和创作过程堪称艺术。

  问题 PROBLEM

  数据难题一直是困扰很多IT从业人员的问题,不管是海量数据也好,还是大数据也好,这种困扰与日俱增,从未消减,当然这也是IT技术革新的非常重要的动力。正因如此,数据可视化告别了以往仅仅是前端展现这一含义,而是伴随着大数据时代的到来被赋予了新的含义。

  首先,从这个名称上可以看出数据可视化蕴含着“大数据时代,人们想要看到、看清楚数据的一种渴望”,沈浩指出,“数据可视化是一种分析的过程,在分析的基础上,让人们能看清楚繁冗数据背后的关联,所以就叫做数据可视化。”

  其次,伴随着现在人们对载体、屏幕等的追求,可视化也面临着新的发展,比如信息可视化、视频可视化、交互可视化等等,沈浩表示。数据可视化的界限逐渐模糊,甚至有人将信息可视化等可视化归为广义上的数据可视化。

  数据可视化在我国来讲,仍然处于一种刚刚起步的阶段,要从过去数据可视化属于IT技术领域内容,切换到数据可视化是设计、信息、沟通的三位一体,这就需要大量复合型人才,只有这样才能满足数据可视化的意义,避免为了可视化而可视化。

  询问专家学者:传统意义上的数据可视化与如今的数据可视化有何区别?

  询问专家学者:如何区分数据可视化与信息可视化这两个相近的概念?

  方法 SOLUTION

  除了炫目的可视化成果外,这种图片或者交互式成果背后的数据来源与创造历程,更让人震惊不已。数据可视化涉足制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数型结合以及动画、立体渲染、用户交互等。另外其相关领域还有影像学、视知觉、空间分析、科学建模。

  不同于数据挖掘与数据分析,数据可视化本质上讲,是对它们结果的一种展现,是继数据存储、数据报表、分析阶段之后的展现层,沈浩如是说。

  淘宝数据产品团队负责人赵昆也曾指出,“数据挖掘通常是面向特定主题,对一个已知结论的证明,通过预先设定的模型进行分析,给出特定的结论,其操作者必须是数据挖掘工程师或者专业数据分析师......而数据可视化则是基于算法模型提供一种可交互的应用,让数据的使用者自己去分析,甚至去创造。”

  对于这一点,有两个人可以证明。中国传媒大学与北京大学都有自己的可视化小组,中国传媒大学可视化小组负责人是电视与新闻学院的沈浩教授,而北京大学可视化小组的负责人则是信息科学技术学院的袁晓如教授。二者的专业背景完全不同,却都参与指导一个可视化小组。这就证实了上面赵昆的观点。

  数据可视化是一种分析的过程,在分析的基础上,让人们能看清楚繁冗数据背后的关联,所以就叫做数据可视化。

  ——中国传媒大学电视与新闻学院教授 沈浩

  中国传媒大学可视化小组是一个兴趣小组,每周活动一次,采用高年级同学传帮带的形式,每个人根据自己兴趣选择可视化工具,比如PS、AI、PREZI、PPT、Xcelsius、Excel、D3js、Processing、Tableau、Romabi等等。在沈浩老师的搜狐博客上,也可以看到很多其学生的可视化作品,其中占比最多应属词云可视化。另外,在采访过程中沈浩及其可视化小组成员介绍的一些交互式的数据可视化作品也都非常清晰、直观、简洁地将数据展现出来,使数据比较容易被人理解,形成更直观的印象。

  而北京大学可视化小组的成果应当属其PKUVIS微博可视分析系列,包括Thememap Thememap2 ,WeiboEvents,Visearch, Hivis,Vistrend六种工具。就拿WeiboEvents来说,它可以通过一个非常直观的视图清晰地呈现出一个事件在微博中转发的过程,从而迅速捕捉到事件中的关键人物、关键微博以及重要观点,类似的应用中国传媒大学的可视化小组也有相应成果。

  询问专家学者:数据挖掘、数据分析与数据可视化的区别与联系是什么?

  询问专家学者:所在的可视化小组的主要成果有哪些?是否可以展示一下?

  

 

  中国传媒大学可视化小组作品

  价值 VALUE

  虽然说,数据可视化结合了很多设计、创意在里面,但是其价值绝不仅仅在于数据变得更好看了,其“最根本的价值还在于方便管理层决策”,沈浩指出。

  如上所说,可视化是数据分析最后阶段的一种表现方式,只有将数据分析的结果用一种通俗易懂的方式呈现在读者面前,这种数据分析才是有效的。

  因此,从另一个方面来讲,这种形式大于内容的数据可视化,为其读者(可能是CEO,可能是投资者,也可能是业务经理)提供了“一种批判性思维入口”,只有在读者能够读懂数据的前提下,才能指出这些数据哪些地方存在异常,哪些地方不合理,才能针对数据分析的结果深入思考,沈浩表示。

  另外,可视化发展到现在,出现了一种颠覆性的改变。比如前段时间刚刚上市的Tableau公司,其可视化工具可以先得到图表,根据图表,可以分析出哪部分或者哪个数据存在异常,从而快速定位异常数据,这与以往的可视化应用完全不同,是一种革命性的产品,也是一个颠覆性的改变。“其蕴藏的预警、洞察思想与我一直强调的仪表盘非常相似,正如你在开车时,仪表盘的指针变化所起到的实时预警效果是一样的”,沈浩强调。

  最后,还是要回到形式大于内容这一点,“微软Office Excel从03版、07版、10版到13版的改变,基本上面向的都是可视化的优势,比如说图表的好看,线条的平滑,色彩的饱满等等”这些都显示出形式的重要性,沈浩说道。的确,在如今信息爆炸的时代,信息不再匮乏,怎样以优雅、美观的形式将数据或信息展现出来,才是在竞争中可以取胜的法宝。

  询问专家学者:数据可视化最根本的价值在哪里?

  询问专家学者:除此之外,其优势还体现在哪些方面?

  挑战 challenge

  然而不管是中国传媒大学的可视化兴趣小组,还是北京大学的可视化研究组,其数据可视化的成果还都停留在展示层面,没有进入分析层面。当然,这与学术研究与商业应用之间的区别有很大的关系。

  但是,这依然是我国可视化领域的通病。“商业化的需求是存在的,但是这个需求具体是什么,还没有非常明确。另外,就是人才问题,复合型人才的培养非常关键。”在谈到我国数据可视化面临的挑战时,沈浩如是说。

  询问专家学者:我国数据可视化的现状是怎样的?

  询问专家学者:这些问题归根结底是由于哪些因素造成的?


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们