您现在的位置是:首页 > 头条新闻 >

大数据可视化

2017-02-28 13:48:03作者:刘晶晶来源:

摘要可视化新闻“独霸天下”,工厂可视化运营备受关注,可视化的健康管理、移动医疗方兴未艾……大数据可视化有哪些利器?未来我们可以做出怎样的展望?听本报记者娓娓道来。...

  工具篇 大数据欲善其事 得先利其器

  古语有云:工欲善其事,必先利其器。好工具可以大大提升工作效率,有效改善管理方式。由于人类大脑在记忆能力方面的限制,利用视觉获取的信息量多于感官。在大数据与互联网时代,企业从传统的流程式管理方式过渡到基于数据的管理方式将会成为必然的趋势。对此数据可视化能够帮助其对数据有更全面的分析与认识,让数据的呈现更及时、直观、简单。

  为何SAS如此风靡

  SAS是由美国NORTHCAROLINA州立大学在1966年开发的统计分析软件。1976年SAS软件研究所成立并开始进行SAS系统的维护、开发、销售和培训工作,虽然其间经历了许多版本并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛的应用。

  “SAS大部分产品与解决方案应用于特定业务领域,还有一些则可用于满足更广泛的需求。我们的客户受益匪浅,可以说几乎所有客户在使用SAS高级分析后都能增加营收,改善业务流程,降低成本。”正如SAS分析全球市场总监Sascha Schubert所言。
 

  近年来大数据已然成为商业变革的重要推动力量,并作为重要的生产力上升至国家战略。大数据的蓬勃发展为各个机构带来了前所未有的机遇,但如何将这些海量、多样的数据资源转化为真正的价值,SAS大数据分析则是唯一的答案。SAS作为数据管理、数据分析与商业分析的有力工具,目前已广泛运用于金融,保险,快消,医药、政府和教育等行业。在全球52个国家设有400多家分支机构及三大研发中心,每年的产品研发投入为当年营业额的24%,是业界平均水平的两倍以上。SAS公司早在1990年开始进入我国市场,在北京、上海、广州、香港和台北均设有分支机构,并在北京设立了用户服务支持中心,其中国家信息中心、国家统计局、卫生部以及中国科学院等都是SAS系统的用户。

  具体来说,SAS是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。

  对于企业的优势在于可将数据汇总、分析和报告功能集中在一个透明框架内,并最终提供一个完整的、E2E的解决方案。其中Base SAS模块是SAS系统的核心,负责数据管理,交互应用环境管理,进行用户语言处理,调用其它SAS模块。Base SAS 为SAS系统的数据库提供了丰富的数据管理功能,还支持标准的SQL语言对数据进行操作,能够制作从简单列表到比较复杂的统计报表,进行基本的描述性统计及基相关系数的计算等。

  SAS把数据存取、管理、分析和展现有机地融为一体,功能强大,统计方法齐备全新。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进、可靠。分析方法的实现通过过程调用完成,许多过程同时提供了多种算法和选项,其强大的功能尤其受金融类与医药类行业的青睐。
 

  例如欺诈和金融犯罪是目前金融领域面临的最大问题和挑战。为了解决这个棘手的问题,很多金融机构选择欺诈管理解决方案,面对众多供应商以及产品该如何选择?相关资料显示,Forrester Research对符合入选标准的供应商的欺诈管理解决方案进行了详细的实操实验评估,根据15项要素对这些解决方案进行评估打分,结果SAS高居榜首,成为现有产品的领导者,还在其战略和市场表现分项中获得了所有厂商中的最高分。

  Chartis采用RiskTechQuadrants排行榜进行评比。这种专门为风险控制技术市场开发的评估方法基于广泛的独立调查,通过明确的评分体系对调查结果进行打分。同样在企业级欺诈管理解决方案风险技术象限报告中,SAS位居第一,被评为行业领导者。SAS还以反洗钱(AML)与交易监测解决方案,尽职调查(KYC)以及客户端登录解决方案,还包括观察名单监控解决方案,被评为风险技术象限的领导者。

  Tableau:

  当互联网医疗遇见大数据分析

  近年来,在全球化的市场竞争的大背景下,商业智能已经成为热门技术,企业对精细化管理、定量分析、风险控制等业务越来越重视。Tableau 是桌面系统中最简单的商业智能工具软件,不用强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上不仅能够监测信息,而且还可以提供完整的分析能力,灵活且具有高度的动态性。Tableau软件的研发最早源于美国国防部(DOD)在斯坦福大学的一个研究项目,目的就是为了提高实现数据和信息的分析能力。

  随之诞生的Tableau公司将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,各公司可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表。这一软件的理念是界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确还是错误,就能了解得越通透。

  早在18世纪,南丁格尔便开始用可视化的数据来证明英国士兵之所以在克里米亚战争中的死亡率居高不下,并不是因为战争本身的伤亡较大,而是因为战地医院糟糕的治疗环境。当人们询问她为什么要用图来展示士兵的死亡率,她说她希望能够通过眼睛来传达没有能够通过耳朵传达到的信息。的确,在很多时候,眼睛看到的都能够比耳朵听到的更具有说服力和震撼力。我们列举一个Tableau在医疗方面的例子加以说明:

  病人对于一个医院的印象往往都来自于急诊的接待情况,所以医院必须要确保服务能够满足病人的要求,所以利用医院已有的数据来分析,简化分流的步奏就会显得很重要。这样既能够保证在急症过程的每一分钟都能得到有效利用,也让病人与家属都能有一个良好的诊疗体验。

  Tableau通过分析病人到达时间等数据,可以清晰看到病人每天、每小时的来院情况,这能够让医院适时保证足够的值班人员,并合理分配医疗资源。Tableau还能帮助建立急诊科患者的个人档案,通过分析出的医院急诊科的应诊能力,在病人数量达到极值时做出反应和措施。

  据估计,超过50%的患者信息都被杂乱地保存,这使得开发利用这些重要的数据变得十分困难。而在Tableau的帮助下,医生可以很方便地查阅病人的医疗记录等相关信息。Tableau极大地增强了患者信息的可视化程度,方便对医疗记录和患者信息进行统一管理和访问。通过对患者的住址、治疗进展以及其他深入到病人的详细记录的分析,Tableau可以为各级医疗卫生服务人员提供相关建议,帮助分析和改进服务。

  等待时间长最有可能引起患者的不满情绪,追踪一个病人从被接待到接受诊疗所花费的时间可以让医院采取有效的措施,减少病人的等待时间,提高服务的满意度。Tableau可以追踪病人诊疗期间的等待时间等数据,制定计划改进诊疗流程以减少患者在候诊室的等待时间。

  此外,医疗保险支出的情况是一个国家的重大问题。Tableau可以提供可视化的图表,分析医疗保险支出的区域分布,每个患者的平均医疗保险支付差异,还可以看到不同的保险公司的价格差异以及地区差异,根据颜色不同理解不同地区医疗保险费用不同的原因。医院和保险公司都需要了解在一定的人群中有什么流行疾病、什么年龄段的人更容易受到感染、治疗的成本等情况。Tableau可以帮助医疗保险公司评估特定申请人的患病风险等级,分析申请人最可能患的疾病以及相对应的治疗费用,得到这些分析结果后,保险公司就可以选择制定相应的保险方案。

  R语言:

  一种环境,一种现状的描述

  R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(因此称为R),现在由“R开发核心团队”负责开发。R作为一套完整的数据处理、计算和制图软件系统,其功能包括数据存储和处理系统、数组运算工具(其向量、矩阵运算方面功能尤其强大)、完整连贯的统计分析工具、优秀的统计制图功能、简便而强大的编程语言、可操纵数据的输入和输出并可实现分支、循环以及可自定义功能。
 

  与其说R是一种统计软件,还不如说是一种数学计算的环境,因为R并不仅仅提供若干统计程序,使用者只需指定数据库和若干参数便可进行一个统计分析。主要是可以提供一些集成的统计工具,但更大量的是它提供的各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。例如,澳门特别行政区政府统计普查局网站获得2006年1月到2015年10月澳门通货膨胀率数据,分析结果最大值为9.49,最小值为-1.03,平均值为5.161,中位数为5.42。从数值上看,澳门近十年来的通货膨胀率变化趋势较为明显,通货膨胀率的2个峰值9.49、-1.03分别发生在2008年3月、2009年9月。此期间的一年半内澳门通货膨胀率迅速从波峰到达波谷,变化10.52。
 

  又比如横向描述澳门通货膨胀率的趋势,分别从中国国家统计局网站、珠海统计调查信息网网站、香港特别行政区政府统计处网站、澳门特别行政区政府统计普查局网站收集2011年1月到2015年10月通货膨胀率数据(中国内地通膨数据含广东省,广东省通膨数据含珠海市),其中绿色实线代表澳门,蓝色代表香港,红色代表中国内地,绿色代表广东省,黑色代表珠海市。继而得出结论:横向对比周边地区近5年来通货膨胀率总体走势,澳门通货膨胀率的走势始终处于高位,故波动不大,从整体趋势不容易看出与其他地区的连动性或关系,因此还需进一步分析。当然R在统计学上的应用不胜枚举,但毕竟其只是一种辅助工具,要想深入解决问题,还需要大量的其他辅助条件。
(本文不涉密)
责任编辑:NULJDf1gZPGJKbeCD/0WGuLAgP576M/dhHLODA6joVw=

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们