您现在的位置是:首页 > IT基础架构 > 计算存储 >

曙光大数据应用:挖掘广电行业海量数据金矿

2014-03-10 13:18:33作者:来源:

摘要广电行业作为一种发展历史较久,生态系统相对成熟完善的行业,在我国现代化建设过程中发挥着重要作用。然而,随着互联网时代传播载体、传播内容的爆发式增长,特别是微博、微信等社交网络和新媒体的快速发展,对传统广播电视体系的冲击越来越明显。...

  广电行业作为一种发展历史较久,生态系统相对成熟完善的行业,在我国现代化建设过程中发挥着重要作用。然而,随着互联网时代传播载体、传播内容的爆发式增长,特别是微博、微信等社交网络和新媒体的快速发展,对传统广播电视体系的冲击越来越明显。那么,在大数据时代背景下,广电要如何应对?如何选择适用的平台?如何挖掘和利用大数据技术,实现“台网联动”,从而提供更加优质的服务呢?

  为此,曙光以坚实的大数据技术积累为基础,推出了针对广电行业的大数据解决方案,可以帮助广电行业高效分析海量传播数据,深入发掘用户需求,在大数据时代获得更强大的前进动力。

  从“大众覆盖”到“大众互动”广电行业的融合之道

  美剧《纸牌屋》的实践证明,新媒体在大数据信息高速流转的平台上,作为电视内容生产的服务对象,受众在接收传播内容的将产生大量的互动内容,如节目观感、评论,甚至自制的内容文本等,这些信息迅速聚集并传到电视播出平台,这不仅能丰富内容产品的互动性,提升受众积极性,更是对传统电视内容生产方法的增益。但广电行业又有别于新媒体中的大数据技术应用模式,在推送中需要更精准的分析出这个群体的结构需求,而不再像以往的收视率调查采用样本户的方法。

  在新媒体时代,用户的信息饥渴感在与日俱增,但对非关联信息的容忍度却在与日俱减,这就要求广电行业利用大数据挖掘用户需求,给用户提供真正有价值的信息。

  另外,从个人向群体(如家庭)的变化,不仅是信息消费者个数的改变,消费模式与特征也发生了变化。在电视大屏前,用户行为不再是简单的碎片化与去中心化,而出现了一种群体性的选择偏移,即大屏幕前的用户行为有选择的积聚趋势,但积聚中又有个性化。那么,要抓住个性化的趋势和群体需求特征的结合点,就必须依赖于大数据技术。

  以高性能计算为根基 聚焦广电行业海量数据特点

  在大数据时代来临的大环境下,我国的广播电视行业正在进行自适应调整,它既是信息数据的生产者、拥有者,同时也需要逐渐成为信息数据的使用者、受益者。

  为此,曙光凭借多年在高端计算领域的坚实技术积累,曙光公司在全国进行了大数据时代的战略布局。近年来,曙光以创新的理念为基础,在原有的海量数据处理平台中融合了最新的Hadoop分布式框架,使其能更高效地处理结构化和非结构化数据。曙光推出的大数据一体化解决方案更是采用了创新数据处理技术和开放式架构,可以为大数据应用构建真正高效、智慧、易用的整体解决方案。在应用体验上,它能够帮助客户快速、智能的分析海量数据,以提高洞察力并做出明智决策,并为客户从大量数据中挖掘出体现价值的“金矿”。

  大数据精准评估“关系” 7大模块赢在全媒体时代

  目前,曙光大数据解决方案已经率先在金融、电信、教育、国防等领域实现了大数据的成功应用,并针对大数据在广电行业的潜在应用量身定制了广电行业的大数据解决方案。

  该方案(采用曙光XData-hadoop优化版软件)基本可以分为以下7个大模块:数据采集模块、数据计算模块、数据存储模块、应用分析展现模块、系统监控管理模块、大数据仓库和主干互连模块,其中:

  l HDFS为主存储模块和MapReduce为主的计算模块只采用直通的方法,其它模块的数据和管理通信都通过主干互联平台。

  l 数据源采集模块主要包含三种数据类型:样本机顶盒数据和VOD视频采集数据,机顶盒操作日志数据采集和分析,通过采集策略来控制采集。

  l 数据计算模块主要负责所有数据的ETL,清晰,封装及其装载的服务,同时分析任务的执行也在此模块中进行。

  l 应用分析展示模块主要负责B/S数据分析结果展示,和相关数据应用的部署。

  l 系统监控管理模块负责该平台软硬件组件的监控管理工作。

  该解决方案基于服务器集群搭建大数据平台,可以改善现有非结构化数据离线服务水平;突破在传统技术手段下无法解决的海量数据存储弹性扩展能力差、备份恢复难度大的问题;利用结构化与非结构化历史数据资源集中优势,为业务提供更集成、更长时间跨度、更多维度的数据查询服务,提升相关业务的查询访问效率,改善客户体验;使离线数据真正上线并得以充分利用,提高大量半结构化非结构化数据利用率,为业务发展提供基础。

  广电行业呈现“两大“应用趋势 大数据成为营销利器

  在曙光看来,2014年广电行业大数据的应用趋势可以分为以下两类:

  第一类:收视率预测和节目营销

  电视节目收视率和微博讨论量存在着正向关系。微博讨论量,可以成为预测电视收视率的重要指标。同时,对于节目推广而言,参与节目话题讨论的用户,不是电视观众,就是网络视频观众。这些用户ID,都是此节目的受众。如果针对这些用户投放广告或推送内容,效率肯定会很高。

  第二类:台网联动的跨平台营销

  随着电视与网络平台的互补价值不断凸显,“台网联动”已成为网络媒体与传统电视媒体走向融合的重要特征。之前,微博已经在尝试台网联动的营销解决方案。具体为,微博将热门电视节目设定为“热门话题”,在PC端和移动端设置话题入口,吸引网友进入“热门话题页”,引发网友分享与互动,进一步放大冠名电视节目的企业营销权益;

  此外,节目直播的同时,微博会同步在信息流中对节目话题进行话题推荐,保证该时间段内的展现机会,再次加强企业推广效果;通过用户获取信息的核心区域-信息流与话题榜的推荐,将话题的热度最大化,从而达到提升品牌知名度的目的。

  因此,我们可以预见2014年的广电行业,大数据应用的针对性将更强,用户更希望在决策力、洞察发现力和流程优化能力方面得到帮助。为此,曙光将在2014年,将会继续秉承“立足平台,深耕应用”的大数据战略,继续加大对研发投入,在目前已有的parastor云存储、cloudview云操作系统、XData大数据平台上,形成核心技术群,打造出更优秀的产品。同时,曙光还会把各个行业中率先形成大数据应用的最佳实践,在广电大数据行业的应用上深耕细作。

  曙光信息产业(北京)有限公司:

  曙光公司是一家在中国科学院大力推动下,以国家“863”计划重大科研成果为基础组建的国家高新技术企业。

  自成立以来,曙光公司始终倡导“自主创新服务中国”的品牌理念,以全面、专业、增值的服务为广大中国用户提供良好的应用体验。2010年,由曙光公司研发的“星云”高性能计算机在第35届全球超级计算机“TOP500”中以每秒系统峰值达三千万亿次(3PFlops),每秒实测Linpack值达1.271千万亿次的速度,取得了全球第二的成绩,成为了世界上第3台实测性能超千万亿次的超级计算机,再次向国人力证了“中国速度”。

  如今,曙光公司的硬件产品、解决方案、云计算服务已被广泛应用于教育、气象、医疗、能源、互联网及公共事业等多个领域,并且连续四年在中国高性能计算机TOP100中市场总份额位居第一,更进一步确立了曙光公司在中国高性能计算领域的领导者地位。

  凭借多年在高端计算领域的技术积累,曙光公司正在逐步从“硬件提供商”向“云计算服务提供商”迈进;并在近几年内“潜心”规划着布局全国云计算的宏伟蓝图,目前已在我国西南、华南、华中、东北等地成功实现了“城市云”布局,筹建了成都、无锡、南京、包头等十个城市云计算中心,并计划未来三年内完成云计算战略布局,为快速高效地提升区域经济建设,丰富人们日常生活所需信息资源提供了坚实的科技保障。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们