咨询热线:010-82231651

BI应用及其整合

  • 分类:解决方案
  • 发布时间:2021-12-21 14:37:26
  • 访问量:0
概要:
概要:
详情

  中央电视台经过多年的信息化建设,建立了几十个应用系统,涉及到全台各个部门和业务领域。"中央电视台节目综合评价系统" 是其中的一个应用,是由寰信通公司负责设计、实施的。该应用旨在为中央电视台搭建一个平台,以科学、快捷的方法评价电视节目质量,改变过去大量数据需要人工收集、计算,评价周期滞后的现象,从而能够更好地对频道、栏目、节目进行宏观管理。

  对电视节目的评价必须是一个由多科学、多层次的评价方法组成的体系,这个体系可提供定量和定性分析,有了这样的体系才能较为客观反映一个栏目或节目办得如何。为了能够建立一套科学的节目综合评价体系,中央电视台总编室根据台领导的要求,组织制定了《中央电视台节目综合评价体系方案》。该体系极为科学,它充分考虑了评价中的客观、主观及成本因素,并分别赋予权重;按照该体系,还需对客观指标予以修正,以消除影响收视率的诸如节目播出时段、节目所在频道等,通过合理加权,对收视率予以修正,使客观指标更加公平。

  《中央电视台节目综合评价体系方案》中使用了大量的计算公式,是进行科学评价的理论基础。但是真正使该体系运作,即保证通过该体系做出的评价结果是公正、合理、公平的,则必须基于大量真实的基础数据。央视-索福瑞媒介研究有限公司为总编室提供了这些基础数据,每年导入数据库后的基础数据估计约在7G左右在2002年,寰信通公司基于《中央电视台节目综合评价体系方案》、《总编室观联处节目综合评价及收视反馈资讯平台需求方案》及《中央电视台栏目警示及淘汰条例》开发的项目,实现了中央电视台各频道、各栏目的主要指标(客观指标、主观指标和成本指标)的计算,并充分考虑各指标的权重,最终形成节目综合评价指数。

  为了更好地服务于中央电视台综合评价体系,寰信通公司引入了先进的数据仓库和商业智能(BI)技术,提供联机分析(OLAP)功能,方便用户从各个方面、各个层次,按照多种维度对节目的收视率、节目的观众构成等数据进行深层次的分析,为领导决策提供支撑。另外,我们还提供了应用级门户,为用户提供个性化服务。

  至今,"节目综合评价系统"运行良好,为中央电视台提供准确、及时地收视率分析数据。
  2003年5月中央电视台希望以较短的时间实现台内各部门之间信息的互相沟通、资源的共享,并尽可能减少重复开发。因此采取了尽量保存以前应用,仅开发必需的应用模块的策略,将应用整合/适配到新的架构中。这次整合/适配中,我们公司需要承担节目综合评价的开发与适配。

  在这次适配部分的牵涉到多个应用系统,任务比较复杂,有许多内容需要细化。对于《节目收视率分析》应用系统,要整合到统一的应用系统中必须解决三个问题:
- 应用层面:如何融合到统一的门户和新的应用架构中,包括BI技术和应用门户与新应用架构的融合;
- 数据层面:如何与其它应用系统进行数据共享、交换;
- 安全管理:如何在统一身份认证的基础上进行安全管理/控制。

  我们在此次整合中,成功地将BI展现整合到基于J2EE的瘦客户端(浏览器)/应用服务器、数据库的三层结构架构之上,实现了数据仓库和商业智能技术与基于J2EE技术架构的融合,可以轻松地将分析主题发布到台内统一的Portal上。除此之外,寰信通还完成了应用Portal中的安全管理与台内统一Portal的整合,保证了台内综合信息网的单点登录SSO(Single Sign On)。

方案特点

  该项方案充分利用计算机、网络、企业门户(Portal)、BI、应用集成(EAI)等技术,实现信息交换、信息共享和业务协同,提供高效实用的服务。

及时、准确的数据采集与加工
  节目综合评价体系充分吸收了国内外电视领域节目评价的研究成果,立足中央电视台实际,确定了以"客观指标、主观指标、成本指标"作为节目评价的基本指标,通过加权,形成节目的综合评价指数。该体系需要进行大量的数据分析,在"节目综合评价及收视反馈系统"上线之前主要由人工进行分析整理,因此评价结果需要一定时间才能完成,相对滞后。
  "节目综合评价及收视反馈系统"主要是将节目综合评价体系用计算机技术加以实现,使数据的采集和加工及时、准确,同时简化有关工作人员的繁杂工作。

基于大数据量的计算
  节目综合评价系统中各项指标数据的计算,基于大量的基础数据,而且还为决策分析保留了中间数据,再加上最终计算的各项指标数据,每年数据量约有30G(含索引),另外数据库还需要保存历史数据。因此计算的性能就显得尤为突出,最初也存在计算时间过长问题,但经公司资深的软件工程师和数据库工程师对计算算法、SQL调优以及添加数据表索引,已使计算性能大大优化,系统至今一直运行非常正常。
以下是该系统的数据量估计:

- 基础数据:(7G/年)
· 节目表(1.7G/年)
存放每天播出的节目信息,每天大约3~4万条记录
· 收视仪收视数据( 2.3G/年)
存放每天的收视仪收视数据,每天大约7~8万条记录
· 收视仪样本数据(300M/年)
存放收视仪样本数据,每天大约6~7千条记录
· 日记卡收视数据(2G/年)
每周 70城市×6000条/城市 = 42万条
· 日记卡样本数据(1G/年)
每周70城市×300户/城市×3人/户 = 6万条记录

- 中间数据(20G/年)
  为分析收视率的观众构成比例,同时统计每个栏目的每分钟的收视率变化曲线,需保留最细节的数据,即每分钟所有样本的收看情况,该统计数大约每天150~200万条记录数。
  150~200万×365天×24Bytes/记录数 = 13~18G/年
  加上索引共计大约18~23G/年

- 最终数据(3G/年)
  需要分别针对收视仪和日记卡的数据同时处理栏目分析和时段分析。该部分包括栏目收视率数据、时段收视率数据和评价结果等。
  该部分保留的是最终计算结果,大约需要3G。

企业(Portal)门户
  "节目综合评价及收视反馈系统"最初实现时就具有自己的应用Portal,实现了应用级的Portal及用户的个性化定制功能。针对"中央电视台应用系统整合",我们将节目综合评价系统整合到中央电视台的企业门户中。调用长天提供的单点登录(SSO----Single Sign On)接口,确保用户通过台内Portal的身份认证后即可访问到本系统。

采用BI技术,提供在线分析
  中央电视台与节目有关的数据每年大约有30GB,主要包括样本数据、收视率、收视份额、节目成本、领导评价、各类指标数据等等;如何从大量的数据中提取有用的信息,是非常迫切的问题。寰信通公司凭借在银行系统所积累的丰富数据分析经验,针对综合评价系统我们引入了数据仓库和商业智能(BI)技术,搭建OLAP分析平台,帮助台内各级领导全方位分析全台节目收视率、节目的观众构成等。

 

扫二维码用手机看

北京寰信通科技有限公司成立于2000年12月,既是北京市科委批准的高新技术企业,又是北京软件行业协会认定的“双软”企业。公司是国内少有的以软件为核心,为企业级客户提供专业化咨询服务、应用开发服务、系统集成(特别是应用集成)等相关服务和技术产品的企业。

地       址:北京市石景山区体育场南路2号景阳宏昌大厦1层106

客服热线:010-82231651

版权所有◎2021北京寰信通科技有限公司   备案号:京ICP备05023831号   技术支持:新网