原标题:广电总局试运行大数据系统,打击收视率造假
新京报讯(记者 张赫)12月26日,国家广播电视总局在北京举行新闻发布会,宣布国家广播电视总局广播电视节目收视综合评价大数据系统基本建成并开通试运行。此系统主要通过建立与网络传输机构之间的安全通道,汇聚大样本用户收视行为数据,经清洗、转换、分析与挖掘,输出开机用户数、观看用户数、收视率、市场占有率等30项核心指标,可以做到防操纵、抗污染,解决收视造假的现象。
新闻发布会上,国家广播电视总局广播电视规划院院长余英介绍了有关情况。我国收视率调查始于上世纪80年代中期,主要是采用相应技术手段和方法,比如使用记录仪和抽样调查,对观众收看节目的情况进行调查、统计和分析,相关数据可作为衡量相应节目版权价值、相应时段广告价值的参考。随着信息网络技术迅猛发展、媒体竞争日益激烈和行业改革创新不断深化,收视调查越来越受到各方面的重视与关注,同时也对利用新技术进一步改进收视调查方法手段,切实增强收视调查的科学性、时效性、安全性和权威性,提出了更高要求。
广电总局广播电视节目收视综合评价大数据系统初期汇集4000万有线电视和IPTV样本用户的收视数据,全面涵盖直播、回看、点播等多种收视方式,并将逐步扩展至数亿级样本规模,实现样本全覆盖。其次可通过大数据、云计算,实时处理精准到户。既可以反映热门节目、黄金时段的收视情况,又可以精准捕捉小众节目、边缘时段的收视特征。
例如,某城市500万用户,如果从中抽样选取500个样本用户,那么这500个样本用户没有看过的节目均会被统计为“零收视”;而在系统的大样本统计中,即使1‰的低收视率也会记录留痕。最重要的是,该系统数据采集、清洗、分析、呈现等各环节无缝衔接,全流程自动化、封闭化处理,可有效防范人为操纵。基于海量大数据统计,个体样本数据污染对统计结果的影响可忽略。
同样对于500万用户的某城市,如果针对某节目污染500个抽样中的5个样本用户数据,该节目的收视率可提升或降低1%。如果该节目的真实收视率为2%,统计偏差可达50%。对本系统而言,这种情况仅会对该节目的收视率影响百万分之一,统计误差基本可忽略不计。
新京报记者 张赫 编辑 徐美琳 校对 陆爱英