1 引言
2020年9月,中共中央办公厅、国务院办公厅印发了《关于加快推进
媒体深度融合发展的意见》,这对于媒体从业者来说提出了更加明确和更高的要求。而根据CNNIC发布的第46次《中国互联网络发展状况统计报告》[1]显示,我国网络视频(含短视频)用户规模达8.88亿,占网民整体的94.5%,这无疑对电视节目在网络平台上的传播提出了更高的要求。目前,情况、视频播放情况以及平台播放的
统一性来优先选择播放的网络平台数
据。另外,2013年视频独播权归属于
搜狐视频,但由于版权到期,导致目
前各网络平台已没有该年的相关数据;
2016年、2017年由于《中国好声音》
版权问题,节目临时更名为《中国新
歌声》。以下是对各年份数据采集情况
3.2 弹幕数据指标
该部分指标包含节目每年的弹
幕数、人物提及、弹幕内容情感倾向、
每年的弹幕词云。
3.3 收视率与网络热度
该部分主要是结合收视率数据、
百度指数以及网络评论和弹幕量进行
对比分析。其中,收视率数据来源索
摘要:本文利用大数据的分
析技术,针对《中国好声音》节目
2012-2020年在主流网络视频平台
的传播情况进行综合分析。分析
结果显示节目传播整体上呈现良
好正面的效果,节目每季的最初3
期和最后3期内容成为用户关注热
点,收视率与网络热度呈现正相关
性。经过对《中国好声音》受众情况、歌曲稻香
导师和学员受欢迎度、收视率与网
络热度之间相关性的分析,可以对
节目传播效果有更为全面的认知,
为节目今后的创新提供一定参考。
关键词:大数据  媒体融合
可视化分析  受众分析
101
. i
102
. i
福瑞,百度指数来源百度(百度指数采集的数据是当期节目播出之后第一天的数据)。
3.4 受众分析指标
该部分主要是对每季评论用户和
弹幕用户的相关信息进行可视化分析,主要有最活跃用户TOP3、用户墙等。
另外,为了更好地对传播效果进行评估,笔者还建立了人物词库,主要是对节目中的导师、学员的名字别名、简称进行了收集和汇总,以便用于人物提及、内容情感倾向、词云等的分析处理。
4 效用及可视化分析
依据以上的指标设计,本部分将从指标的结果入手,对节目的效用性进行可视化分析。
4.1 评论数据指标
(1)评论数
该指标主要分析节目每季每期评论数量的变化情况,以及每年评论数的趋势情况。通过该指标分析哪几期
节目用户参与的热度较好。
通过统计分析发现,除了2017年由于网络平台提供可查看的数据失真
外,评论数整体呈现先降后升的走势,并且用户参与热度最高的节目也主要
集中在节目第一期,最后一期总决赛也是用户参与热度较高的一期。
(2)评论类型
该指标主要对评论内容的字数进
行短(20字以内)、中(20~50字)、长的分类,通过分类来分析受众的评论习惯。
黄璐离婚经过评论内容的分类,可以得出用户评论内容以20字以内的短评内容
为主,从侧面我们也可以得出短小精练的文字是用户常用的互动方式,这也为后来弹幕成为用户参与节目互动的主流形式提供了数据依据。
(3)人物提及
该指标主要对每季的前四名学员及四位导师在每季评论内容中提及到的次数进行统计,通过统计分析
出每季评论热度最火的学员和导师。2012-2020年《中国好声音》评论内容人物提及次数如图1所示。赵忠祥很紧是什么梗
通过对评论内容人物提及的分
析,可以看出2012-2020年每季评论最多的人物导师出现的次数远高于学员,导师分别占据了2014年
、2015年、2016年、2017年、2018年、2019年评论内容人物提及人数的榜首,而学员只在2012年、2020年成为用户最
喜欢热议的人物。(4)情感倾向
该指标使用了百度开源的NLP 工具(PP 飞桨),通过利用PP 飞桨的PaddleHub 情感分析模型对评论内容进行文本情感类别的划分。通过类别划分,分析每期及每季用户对节目的喜欢程度,为今后节目的创新和优化提供参考。2012-2020年《中国好声音》每季用户评论内容情感倾向具体如图2所示。
通过对每季用户评论内容情感倾向分析,可以得出整体上用户对《中
国好声音》的评价都是偏积极的(分
图1  2012-2020年《中国好声音》评论内容人物提及次数
值高于0.5),2012年的《中国好声音》是用户评价最高的一季节目,其好评率为72%。
而通过对每一期的节目情感倾向分析,可以得出用户评论倾向相差很大,这和采集到的评论数据不均匀有关,所以对每期评论内容的用户情感倾向在此不做具体阐述。
(5)评论词云
该指标主要是使用jieba分词库和WordCloud词云库对每季的评论内容
进行分词并进行可视化展现,通过该
指标分析出每季节目用户的关注点。
通过2012-2020年评论内容词云
分析,可以得出“喜欢”“好声音”“中
国”“导师姓名”“学员姓名”“冠军”戏曲铃声
等这些词是用户使用频率很高的词汇。
4.2 弹幕数据指标
(1)弹幕数
该指标主要是分析了节目每季
每期弹幕数量的变化情况,以及每年
弹幕数的趋势情况。通过该指标分析
出哪几期的节目用户参与的热度较好。
2017-2020年《中国好声音》弹幕数
走势如图3所示。
对弹幕数分析,可以得出除了
2015年最后一期总决赛的节目不是
用户参与度最高的一期外,其余年份
用户参与度最高的一期节目都发生在
年终总决赛。另外,用户参与度最低
图2  2012-2020年《中国好声音》每季用户评论内容情感倾向
图3  2017-2020年《中国好声音》弹幕数走势
103
. i
104
. i
的节目都发生在中后期:2012年用
户参与度最低的一期节目在第10期;2014年在第14期;2015年在第9期;2016年在第10期。从图3中,可以看出用户参与度最低和最高的一期节目也是分布在节目中后期,并且最后一期总决赛的节目只有2019年是用户参与度最高的。其中,2017年第10期用户参与度最高,第13期用户参与度
最低;2018年第14期用户参与度最高,第11期用户参与度最低;2019年第15期用户参与度最高,第13期用户参与度最低;2020年第9期用户参与度
最高,第14期用户参与度最低。此外,从图中可以看出,2017年之后用户更喜欢使用弹幕数据进行互动。用户参与度最高、最低分布情况如表1所示。
(2)人物提及
佳期如梦的主题曲通过对弹幕内容人物提及的分析,整体上看导师仍然是用户最喜欢热议
的人物。其中,导师占据了2016年、2017年、2018年、2019年、2020年
二泉吟曲谱弹幕内容人物提及次数的榜首;与评论内容人物提及的分析结果略有不同的是,前几季用户关注的焦点更多放在学员身上,而最近几季的用户关注
的焦点更多放在人气导师的身上。
(3)情感倾向
该指标使用了百度开源的NLP 工具(PP 飞桨),通过利用PP 飞桨的PaddleHub 情感分析模型对弹幕内容
进行文本情感类别的划分。通过类别划分,分析每期及每季用户对节目的
喜欢程度,为今后节目的创新和优化提供参考。
通过对2012-2020年《中国好声音》每季用户弹幕内容情感倾向的分析,可以得出2014年是用户弹幕内容评价最高的一季节目,好评率达到了64.9%,而2019年是用户弹幕内容评价最低的一季节目,好评率为58%。
对每季中每一期的弹幕内容进行用户情感倾向分析,可以得出2015年第3期、7期、11期,2016年第6期、11期、12期、13期、15期,2017年第15期,2019年第5期呈现了偏负面的评论。
(4)弹幕词云
该指标主要是使用jieba 分词库和WordCloud 词云库对弹幕内容进行分词并进行可视化展现,通过该指标分析出每期及每季节目用户的关注点。2012-2020年《中国好声音》弹幕内容词云如图4所示。
从2012-2020年《中国好声音》弹幕内容词云分析中,可以看出冠军学员(梁博、张碧晨、张磊等)、人气导师(那英、汪峰、谢霆锋、李健、王力宏、李荣浩、周杰伦等)以及喜欢、好听等正面性词汇出现的频率较高。
4.3 收视率与网络热度
该指标通过索福瑞每年每期的收视率数据、用户弹幕量、评论量以
及百度指数进行走势对比,通过对比
表1  用户参与度最高、最低分布情况
年份
参与度最高(期)参与度最低(期)
20121510201415142015139201615102017101320181411201915132020
914
图4  2012-2020年《中国好声音》弹幕内容词云
105
. i
value=current/season,current 表示当前一期节目的值,season 表示这一季节目的值。
从2012-2020年《中国好声音》评论数、弹幕数、百度指数、收视率对比分析中,可以得出节目整体呈现前三期和后三期的节目用户受关注程度和用户参与度较高,尤其第一期
和最后一期更是用户关注的主要焦点。另外,四个指标之间整体上也呈现出了一定的正相关。
4.4 受众分析
该部分对采集到的评论用户和弹幕用户数据进行统计,通过用户的发布量以及用户头像墙对用户进行可视化分析。
(1)最活跃用户TOP3
该指标统计每季评论用户和弹幕用户中最活跃的3位用户以及这些用户在每期中的活跃程度。
从2012-2020年《中国好声音》弹幕用户TOP3的分析中,可以得出弹幕用户“超爱吃烤鱼de 东郭闲
和2019年最活跃弹幕用户的称号。
(2)用户头像墙
该指标通过把每季的用户头像汇
总成一张图片墙进行展现并用图片构造出当季冠军的姓名。通过用户头像墙,可以了解到支持当季冠军的用户更喜欢选择什么类型颜图片作为头像。例如,2020年支持单依纯的观众
更喜欢选择偏亮、偏蓝的照片作为自己的头像。如图5所示,展示的是2020年弹幕用户头像墙。
5 结语
本文对2012-2020年《中国好声音》在主流的网络平台传播的相关数据进行了分析。通过分析,可以看出评论数、弹幕数、评论内容、弹幕内容对节目的传播效果分析是有一定作用的。通过分析,可以得出《中国好声音》在网络平台的传播效果整体是
偏正面的;节目在每季的前三期和后三期内容往往是用户热议的焦点;在收视率与网络热度的关系上也呈现出
展望未来,对于网络平台传播效果的分析还可以结合其他新媒体平台(微博、抖音等),通过矩阵式的分析可以更加全方位、更加精准地对节目传播效果进行评估;针对节目内容的创新,可以根据弹幕内容的时间点等维度来认识节目哪些地方受到用户欢迎,哪些地方是用户吐槽的点。另外,笔者认为如果能够建立全国电视媒体统一的网络播放平台,不仅能更好地服务用户,也能更好地利用网络传播
效果分析方法,结合用户画像,提升节目的质量,满足用户
的视频内容观看需求。
参考文献:
[1]中国互联网信息中心.第46次《中国互联网络发展状况统计报告》[EB/OL]. v/2020-09/29/c_1602939918747816.htm,2020-09-29.[2]崔庆才.Python3网络爬虫开发实战[M].北京:人民邮电出版社,2018.
[3]Daniel Y.Chen.Python 数据分析活用Pandas 库[M].北京:人民邮电出版社,2020.[4]陈为.数据可视化(第2版)[M].北京:电子工业出版社,2019.