媒体融合中用好数据的五个关键

2023-10-07 22:00王卓尔
传媒评论 2023年3期
关键词:驱动测试内容

文_王卓尔

王卓尔

浙江日报报业集团办公室

技术驱动媒体融合向纵深发展,已成为一种共识。而驱动技术发展的,正是数据。如何利用好数据,用数据驱动决策,不仅是媒体深度融合领域绕不开的命题,还是大型媒体集团向数字化转型的关键所在。

关键一:建立数据驱动的思维

数据的运用推动着思维方式的改变,人们越来越无法对单纯用直觉下的定论感到信服,必须依据客观数据。1981 年,美国一位学者借助计算机统计了《红楼梦》中的词频,处理分析后得出结论,120 回全都出自一人之手。但这个说法很快遭到质疑,因为他从原著中只抽取了6万字样本进行研究,且变量也只有14个。复旦大学数学系毕业的陈大康为了驳斥这个结论,手动对《红楼梦》全书的字、词、句进行了全面的统计分析,73万字的原著,他数了上百遍,获得约2万个数据,发现了一些专用词如“端的”“越性”“索性”在各回中出现的情况,最终得出结论:前80 回为曹雪芹一人所写,后40 回为另一人所写,但包含了一部分曹雪芹残本。

能和数据对抗的,还是数据。过去,数据驱动着学术研究;现在,以数据为中心进行决策和行动就更普遍了。比如,订票网站根据搜索量分析,未来两周是出行高峰,于是决定提高机票价格。但是,这仅仅是以数据为参考,并没有真正做到数据驱动决策。数据驱动是指以海量数据为基础构建模型,围绕业务目标持续优化参数,自动做出决策的一种方法。目前,人工智能领域快速发展,聊天机器人等带给人们太多惊喜。一个错误的认知是,技术驱动媒体融合就是引进专业的数据工程师,或是购买AI工具就可以了。其实,更为关键的步骤在于利用好自己拥有的数据,将其转化为有意义、有见解的必要技能。谷歌、亚马逊、Meta等科技巨头与其他企业之间的巨大区别不在于他们数据科学家的脑力,或者他们技术的实际功能,而是他们不同凡响的数据驱动的文化。他们利用巨大的数据资产,并有出色的算法来解释那些数据,然而他们的关键战略优势和最大资产却是他们根据数据生存、呼吸和行动。[1]以数据驱动为主要决策导向,能让企业着眼于具体目标,并借助技术工具更有效地解决问题。

关键二:确保有充足数据支撑分析

在媒体行业内说到数据,往往会想起文章的“阅读”“点赞”“评论”“转发”这类指标,很长一段时间内,这些显而易见的指标的好坏是决定一篇文章的传播是否成功的唯一标准。虽然直观,但这也给人们带来了思维的固化。内容分发出去之后,阅读量陡然上升并不能客观说明传播效果好,也许仅仅是因为有一个夺人眼球的标题而已。统计特定部分的跳出率更能说明问题,它可以帮助内容生产者对内容进行布局优化和修正,B 站的高能进度条就是如此。它在普通进度条上方设置了波峰标志,波峰越高的部分就是观看人数越多、弹幕集中的部分。如果波形平缓,那就说明视频平平无奇,缺少爆点。

此外,还需对表象数据进行穿透,挖掘出更多数据,适量囤积一些数据以备后续分析。比如,从自有平台和分布式平台等各种渠道收集大量类似访问的时间、地址、入口、设备类型等方面的用户访问数据,再进行更复杂的深度分析。美国数字媒体公司BuzzFeed内部有一款数据分析工具Pound,能够了解用户如何在不同社交网络内分享内容。假如网友将一篇文章分享给他的好友,好友转发到推特,继而又分享到其他社交平台上,Pound可以把这些线索关联起来,显示不同分享人之间的联系,并把这个线路图描绘出来。甚至,Pound可以根据某篇内容的来源,预测它在该网络如何传播,进一步帮助BuzzFeed了解受众。

然而,大数据大量、高速、多样的特征决定了必须有一个强有力的大脑来支撑其运行,有一个足够强大的数据仓库来存储数据。随着数据体量和业务模块的增加,数据处理能力将会经受不小的考验。服务器能否经受高访问量,数据库是否能做到实时更新,多源异构数据是否能够实现融合和汇聚,能否承载人工智能、区块链等前沿技术的数据计算能力等方面,都在考验着数据处理的技术能力。媒体企业也必然加大在技术硬件方面的投入,通过提升服务器硬件水平、部署分布式数据处理系统等方式来实现对数据的掌控力。

关键三:精准触达用户

积累数据不仅仅是为了训练模型,让其更精准,更是为了从中提取有价值的信息,并利用好这些信息,进行更有效率的传播,更精准地在用户和信息之间构建桥梁。

不管是文章、视频还是新媒体产品,最终到达的节点是用户。用户可以不去了解文章作者是谁、爱好是什么,但是作为内容生产者和传播者,必须对其受众有精确的洞察,这在很大程度上影响着内容制作的方向、特点、风格和运营模式。而随着平台型媒体的增多,PGC、UGC等内容生产方式层出不穷,用户选择可看的内容也不仅限于“千人一面”。通过对用户年龄、阶层、行为偏好进行数据分析,就可以向不同用户推送不一样的内容,形成“千人千面”的用户体验。

分析用户数据还能实现精准营销的目的。《纽约时报》专注于利用用户数据帮助客户实现广告定位,起到产品建设的目的。2020年2月,《纽约时报》组建了一支由来自数据、产品、设计、技术和广告领域的行家组成的新团队,主要目标是通过用户行为和喜好为广告商设计产品,实现精准定位。[2]阿里巴巴的数据中台通过One ID来连接用户在阿里巴巴产品体系下的用户数据,将用户在阿里系产品中产生的数据通过One ID关联起来,这样就可以从衣食住行等各个方面来精确描绘用户画像和兴趣,制定高转化率的营销方案。[3]

除了在单一平台上发布内容,很多时候,还需要在不同渠道进行内容分发,来树立品牌形象,进行流量引导。这需要根据不同平台特性、不同目标用户特性,对同一款内容进行二次加工。比如在抖音上发布的视频多以竖屏为主,在小红书上更多以图片为主,在知乎上则要紧贴问题,不能照搬照抄。BuzzFeed开发了一个叫Hive的项目,它可以帮助编辑按平台特性个性化制作同一款内容。举例来说,一个包含7个步骤的炖鸡菜谱网页在Facebook 上变成了46 秒的视频;在Instagram上变成15秒的短片,评论区附有烹饪要点;如果要分享到Snapchat,它还得转成纵向模式。同一份菜谱,一瞬间就能变成数个不同的MP4文件。

关键四:加强传播效果分析

在数据驱动思维的影响下,内容传播效果的评价也将用数据来替代人工经验,比如引入传播力指数之类的指标进行检验。而要形成数据评价闭环,还需要对差异化的传播结果进行对比测试,来指导新闻生产环节的改造、提升传播效果和转化率。数据驱动中比较典型的方法是A/B测试,它也被称为对比测试和分桶测试,旨在用于对比测试(A)版本与变量(B)版本两个版本的内容的效果,识别哪一个版本对于用户更具吸引力。字节跳动在推出抖音之前做过很多产品小样,起了很多名字,也设计了很多logo。它将不同名字和logo放在不同应用市场,在位置、预算等条件一致的前提下,测试了各自对用户的吸引力程度、下载转化率等指标,最终确定了“抖音”作为新产品的名字。

在A/B 测试的基础上,也有诸如《华盛顿邮报》这样的媒体引入了MAB(multi-armed bandit)测试,即“多臂老虎机”。它是一种动态随机最优化的范畴,是特殊类型的动态随机控制模型,用于处理如何最优地进行稀缺资源的分配。相比A/B 测试,它更加灵活,在测试运行过程中可以增加或者删减变量,比如同时测试标题、图片缩略图、视频、推荐文章、热门文章等。当编辑添加一个变量到其MAB 模块并对网页进行发布时,MAB 测试的算法会自动注册一个有关新变量与默认变量的新测试,同时发布到网站上,开始在测试页上跟踪与测试相关的用户反馈,并根据实时反馈,选出最佳变量。这种最新的测试方法的优势不仅在于变量的组合能够最大限度地引起用户的参与,并且能够花费最小的成本探索出最佳的变量组合。[4]

虽然A/B 测试可以用较小的流量获得优选结果,但是,它在国内媒体中的应用还处于初级阶段。字节跳动旗下火山引擎做过的一项市场调研显示,在企业的日常业务和管理中,A/B测试的普及率并不高,渗透率不足30%。一个比较实际的原因在于,部署A/B测试需要有很强的底层技术支撑,包括服务器的实时响应能力和处理速度等,来保证科学的流量分割、流量层直接的正交互斥,使得实验不受干扰,中小企业不具备相应的技术条件。A/B 测试也并不是万能的,它需要投入一定的试错成本,很可能较好的测试结果并不是内容生产者希望出现的。当然,评价传播效果不只有A/B 测试这样一种方法,我们真正需要的是以用户需求为导向,借助数据分析工具,更好地强化媒体与受众的连接,提升内容传播效果。

关键五:打造适应变革的组织

能够超越技术的不是技术,是人;能够成功让技术引领媒体深度融合的也不是技术,是组织。新技术的运用,需要与之相适应的组织变革,其潜能才可以充分释放出来。相对来说,组织变革更加复杂艰巨,因为涉及人与人生产关系的改变,而且要克服组织惰性。[5]在技术驱动媒体深度融合发展的背景下,技术人才并不只是待在幕后,而是走向编辑室,将技术融入更多内容生产之中。

例如,澎湃新闻《海拔四千米之上》H5产品就由技术人员发起创意。在预判会获得大量精美影像材料的基础上,前端工程师采用全景视频的方式进行内容呈现并提供基础框架,使用了普通拍摄、航拍、延时拍摄、360全景图片、定点VR视频、漫游VR视频、互动热点、交叉嵌合等方式,实现了多种技术和表现形式的大融合。产品最终获得第二十九届中国新闻奖融合创新类作品一等奖。

媒体竞争关键是人才竞争,媒体优势核心是人才优势。根据波士顿咨询公司《数字经济下就业与人才研究报告》,数字技术融入各行各业,善用数字技术成为诸多岗位的“必修课”,如传统营销转型为数字化营销,商业情报分析转型为大数据分析。因此,掌握综合化的不易被数字技术所取代的技能及素质将享有更广泛的职业发展空间,而争夺此类人才也势必会成为“人才争夺战”的重中之重。无论是技术架构的搭建还是业务场景的深化,都需要数据分析师掌握分析工具、具备用数据分析问题的能力,并对业务有深入的理解和丰富的经验,如此才能对媒体行业的数据指标有准确的判断。

此外,媒体单位的组织方式也需要适应互联网时代,变得更灵活、更多元、更扁平化。传统媒体中逐级上报、决策滞后的模式将会是快速响应网络的阻碍。如何建立数据与内容生产相适应的考核机制,也是传统媒体需要突破的难题之一。

猜你喜欢
驱动测试内容
内容回顾温故知新
基于模糊PI控制的驱动防滑仿真系统分析
屈宏斌:未来五年,双轮驱动,砥砺前行
幽默大测试
轨旁ATC系统门控柜接收/驱动板改造
“摄问”测试
“摄问”测试
“摄问”测试
主要内容
基于S3C6410的Wi-Fi驱动移植实现