本刊记者|陈旭管
大数据技术驱动媒体融合发展
——记2017年“王选新闻科学技术奖”特等奖项目浙报集团“媒立方”技术平台建设
本刊记者|陈旭管
编者按:2014年8月习近平总书记在中央全面深化改革领导小组第四次会议上强调,推动传统媒体和新兴媒体融合发展,要遵循新闻传播规律和新兴媒体发展规律,强化互联网思维,坚持传统媒体和新兴媒体优势互补、一体发展,坚持先进技术为支撑、内容建设为根本,推动传统媒体和新兴媒体在内容、渠道、平台、经营、管理等方面的深度融合。习总书记的重要讲话为推进媒体融合发展指明了方向。
从2014年到2017年,从“相加”到“相融”的探索,浙报集团以党中央提出的媒体融合发展决策为行动指南,将推进媒体深度融合作为重大改革工程。融媒体智能传播服务平台(简称“媒立方”)作为支撑浙报集团媒体深度融合的平台级产品,将大数据技术作为平台建设的重要组成部分,支撑起指挥中枢、PC端、移动端在内的所有采编终端,打通全流程数据,驱动“策、采、编、发、反(馈)”进入在线环境。在推进媒体融合发展的短短几年里,从资本积累到技术平台建设再到机制体制创新,进而倒逼采编人员的转型变革,浙报集团“以技术创新为驱动力、以体制创新为突破口、以内容创新为根本”走出一条技术创新与采编业务高度耦合的融合之路。
2017年7月,“王选新闻科学技术奖”重磅发布,浙报集团“媒立方”技术平台获特等奖,这是空缺多年来,该奖项的特等奖首次颁发给媒体技术平台。
“媒立方”的建设如何实现技术创新与采编业务的高度耦合?如何以内容建设为根本,以技术创新为驱动,突破机制体制,实现融合道路的可持续发展?《中国传媒科技》记者对话浙报传媒集团产品研发中心副主任任海平与浙报集团网宣办数据分析室副主任董立林,探索以大数据技术为驱动的“媒立方”平台如何推进媒体融合的可持续发展。
近年来,从国内主流媒体的融合实践来看,多以“一次采集、多种生成、多元传播”作为技术平台建设的基本思路。浙报集团的融媒体智能传播服务平台(简称“媒立方”)以大数据技术为底层支撑,以智能化服务满足业务需求,形成大数据平台与传播服务平台(业务平台)两大部分,为大数据技术与新闻业务的深度融合打下坚实基础。
“媒立方”大数据平台是基础也是“筋络”,从架构上将集团内容数据、流程数据与用户数据进行全面集中、关联和深度挖掘。其中在内容数据库中包括国内1003家数字报刊数据、异构化资源数据、互联网新闻数据、政府门户数据、微视频库、社交平台信息、新闻图片库与历史老照片等10余类数据源,构建一体化底层数据源,运用先进的大数据存储计算能力、敏捷多轮的数据加工体系实现数据任意节点与流程间的无缝流转。同时,在此基础上通过自然语言处理、机器学习等技术对数据进行分析与建模,构建起热点追踪类、辅助创作类、事件分析类、传播力分析类、个性化推荐类服务,促进采编人员更好地从数据中挖掘创作灵感。 6.6亿用户数据汇聚报纸读者用户、网站数字端注册用户、边锋平台游戏用户、移动手机报订阅用户、经营类用户以及外来投稿的通讯员用户数据,通过整合多端、多平台用户数据,对用户行为进行精准分析,为集团采编业务、运营与经营部门提供数据服务。
在传播服务平台(业务平台)建设中,依托传统媒体与新媒体的多渠道融合生产模式,充分运用大数据平台的相关服务,构建策划中心、采编中心、资源中心、可视化中心与运营中心,形成集舆情研判、统一采集、分类加工、集中分发、传播效果评估于一体的新型智能化内容生产平台。
浙报集团产品研发中心副主任任海平表示,“媒立方”的大数据平台与传播服务平台是两个“互为表里”的平台,平台的建设过程也是一个以互联网思维对媒体资源进行重新配置的过程,为传统媒体与新媒体之间的融合、为新闻资讯向多种经营模式的融合奠定基础。
如何让技术平台建设与新闻业务紧密结合是一个很大的课题。技术平台如何支撑指挥中枢、PC端和移动端等所有采编终端?如何驱动“策、采、编、发”转型至线上生产?如何应对在不断变革中的采编业务需求?
“媒立方”平台结合业务需求,利用大数据、自然语言处理和机器学习等技术整合报社优质资源,以场景式技术创新实现多维度选题策划、全媒体协同指挥、碎片化内容创作、可视化流程监测、多渠道融合发稿、原创作品传播分析等全新功能,从而将大数据与生产传播业务加以紧密耦合。
在策划环节,“媒立方”通过热点探索、线索追踪、事件挖掘、时间、地域与领域等数据模型,对事件、专题、话题等进行阶段性跟踪,量化传播热度、主题分布、民众反应等维度,促进采编人员快速准确掌握新闻动态,挖掘新闻信息潜在价值、推进内容创作。
在采集环节,“媒立方”系统通过建立统一的内容资源库,打通各个渠道的数据资源,通过数据清理、二次打标建立内容可靠性分类、地域分类、舆论场分类等多个维度的内容标签体系,通过权限设置为各个不同垂直领域的编辑部提供新闻素材。
在编审环节,“媒立方”系统通过计算模型自动延展相关主题稿件,通过关键词、人名、机构等信息实时形成稿件背景资料;结合痕迹版本、敏感词、黑马校对功能进一步保证内容质量。
在发稿环节,“媒立方”系统在实现多端融合发稿外,依据采集的内容相关数据和用户数据形成用户阅读兴趣画像、时序传播画像和媒体影响力画像,为后续数据资源精准投放打好基础。
在评估反馈环节,建立传播影响力分析系统,从新媒体产品端埋码数据收集,到以阅读、互动、转载三个维度以及权重比例作为模型计算,计算出单篇文章互联网传播力指数,形成了以用户为核心的浙报传播力指数考核评价体系,为每一个新闻产品传播效果评估与绩效考核提供明确的数据指标。
“媒立方”平台的大数据技术应用充分融合于新闻采编业务的各个环节,实现新闻生产从线性到环状数据闭环,将“孤岛型”的多端内容生产系统融合为“一体化”的平台,真正实现技术牵引下组织结构的全面改革、工作机制的配套创新,充分利用大数据技术以及基于该技术的智能化服务推进媒体融合发展。
图1 内容生产流程:从线性到环状
一方面大数据技术的应用驱动新闻业务发生变革,另一方面新闻业务的需求也在不断驱动技术平台建设的可持续发展。为实现技术平台与业务平台的深度融合,浙报集团变革组织架构,推动新闻业务与技术平台建设相互促进、不断迭代创新。
首先,为高度耦合采编需求与技术平台建设,浙报集团成立网宣办数据分析室与舆情分析室,不仅为业务人员提供数据服务,同时连接技术部门与业务部门,负责搜集采编需求与业务人员对技术平台使用情况的用户反馈,及时与产品研发中心沟通,促使技术平台不断迭代创新。
其次,为更好服务于业务需求,“媒立方”产品研发中心下设研发管理部、产品规划部、项目与质量管理部、媒体采编部、移动采编部、视频采编部与运营产品部七大部门,分别负责业务部门的需求收集、业务改造;需求分析、产品规划;项目建设、质量把控;平台研发、大数据建设;移动端、视频端产品开发、媒体云服务的开发等。
据浙报集团网宣办数据分析室副主任董立林介绍,“媒立方”技术平台在报题系统中,添加了稿件分发渠道及稿件形态标签,各部门报题时可进行选择,方便在采编三会中讨论。此外,通过“媒立方”报题系统还可将选题与稿件进行关联,这样全媒体指挥中心的监测大屏就可以实时监测到选题相关稿件在各个渠道的分发情况。为满足指挥协同需求,“媒立方”报题系统、采编系统对PC端、移动端都进行了适配,记者编辑通过PC端或移动端都可以进行报题、采集、发稿与签审,稿件状态则实时反馈至大屏,由此实现大屏、PC端、移动端三端联通,实时跟踪选题情况。
推进媒体融合发展并非一蹴而就,任何转型发展进程中都面临着诸多挑战。从近年来国内媒体融合实践来看,一方面随着技术平台的建设、运行机制的调整,提高了新闻生产能力,但另一方面日益严重的内容同质化现象、协同生产的非常态化运行、突发事件的应急运行机制、转型过程中传统采编队伍对新媒体舆论场的不适应性等诸多不容忽视的细节影响着媒体融合发展的可持续性。
规避新闻同质化是媒体融合可持续发展的一个重要课题。为避免内容同质化现象,浙报集团从顶层设计到具体的采编业务,以差异化重构运行体制机制作为避免同质化内容的建设思路,实现内容生产的多元化、多终端、多形式呈现,满足不同用户需求。在顶层设计上,打造起核心圈、紧密圈、协同圈“三圈环流”的新媒体矩阵,其中“核心圈”以浙江新闻客户端、浙江在线网站、浙江手机报、视频客户端共同构成以传播主流新闻价值为核心的党媒圈。“紧密圈”以钱报网、大浙网、浙江24小时客户端、边锋新闻专区等共同为用户提供多样化新闻、文化与生活服务,形成以新闻服务为主的都市圈,成为主流舆论阵地的重要延伸。“协同圈”包括微博、微信和专业App等渠道,突出内容的垂直化与细分化,通过商业网站平台,积极抢夺话语权,为核心圈与紧密圈内容产品导流、扩大影响力;从架构上,建立分级联立的“中央厨房”式内容生产体系,既有集中,打通底层数据和流程平台,实现报、网、端、微、视全媒体形态的内容常态化生产,又有个性,实行适应不同媒体圈的分级管控;在组织上,以内容建设为根本,形成“大编辑中心+垂直采编团队”的组织架构,其中大编辑中心分为夜班编辑部与数字编辑部,分别负责报纸要闻版、客户端头条、网站首页等内容。垂直采编团队分为政治、经济、文化、社会生态等领域内容,每个垂直团队的编辑记者以垂直内容为出发点,以媒介特征为分发时序,将采集内容进行差异化编辑;在具体措施上,鼓励编辑根据不同终端属性进行差异化编辑的同时,“媒立方”平台提供重稿判断与智能化匹配系统,将多端发布相似度超过70%以上的稿件抽取出来,配以绩效考核,规避稿件的同质化现象。
协同生产常态化是媒体融合可持续发展的再一个重要课题。为提高协同生产的制作能力,浙报集团在“媒立方”基础上,建立日常采编机制,其中包括每周编委扩大会议,研究重大选题;全媒体指挥统筹协调机制,建立统一的选题线索库,根据新闻价值与各媒体特点,由集团值班编委统一指挥协调采编力量;同时建立采编三会制度,通过早会、午会和晚会,统筹指挥配置报、网、端、微采编资源,实现全媒体、全流程、全天候新闻采编发布以及动态跟进。其中早会报题除当天报纸内容外,尤其注重数字端选题策划,午会、晚会在动态跟进数字端选题的同时,协调当天报纸版面安排。三会期间,新成立的浙报集团网宣办数据分析室与舆情分析室则通过数据监测、热点发现与分析为采编部门的策划会议提供数据支撑与服务,形成一次采集、多端分时序差异化发布、全流程数据服务的采编制度。面对重大报道与突发事件报道,浙报集团成立编委会专题研究机制,统一调集指挥集团各媒体采编力量,常态化运行中的“媒立方”全媒体指挥监测系统,更发挥出其作用,实时跟踪热点及事件发展过程。同时,为记者配备移动版“媒立方”系统与记者包,对于突发事件的报道,可直接通过手机进行现场直播报道,回传新闻素材。
图2 “媒立方”移动采编系统
转型过程中锤炼和造就一支新型的采编和技术队伍是媒体融合可持续发展的又一个重要课题。在媒体融合发展进程中,技术平台的建设与体制机制的调整,一方面通过生产工具的变革提升新闻生产力,通过体制机制的调整提高协同生产能力,但另一方面新技术工具的应用与运行机制的调整也为采编队伍的转型发展带来新的问题。技术变革所带来的新闻生产速度的提升、多端发布的便利性,用户阅读场景的多元化等因素共同倒逼采编人员提升新闻生产能力,向全媒体记者转型。为推动人在变革中的转型发展,浙报集团采取全员培训与优势互补策略。在业务人员转型过程中,一方面开展全员数字化转型的业务培训,为记者配备相关采集设备,另一方面发挥老编辑记者在深度报道领域的优势,将报社传统优势与新媒体能力培养并重,共同推进人的融合发展与数字化转型。在技术团队建设中,“媒立方”产品研发中心的技术人员既包括报社传统技术人员也包括具有互联网基因的技术人员以及创业团队,任海平表示,传统的技术人员对新闻业务具有较深的理解度,具备互联网基因的技术人员拥有更好的技术研发思路,创业团队更富有激情,三者之间各取所长,相互融合,共同推进集团技术平台建设。
从技术平台建设到体制机制变革再到实现人的融合,浙报集团从过去发行量42万份,到今天集聚近6.6亿注册用户,5000万活跃用户以及3000万移动用户。在2017年全国两会期间,省级党报两微官号传播力榜单显示,浙江日报位列全国省级党报第一名。
作为全国第一家媒体经营性资产整体上市的省级报业集团,从推动媒体经营性资产整体上市,成立浙报传媒梦工厂、收购边锋浩方网络平台,成功打造资本平台,到投资1.3亿建设“媒立方”融媒体智能服务平台,再到机制体制变革。从资本积累到技术平台建设与采编业务高度耦合,再造运行机制体制,倒逼采编人员转型,浙报集团紧紧围绕党中央提出的融合发展决策为行动指南,以先进技术为支撑,内容建设为根本,推动传统媒体与新兴媒体在多方面的融合,形成技术平台与业务平台螺旋式上升的可持续发展路径。