感 言
在我们的原有观念里,技术人员一直以来都是“沉默的大多数”,他们看似高冷不风趣,但其实他们内心深处也有与外界沟通交流的渴望。今天,也让我们给他们一个转身,一起倾听下他们两会技术保障的心路历程。
刘春玉(新华社技术局工程师)
今年两会,CNC在国航机舱中成功进行空陆视频直播,技术创新出彩,成为今年两会视频报道的新亮点。
两会期间,音视频部、CNC临时增加两会特别直播。3 月10日,CNC中文台关于两会议题“‘互联网+’推动传统行业融合发展”在国航波音机舱中进行空陆视频直播并取得圆满成功。
在本次直播报道中,通过运用宽带卫星技术和4G背包实现了空陆直播信号传输并在机舱电视上实时接收和展示直播节目,同时使用融合通信和应急响应平台解决了高空特殊状态下的通话联络难题。正式直播前,我局全媒体部和5971电台联合音视频部、CNC进行了多次全流程直播演练。在局领导的统筹部署下,运指领导和相关处领导亲临演播厅现场盯守,前后方技术人员紧密协作攻坚克难,高效完成了前后方的直播技术系统设计和搭建。直播期间,前方技术人员在高空机舱中提供全程技术服务,后方技术人员在总社多点位全力保障,最终圆满完成直播保障任务。
本次直播报道,是我社首次实现空陆视频直播连线,也是我社两会报道中电视直播和融合通信的重大创新,开创了我社在空陆通信领域进行视频直播报道的新模式,对我社今后进行高空新闻事件报道具有重要意义。
刘颖旭(新华社技术局工程师)
根据总编室融合报道常态化要求,技术局实验室和新媒体中心联合研发了一款轻应用产品制作工具——“轻易”,让轻应用快速制作成为可能。
“轻易”通过构建组件库,动画库,单页库,模板库,可支持模板持续、快速、便捷的制作,通过组件加动效生成单页,通过单页的任意组合生成丰富的模板。目前可实现对文字、图片、音频、视频、动画等内容进行融合加工,通过预置的单页及模板,可应对快速报道要求。目前“轻易”已积累多达百余种动效,百余个单页模板。
一百余天昼夜奋战,六万余行代码,“轻易”在两会前夕正式上线试运行。两会期间,融合报道平台、新媒体中心、国际部、对外部、信息部等多个部门都在“轻易”上制作并发布了自己的融合产品,在新华社发布客户端、社交平台等多个渠道都能看到两会轻应用的身影。
为了宣传展示新华社两会轻应用内容,我们特别制作了“2015两会轻应用”展示页,在大会堂前方发稿平台的大屏上进行滚动播放,得到了关注和好评。目前,“轻易”在功能及易用性上依然有提升空间,后续将增加图表在线制作功能,为数据新闻可视化提供更好的支持;将不断丰富动效、单页、模板的类型,加强轻应用工具的交互特性,利用手机的传感器提供生物感知体验;还将提供数据分析功能,通过获取用户点击和传播路径,进行新华社轻应用内容的传播效果统计分析等。
苏宇(新华社技术局工程师)
两会期间,我负责大数据技术创新工作,主要包含四项内容:一是互联网新闻智能分析系统,提供互联网热点榜单、UGC热点线索、事件多维度分析服务;二是新闻传播影响力评估系统,形成我社重点稿件在互联网平台的传播影响力指标;三是UGC新闻认证系统,实现UGC新闻真实性的分级度量和预警。四是两会数据分析报告,每日为融发平台汇聚两会舆情最新数据。这几项工作的创新性表现在以下几个方面:
采用自主采集和合作引入相结合的方式实现多源数据汇聚,覆盖重点网媒、微博、手机客户端、图片、境外网媒、Twitter、Facebook等各类互联网资源,与互联网公司、科研院所建立合作关系,通过相应数据规范和接口规范,引入社外大数据资源,保证数据的准确、全面和时效性。
突破性应用知识关联、热度计算、UGC新闻线索发现、传播网络分析等大数据智能分析挖掘技术,为编辑记者的报道选题、素材汇聚提供互联网智能化分析手段。在两会开始的8天内,聚合300余个热点话题、120个热词、80个两会微博热议话题、35个外媒涉华报道热点,并从报道趋势、倾向性、传播网络等多方面实现数据分析。
依托科研专项,研究适用于网媒和社交媒体的评估模型,并紧密对接业务需求,初步具备了影响力评估技术手段,提供重点稿件影响力评估服务。两会开始8日内,为90篇我社重点稿件、40篇同业稿件提供影响力评估,转载统计累计达到9000余篇。
创新性采用信息源、信息内容和传播网络相结合的方式,突破UGC新闻认证技术,形成UGC新闻真实性的分级度量和预警。据调研,目前国内尚无任何一家媒体机构采用构建技术系统的方式来对UGC内容进行认证,新华社作为先行者,具有很高的创新性。
此次两会,首次采用数据分析日报的形式为两会提供数据服务。分析日报的内容涵盖我社重点稿件影响力评估、同类报道对比、今日热词、两会微博热点、外媒涉华热点等、栏目,为融发平台每日提供数据报告。
孙振中(新华社技术局工程师)
网络媒体采用统计是使用技术手段来实现网络媒体的自动化统计,彻底脱离落后的人工统计方式,极大拓展了网媒统计范围,网络媒体自动化统计已经扩展到140家,在两会创新中,主要是把网媒的统计数据服务于两会,让编辑记者方便地查询各自稿件被网络媒体采用的情况,同时从主流网媒、两会专题、新华全媒头条的角度展现新华社两会稿件被网媒采用的实时统计数据。
在技术保障过程中,我们遇到的主要困难是140家网站采集点的配置以及统计数据实时性的问题。一共配置了14000多个采集点,抓取的数据全面与否直接关系到结果的准确性,主要依靠配置采集点,整个配置工作繁重。初期,我们坚持两条腿走路,人工与自动统计并行作业。自动统计遇到的一个难题是实时性,无论是数据采集还是相似度比较,都需要时间,为了提高数据的实时性,我们不断优化了数据的处理流程、增加数据处理的并发能力,使我们在4-6小时以内就能看到稿件被网站采用的情况。
网媒统计数据可以通过查询系统向编辑记者提供采用信息,同时使用图形和报表形式为统计工作提供了直观参考。