数据智能中台驱动媒体融合创新

2020-06-22 14:14文_苏
传媒评论 2020年10期
关键词:中台图谱机器

文_苏 萌

数据智能是综合的数字体系,靠单点的技术和单款产品很难实现目的,所以数据智能包括综合技术体系以及智能应用体系两个方面。其中,综合技术体系融合了大数据、人工智能、云计算、物联网等多种技术,应用于数据处理、分析、决策;智能应用体系连接物理世界与数字世界,核心包括人机智能交互、自动化知识构建和服务,以及机器辅助决策等应用。

数据智能未来的演进趋势有以下三点:一是技术融合,包括新一代的信息技术和未来的信息技术的融合;二是数据融合,包括第三方合作伙伴的数据以及更多的物联网数据,目前很多业务里面开始有传感器数据、地下数据、地上数据,我们正在做的生态数据里还包含卫星数据;三是场景融合,单个场景很难解决问题,我们用流程、分析、洞察、决策来深入数据智能体系。技术融合、数据融合和场景融合,形成数据智能的三个特点。一是实时性,越来越多的实时数据流入进来;二是交互性,包括可视化、可操作、可探索、自然交互,让机器识别我们人类的语言,再翻译成自然语言;三是自主性,可形成感知、认知和决策。数据智能最终可服务于社会治理、企业提效和便民惠民服务。

基于数据智能的发展和演化特点,形成了百分点的数据智能中台架构。数据智能中台的核心理念包括四个方向,快速响应前台业务需求、沉淀数据资产、聚合服务能力、跨领域快速创新。其中最核心的是连接前台后台、快速响应前台需求,从而满足不同业态、不同业务模式场景下的个性化需求,满足业务快速变化的迭代需求。

数据中台是一站式的智能数据管理体系,核心是为了帮助企业做到业务数据化,把数据做到资产化,然后资产再运营化。包括大数据底层平台、数据资产管理平台、统一标准体系。我们把所有技术组建化、产品化,再用标准化的产品来满足我们所服务的一万家客户的碎片需求,从而形成我们的竞争积累和规模化的优势。

我们做了一套自己的方法论体系,包括五大体系和20道工序,数据汇聚、数据治理、数据处理、数据服务、数据分析,通过精细化分工和流程化的管理,形成非常高的效率。现在部署一套海外国家级的平台,可能几个人大概一到两周时间就可以部署完,而之前需要几个月,甚至半年的时间才能做到。

数据中台和AI中台是整个数据智能的一体两翼。从AI中台来说,目前百分点构建了AI能力引擎,包括人脸识别、机器翻译、语音识别。我们也建立了AI开发平台,以大数据为主要生产要素,构建AI能力,同时基于行业知识库,构建智能标签和行业知识图谱。

AI能力最核心的一个技术是NLP(自然语言处理),在自然语言处理领域,核心是让机器读懂人类。我们现在用深度学习的算法来提高自然语言处理的效率。第二个核心技术是动态知识图谱技术,让机器做知识的提取、知识的融合,同时形成知识图谱,最后通过人机交互,把知识通过机器传承出来。一个老师把知识传承给学生需要几年的时间,而机器非常快。通过构建专有领域的知识图谱,把技术化的数据转变成业务知识,再形成业务知识的对外服务和支持。

通过这些技术的综合应用,实现多维度、交互式、可视化分析挖掘,让技术人人可用,不需要黑盒子编程就可以海量处理不同时间空间的大数据。我们在滨江开发区的研发团队研发了智能分析引擎,国内很多顶尖企业都在使用我们的产品。其中包括智能图表一键式推荐、智能问答、智能建议、智能挖掘,深度融合了BI,又结合了AI交互式的引擎。

另一个应用成果是智能校对,用AI来实现政治实体识别、敏感实体识别,让传统的校对分工更加高效,辅助内容创作者更有效地发现问题,提升校对质量和审稿效率。

最后分享两个案例。今年两会期间,我们分别用了一个月时间帮助新华社构建了两会专题库和习总书记出访专题库,实现了媒体智能采编发效率的大幅度提高,形成快速构建知识分发的体系。另外一个案例是南方报业集团,通过AI的能力以及机器翻译、智能识别、自然语言处理赋能,从而形成快速构建工具的能力。

(摘自苏萌在2020中国[杭州]传媒技术生态高峰论坛上的主题演讲)

猜你喜欢
中台图谱机器
基于图对比注意力网络的知识图谱补全
机器狗
机器狗
中台是媒体转型必经之路吗?
——媒体中台建设的特点和误区
关于零售企业“中台”建设的研究
汽车制造企业质量中台研究
以技术开发中心为中台,数字化转型之见解
未来机器城
图表
主动对接你思维的知识图谱