AI时代,党媒推荐算法的优化策略

2023-11-04 09:45任海平
传媒评论 2023年10期
关键词:标签内容算法

文_任海平

一直以来,传统媒体在内容传播上遵循“以我为主”的逻辑,但算法技术的发展,已悄然改变着用户对信息的需求。传统媒体不仅要求信息具有及时性和准确性,还要面对“流量焦虑”和“算法焦虑”的困扰。人民网曾在《人民网二评算法推荐:别被算法困在“信息茧房”》一文中称:“在算法的帮助下,我们可以轻易过滤掉自己不熟悉、不认同的信息,只看我们想看的,只听我们想听的,最终在不断重复和自我证成中强化了固有偏见和喜好。一旦身处这样的‘信息茧房’,就再难接受异质化的信息和不同的观点,甚至在不同群体、代际间竖起阻碍沟通的高墙。”不难发现,央媒在算法问题上的立场是以指导驾驭为主,反对失控、混乱、危险的算法。

2018 年6 月,人民日报在“人民号”发布会上,提出了“党媒算法”概念,同期,中央广播电视总台也推出了“总台算法”。不管是“党媒算法”还是“总台算法”,本质上指的都是推荐算法,它是指基于大数据和人工智能技术,结合用户行为精细化埋点生产内容的精准化解构、用户地理位置信息识别,融合用户行为和语义识别,不断挖掘因果链条关系,实现海量内容与个性化需求相匹配的算法。而党媒推荐算法,要在普通推荐算法基础上,嵌入体现主流价值观的模块,为社会提供更多正能量内容,主要具备以下属性:一是算法属性,作为人工智能算法,它可以根据用户在网上看什么、喜欢什么、需要什么,不断自我学习,从海量的内容中挑选出最适合的信息推荐给用户。二是价值观属性,一种价值引导,它可以帮用户找到正面、真实、积极的信息,避免看到低俗、虚假、负面的信息,让用户受到主流价值的影响和教育。三是用户属性,算法尊重用户的判断和选择,充分重视用户的反馈,满足用户多元化、个性化的信息需求。四是社会属性,与社会责任紧密挂钩,持续跟踪社会发展需要,推荐更准确、更高效的内容,让用户感受到更好的服务和更大的社会责任。

“党媒算法”应用实践中的困扰

党媒推荐算法的提出已过去五年,目前已逐步应用于各媒体的新媒体渠道,如网站、客户端的搜索、推荐、活动分享、评论等,但无论从算法结构还是应用效果看,依然存在较多的问题难点。

一是内容的质量和价值评估问题。党媒算法要从海量内容中筛选和排序,推荐正面、真实、积极的内容,抵制低俗、虚假、负面的信息。同时,也要解决以下问题:如何衡量内容的质量和价值,如何消除主观偏见和误判,如何协调用户的多元需求和主流价值的引导,如何体现主流媒体在国家治理和社会公众服务上的作用,等等。

二是用户的兴趣和需求识别问题。推荐算法主要依赖于用户的点击、浏览、收藏、点赞、评论等行为数据,而这些数据并不能完全反映用户的真实需求和满意度。党媒算法根据用户的行为数据和内容分类标签,推荐符合用户兴趣、偏好、需求的内容。但同时也要解决以下问题:如何准确地捕捉并分析用户数据,如何保护用户隐私和安全,如何防止行为数据被操纵,如何利用地方政府资源,创新“新闻+服务”模式,满足不同地域、不同层级、不同类型媒体用户的需求。

三是推荐的效果和效率评估问题。党媒算法在重视传播反馈,改进推荐的准确性和效率,提高推荐的服务水平和社会责任的同时,也要面对以下问题:如何获取和利用有价值的反馈信息,如何建立并执行有效的评估机制,如何平衡推荐的效果和效率之间的关系。

四是人工智能时代推荐算法的持续创新问题。算力是推荐算法的基础,影响了推荐算法的性能和效果。随着人工智能时代算力的提升,推荐算法也需要持续更新,建立更适应的技术方案。同时,推荐算法也要考虑社会责任和伦理问题,与党媒的意识形态引导相匹配。

“党媒算法”优化设计的浙报探索

推荐算法的本质是将合适的内容匹配给合适的用户,所以,针对内容和用户建立的标签体系是推荐算法有效与否的关键。人民日报媒体技术股份有限公司建设的“全国党媒信息公共平台”就以“党媒算法”为核心,革新了用户画像体系和内容标签体系,对海量聚合内容进行智能化和自动化处理。通过构建主流价值观知识图谱,自建智能标签体系,根据稿件标签和用户阅读习惯构建用户画像,并通过建立兴趣相关、地域相关、时效相关等推荐模型,实现不同用户不同阶段的稿件智能推送。而中央广播电视总台的“总台算法”则建立了从细分内容到爆款内容的内容漏斗模型,同时建立从高活用户到低活用户的流量阶梯模型,运用算法挖掘潜在热点,为有限规模的内容精准匹配用户喜好,将可能成为热点、爆款的精品内容逐渐放大人群推送范围,从而有效检验内容传播力。[1]

“党媒算法”不排斥算法逻辑,但又完全不同于商业意义上的算法推荐。它并非在纵深的商业逻辑里加速人工智能与快销式资讯的深度匹配,而是努力为算法赋予党媒的主流价值观,构建主流价值引领下的新媒体生态。这也是浙报集团在发展推荐算法中必须秉承的目标理念。浙报集团旗下传播大脑科技(浙江)股份有限公司不断创新浙报特色的推荐算法,研发具有“党媒”特质的智能引擎,在“采、建、管、用”大数据逻辑引擎的基础上,进一步优化正能量召回策略、群体兴趣模型,并借助AIGC 技术、区域性媒体生态合作资源等,构建起一套全新的推荐引擎,努力让智能算法与主流信息传播有机融合、相得益彰。

1.让正能量导入大流量

党媒作为党与社会公众的桥梁和纽带,承担着引导公众树立正确的世界观、人生观、价值观,促进社会和谐稳定的使命职责。在当今信息爆炸、真假难辨的舆论背景下,党媒更需要利用先进技术手段,让更多符合社会主义核心价值观,具有公正性、真实度,符合用户需求的内容呈现在公众面前。

在传播中引入正能量召回策略是一个比较好的解决办法,但“党媒算法”须解决好“正能量”准入问题。在构建正能量词库时,要遵循真实性原则,杜绝违反法律法规和社会公德,或者虚假、误导性信息,同时处理好核心价值观与内容创新之间的关系,避免引入重复、陈旧以及不符合时代潮流的信息。

到了实际应用阶段,推荐系统将综合考虑文章的表现和属性,对每一篇文章进行评分,如阅读、点赞、分享、评论、是否原创等维度,并依托正能量词库对稿件中的正面情感、积极行动、鼓舞人心的语言等进行匹配、计算,确定正能量元素的数量和质量。若文章内容匹配上了符合主流价值的内容标签,例如八八战略、高质量发展、共同富裕等,则在原有的评分之上叠加相应的主流价值权值,加大推荐权重。同时,为了完整地评估文章内容,还需要相关部门和媒体凭借多年来积累的经验,对风险加以评估计算,以便更好地把关正能量准入门槛。在浙江新闻客户端和2023年上线的潮新闻客户端上,我们采用正能量召回策略,让党媒核心用户群能够优先看到重要会议、活动、体育赛事等相关精彩报道,如党的二十大、共同富裕、八八战略、杭州亚运会等。又比如“浙江宣传”的内容从本源、本性、本真出发,用亲切易懂的语言表达,成为潮新闻正能量推荐的重点。

然而,新闻具有很强的时效性,我们通过不断调优评分机制来适应传播热度的变化。常规模式下的传播热度会随着时间流逝而衰减,算法中需要套用衰减函数来调整评分。对于前期热度不高,中后期却被社会关注、发酵的新闻,同样需要调优衰减函数给予加权。

2.构建党媒核心用户兴趣标签

用户思维是互联网思维的核心部分,也是党媒客户端运营的主要逻辑。为了更好地起到推荐作用,党媒算法需要不断完善用户兴趣标签,精准定位不同阶层、不同领域、不同地域的用户,满足其多样化的使用需求。

以党媒客户端的核心用户为例,这类用户往往是具有一定社会地位、影响力和公信力的用户,如政府官员、专家学者、媒体人士、社会名人等,范围涵盖党政机关、行政单位、医疗卫生单位、科研设计单位、高等院校、其他(中小学)教学单位、国有企业等。他们在关心国家、社会大事的同时,能正确地引导和影响更多的人关注和支持党媒。针对党媒应用的用户群体特性,产品端需要基于用户注册信息、产品冷启动用户偏好勾选、活动信息补足、运营推广、隐私计算等途径来扩充属性标签。数据监测端需要通过特定频道的阅读行为分析来分辨党媒核心用户标签,例如要闻、深度、财经、思想等高频订阅用户;此外,还可以通过与政府数据部门或第三方合作生态对接,进一步细化核心用户的标签类型。

当算法具备了丰富的正能量内容池和精准的用户群体标签后,就可以根据指定行为周期(全周期为所有行为数据,长期为30天,短期为7天)内阅读过的文章,为每一类核心用户群建立对应的新闻合集,并根据阅读状态和兴趣度得分高低进行精细化内容推荐,再通过核心用户群去引导并影响更多的用户群,进而放大传播效果。

3.更好对接“省域一张网”建设

浙报集团承担着建设省级重大新闻传播平台的使命,致力于通过打造“技术集成中心、数据交互中台、融合传播中枢”,构建全省媒体“一张网”新型传播体系。其中,省级融媒体平台“媒立方”、市县融媒云平台“天目蓝云”、全媒体智能中台,以及基层触达平台“融媒通”应用,构成了新型传播体系技术底座。潮新闻客户端协同各市县新闻客户端,构筑起重大新闻传播平台的“主力舰群”。未来党媒算法不仅要支撑单个平台应用,更要担当起融媒“一张网”的传播影响力使命。

在建设省级重大新闻传播平台过程中,为了满足不同地域、不同层级、不同类型媒体用户的需求,党媒算法可探索在多个方向进行策略优化。其中,一个重要的方向是根据不同区域的文化特色、历史背景、民风习俗、语言习惯等因素,进行个性化的策略分配,实现“一地一策略”的目标。举例来说,对于文化底蕴深厚的市县,如丽水市景宁畲族自治县,推荐算法注重畲乡文化、生活服务、文化评论类内容推送,展现民族文化和地域特色;对于旅游区域,如杭州市西湖区,推荐算法将更关注景点介绍、旅游攻略、交通信息、城市发展动态等信息推送,吸引游客和提升知名度;对于经济发达的县(市、区),如宁波市鄞州区,推荐算法可重点推荐经济新闻、财经评论、企业经营类内容,更好地服务区域性社会经济发展。

在各市县媒体越来越重视与地方政府合作的背景下,“一张网”布局帮助市县媒体在新媒体端集成了政务服务、生活服务等功能,在服务大众的同时,也能快速获取用户第一手标签信息,有助于精细化用户分群,为内容推荐提供更准确的依据。在媒体智库化建设中,“一张网”通过持续对各市县媒体赋能,将新闻产品有效转化为知识,并结合媒体领域专家的加工,让知识沉淀在内容推荐中,更好体现出“信息找人”的效果,有助于解决党媒推荐算法不够精准、不够个性等问题。

“党媒算法”发展方向与优化空间

“党媒算法”应用效果不是一朝一夕就能达到的,用户行为隐私保护、内容真实性、受众多样化、人为评估干预等问题,都需要探索新的解决方案。

AIGC 技术在数智化应用中的实践,也为党媒算法应用打开了一扇新的“窗户”。近期,传播大脑科技(浙江)股份有限公司发布了行业垂类大模型——传播大模型,它提供的图像、视频、多模态等编辑技术,包括以文生图、以图生文、以图生图等“创意设计”能力,可以让推荐内容更加丰富、真实和吸引人;“AI 对话”功能通过意图识别技术,准确理解用户的问题和需求,以对话方式完成“热点线索获取、资源检索、内容辅助生成、风格改写、分享文案建议”等一站式创作,能够让内容更好地适应用户的兴趣、心情和需求。可以想象,在未来的推荐模式中,加以党媒内容的语料学习,还可以让大模型具备更优的价值取向和判断能力,如用词搭配、重要人物排名等,在推荐内容的同时也能精准地把关内容。

媒体智能化发展是技术驱动下的必然方向,人在其中应充分发挥主观能动性,让技术与人的创意、情感、审美有机融合,让人与机器友好协作,才能充分发挥人工智能在媒体演进中的积极作用。

猜你喜欢
标签内容算法
内容回顾温故知新
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
主要内容
一种改进的整周模糊度去相关算法
标签化伤害了谁
基于多进制查询树的多标签识别方法