基于LDA主题模型的智慧社区新闻文本分析

2022-08-23 13:38李一鸣叶中华
科技和产业 2022年8期
关键词:警务网格养老

李一鸣, 叶中华

(1.中国科学院大学 中丹学院, 北京 100190; 2.中国科学院大学 公共政策与管理学院, 北京 100190)

智慧社区是智慧城市的重要内容。作为基层治理工作的重点,智慧社区在中国引起了社会各界的广泛重视。智慧社区建设可追溯至2012年住房和城乡建设部推行的智慧城市试点,智慧社区建设效果是其重要的验收指标。2020年初以来,新冠疫情防控进一步刺激了智慧社区建设需求。中国“十四五”规划纲要明确指出要“推进智慧社区建设”,以数字化平台提升社区治理及公共服务能力。围绕社区数字化发展,民政部也计划深入开展智慧社区建设试点和现代社区服务体系建设。与此同时,各地展开了丰富的智慧社区建设实践,发展出多样的智慧社区应用,初步形成了现代化、网络化、信息化的智慧社区样态。

现有研究从技术与社会角度阐释了智慧社区概念,提出了基于J2EE、云计算等多种技术的智慧社区建设框架、运行结构和实施路径[1-4],同时又指出智慧社区应以居民需求、人本主义为发展方向[5-6]。由于智慧社区囊括智慧安防、智慧养老、智慧医疗等诸多服务,各地智慧社区建设实践各具特色,社区智慧化转型的影响因素分析也是当下的研究热点之一。研究方法上,当前研究主要采用案例分析法,描述社区智慧化转型中行动主体之间的关系[7-8]、运作机制[9-10]和智慧社区类型[11]。基于案例研究法的研究受限于案例数量,难以对智慧社区建设的现状和成效形成宏观性、整体性的认知。

媒体报道以当地事务为主要内容,在采编和渠道优势的作用下,能够详细报道当地智慧社区建设的背景、内容及成效。通过研究多个媒体的智慧社区报道,能够清晰地了解中国智慧社区发展现状。潜在狄利克雷分配(LDA)主题模型作为一种无监督机器学习方法,能够根据上下文进行文本建模,从文档中提炼出主题模型,常被用于新闻文本的探索性分析。因此,本文将以智慧社区新闻文本为研究对象,基于LDA主题模型法挖掘文本内容,深入探讨中国智慧社区的实践现状、智慧社区建设成功的影响因素,以期为后续智慧社区建设与治理明晰方向。

1 研究设计

1.1 研究方法

为了探索智慧社区报道中的话题,采用无监督的机器学习——LDA主题建模进行分析。LDA模型包含文档、主题、词三层次,该方法能够从文档中提炼主题模型,并通过词汇的概率分布反映文档的潜在主题[12]。LDA主题模型认为主题、词汇以及二者之间符合多项式分布,通过考察词汇的概率分布确定文档的主题。LDA具有预测单词关联和记忆任务的优势,同时,不需要任何先验知识或人工注释就能自动从大量文本推断出一定数量的主题,极大减少了人为干预和负担。

目前智慧社区飞速发展,智慧社区相关新闻报道数量也呈指数级增长,报道内容繁杂多样,仅用人工编码方法难以廓清该领域全貌,而LDA在巨量新闻文本分析方面具有方法优势;此外,现有研究缺乏智慧社区建设领域的新闻文本主题分析,故本文选择LDA主题模型法。

1.2 数据选取与采集

以“中国重要报纸数据库”为数据源,从媒体报道的内容中分析智慧社区建设的现状和主题分布。选取“中国重要报纸数据库”中的新闻文本主要基于以下考量:①数据来源公信力强。“中国重要报纸数据库”是以重要报纸刊载的学术性、资料性文献为收录对象的数据库,收录了国内公开发行的几百种重要报纸。在收集到的媒体中,涵盖部级党组机关报、省委机关报、市委机关报,如《中国社会报》《河北日报》《合肥日报》,在报道上具有权威性和公信力。②数据内容全面。报纸层级覆盖中央、省、市不同级别报纸,并以地方媒体为主;地域覆盖东西南北中。地方媒体以当地事务为主要内容,承担着地方政府政务推动宣传工作、联系干群关系的重要责任[13],具有当地采编和渠道优势,能够较全面的展示地方实践发展内容[14]。③时效性强。目前智慧社区日新月异,多地在2020、2021年不约而同展开了智慧社区建设活动。媒体能够以新闻文本的形式及时展开报道,呈现各地智慧社区水平建设情况。通过研究新闻文本,能够掌握不同时间段的智慧社区状况。

基于Python3在“中国重要报纸数据库”中爬取2017—2021年题名为“智慧社区”的新闻文本,共抓取新闻文本350篇,过滤掉与本研究内容关联不强、文本为涉密内容的样本,最终确定328篇公开新闻报道作为研究对象。部分媒体报道数量如图1所示。

图1 “智慧社区”报道媒体与报道数量

1.3 文本处理与主题数量确定

以抓取获得的新闻文本构建语料库,调用中文分词工具Jieba对其进行分词。分词前添加诸如“智慧物业”“智慧养老”等与“智慧社区”密切相关的新兴词汇,以提高分词效果,同时,使用停止词列表剔除中文字符、虚词、助词等无意义词汇。

基于Python3中“sklearn.decomposition.LatentDirichletAllocation”工具库进行主题建模,该算法主要以变分推断EM算法求解文档的主题分布与主题中词的分布。遵循研究常例,将LDA模型的两个超参数α和β分别设定为50/k和0.1,其中k是选择的主题数[15]。

进行LDA模型分析需预设主题数量,本文采用困惑度指标确定最优主题数量。困惑度表示文档所属的主题的不确定性,困惑度越低,聚类效果越好。当困惑度下降趋势不再明显或处于拐点处时,此时k值为最优主题数[12]。利用“sklearn”工具库计算测试集困惑度的结果如图2所示。当k属于(1,5)时,曲线急剧下降;k取值范围在(5,15)时,曲线趋于平缓。

图2 困惑度

另外,使用Python中LDAvis库可视化LDA主题模型结果(图3)。在主题数量为5时,圆圈之间有一定距离并分散于象限四周,表明主题之间互斥并且能够涵盖原文档的大部分内容,主题建模结果较优。因此,本文将LDA模型主题数量确定为5。

图3 可视化结果

2 结果与分析

表1为智慧社区新闻文本LDA主题模型结果,包含5个主题及其特征词。结果显示,新闻内容中的智慧社区分别包括“一核多元”“企业供给”“警务安全”“养老医疗”“疫情防控”5个主题。

主题特征词是用来解释主题内涵、分辨不同主题关系的词汇,选取出现频率最高的前10个短语并以其出现的频率进行排序。“一核多元”主题包括街道、党员、志愿者等主要行为主体,网格、服务平台等行为载体,显示出“党建+网格化”是中国智慧社区建设的制度优势。“企业供给”主题包含了场景、数字、技术、科技、产业等与企业关联性较大的主题词,体现了企业凭借技术优势在智慧社区建设中提供了“数字技术”支撑。“警务安全”主题主要涉及基层警务活动中的监控、人脸识别等辅助工具。“养老医疗”主题涵盖了老年群体在社区生活中所需的关键公共服务,“居家”“护理”等特征词也显示出在社区养老医疗智慧化过程中已出现运用智能技术提供养护医一体综合服务的趋势。“疫情防控”主题表现了在新挑战下政府和企业合作实现政务信息化,助力智慧社区防疫。

表1 智慧社区新闻的LDA主题模型结果

以下部分将从各个主题的主题词和具体内容探究,更详实地展现中国智慧社区建设的整体情况。

2.1 党建引领,推动智慧社区网格化管理

“一核多元”主题,以网格、党员、服务平台、志愿者为主题特征词,这表现了“党建+网格”化是智慧社区的关键内容,同时也是中国智慧社区建设的鲜明制度特色。社区党建,即充分发挥社区党组织作用、强化基层党组织的领导力量、优化组织结构、创新活动方式、培育治理主体。党建引领能推动社区公共服务供给改革创新,是社区治理转型、破解基层发展难题的关键[16]。社区网格化管理制度是将城市社区划分为若干单元网络,形成“区-街道-社区-网格”的治理层级,每个网格内由责任分明的服务人员,利用数字化平台提供信息服务、矛盾纠纷化解等便民服务的基层管理体制。凭借技术和人员组织优势,网格化管理已成为中国社区智慧化转型的重要基础[17]。综上,党建引领和网格化管理制度的结合即“党建+网格化”,则指发挥社区党组织的领导作用,推动党建资源和网格资源的联动,实现社区内的政治、服务和社会多种功能的治理模式。

“党建+网格”化管理以信息采集优势在智慧社区建设中发挥着重要作用。数据是智慧社区功能发挥的基础。中国智慧社区实践中,网格员是主要的数据采集工作人员,他们通过与居民的互动、将传感器的数据采集上传等活动,了解群众的生活状态、居民诉求等信息,为后续智慧社区分析决策提供数据支持。比如在疫情防控阶段,网格员利用现代通信技术,汇集居民健康信息和生活需求的信息,使得智慧社区信息平台中心能够做到精准定位、有效防范。

“党建+网格”化治理模式以高效资源整合的组织优势推动智慧社区建设。党建以项目运作形式推动社区智慧化转型,在项目运行中,整合不同部门资源优势,以丰富的资源支持体系使智慧社区技术平台嵌入到公共服务供给中[18]。随着网格化管理制度的发展,城管、公安、消防等多个部门都在社区层面成立了自身的网格系统,这提升了各个部门职责在基层的落实,但也导致了系统之间相互割裂、数据壁垒的问题。“党建+网格”化管理制度,以“党的建设”为撬动点,统筹了社区网格内的社会保障、应急管理、社会救助等工作,实现多网格的资源的合一。“党建+网格”化管理模式,使得智慧社区建设中网格事项清晰、人员职责明确、条块工作协同、经费运行充足,集中资源实现社区智慧化转型。

“党建+网格”化管理模式为智慧社区高效服务提供人员基础。智慧社区本质要求多元主体参与社区公共服务实践中,“党建+网格”管理模式在组织动员方面具有天然优势,社区党员能够充分发挥先锋模范作用,带动更多社会公众参与到智慧社区建设过程之中。以天津市茶淀街道智慧社区建设为例,“党建+网格”的治理模式“凝聚了辖区单位、群团组织、党员志愿者组织力量”,运用智慧社区技术,提高了基层社区治理能力;同时,党员志愿者积极参与社区服务事项,是基层党组织服务联系群众的“最后一公里”[19]。

2.2 企业供给,支撑智慧社区场景化服务

“企业供给”主题彰显了企业在智慧社区建设中以数字技术、科技产业打造智慧社区生态、提供社区场景化服务的角色功能。智慧社区主要包括以传感器、摄像头、门禁等负责感知的基础层,以数据传输的数据层,以数据展示和交互为主的平台层和以社区服务为主的应用层。参与其中的企业包括云计算网络硬件服务提供商、电信运营商,以及应用层的房产开发商、物业企业等,各类企业分别承担着技术提供、产品研发、服务运营等主要功能。

企业是中国智慧社区建设中推动技术落地、应用场景服务实践的关键主体。AIoT是实现智慧社区的关键技术之一,AIoT即人工智能加物联网,通过AI智能分析物联数据,打造智能化生态体系。以阿里云为代表AIoT技术掌握企业,是智慧社区的基础设施搭建者,在具体实践中与当地政府合作,提供云服务和数据智能技术,创新社区服务模式,促进科学决策、精准服务。以重庆市智慧社区建设为例,重庆市民政局与阿里巴巴签订合作协议,利用阿里云互联网分布式应用架构助力重庆市民政局搭建智慧社区、智慧养老等项目平台和数据库,提升为民服务的能力和水平[20]。

企业作为智慧社区社会治理的重要主体,发挥着不可替代的社会责任。智慧社区旨在以智能技术提供社区必要服务,促进服务提供模式的转变和服务质量的提升。中国智慧社区建设发展过程中,企业不仅以逐利者的经济主体出现,更以参与社区治理、提高服务效能的社会治理主体出现。新冠肺炎疫情防控期间,智慧社区相关企业以研发优势和技术优势,承担着相应的社会治理责任。比如在连云港疫情防控中,当地互联网企业为应对疫情,研发“疫通行”AI智能社区管理系统,通过健康自助、通行证、疫情线索、权威解读等服务,打造疫情防控检测平台,满足社区、企业的疫情防控管理需求[21]。平台型企业数据化、数据信息集中化使其在社会治理方面具有独特优势,是中国智慧社区治理实践中的重要责任主体。

2.3 警务安全,打造平安智慧社区

“警务安全”主题体现了基层社区治安治理的智慧化,基层民警通过手机终端分析以视频监控、人脸识别等设备感知收集到的数据,在此基础上完成警务活动。以治安治理为主要功能的智慧社区,在实践中也被称为智慧平安社区或智慧平安小区。智慧平安社区,即在小区、社区范围内,在传统人防、物防的基础上,运用物联网技术和智能工具进行智能防控的智慧社区类型。社区平安治理是社区治理的基础,是适应新时代人民美好生活追求和应对城市化进程中多种社会管理诉求的治理创新[22]。技术治理运用到基层社区警务领域,能够有效应对复杂环境背景下层出不穷的治安纠纷、刑事犯罪和群体性事件等治安压力,是确保人民安居乐业、社会安定秩序的平安工程。

智慧社区新型技术改变了社区治安治理的传统方法。整体而言,智慧社区警务是对流动性、多元性外部环境的适应,通过现代信息技术稳定社会秩序的社会治理的创新[23]。智慧社区警务在日常常态化治理环境下,以平台力量整合物业、社区和警务活动的信息数据,为社区民警的基础管控工作赋能,服务公安实战。泰安岱岳的智慧社区警务实践中,基于物联网技术基础上,汇集多端信息,实现对人口数据的精准采集,使社区民警不只是数据采集者,更是利用数据解决矛盾的实施预警的数据应用者[24]。智慧社区中的大数据、云计算、人工智能等新型技术,改变了对复杂社会治理的方式,是国家植入社会的新方法[23]。

基层治安治理智慧化的蓬勃发展原因在于警务适应信息化建设的要求和智慧警务技术成熟。社区平安治理是社区建设和管理的重要基础[22]。群众的需求、人民的安全感是推动智慧社区警务发展的源动力。发展基于大数据、物联网技术的警务是提升综合安全治理效能的手段。智慧警务以智能防范研判机制、数据信息共享机制、精准打击防控机制、科学考评管理机制,推动基层治安治理智慧化。另一方面技术成熟、投资要求低也推动着社区警务功能智慧化。社区改造资金来源于住建部门信息化改造资金、物业维修金;建设智慧平安小区,除以上两种资金来源外,还来自公安部门划拨[25]。监控、对讲、门禁等设备预算低、技术成熟,在多部门资金支撑的情况下,建设智慧平安小区是众多社区智慧化转型的实践方向。

2.4 养老医疗,增进智慧社区内民生福祉

养老医疗是除警务外,智慧社区实现的另一个发展的方向。“养老医疗”主题表现中国面对严峻的老龄化形式,发展医养结合的居家养老模式以应对日益增长的养老需求;另一方面该主题也体现了养老和医疗智慧化进程迅速,为老年和其他群体提供优质服务。智慧社区医养功能,即通过大数据和物联网技术,将身体指标数据上传到养老服务平台,及时收集和更新群体需求,实现随时监测相关指标数据,对个体情况做出判断和帮助,如有异常,可做到自动报警、及时治疗。

中国居家养老医疗需求大,社区养老医疗智慧化是重点发展领域,是提升公共服务供给和基层治理的重要内容。根据国家卫健委发布的数据,中国老年人大多数都在居家和社区养老,90%的老年人选择居家养老,7%左右的老年人依托社区支持养老,3%的老年人入住机构养老[26]。现实实践中,智慧社区养老中发挥信息平台优势,以大量积累的数据分析预测老年群体的身体状况,提升养老服务的品质;面对老年群体的实际需求,进行全方位多维度的适老化改造,全面提升老年友好型智慧社区治理能力。总之,智慧社区赋能居家护理,提升养老医疗服务质量。

市场、社会、政府多维度驱动养老服务的平台化和数字化。科技手段为供需对接困难、发展不平衡、服务质量不高等养老市场问题提供了解决方案。中国智慧社区养老医疗的实践中,市场化运作方式不断探索净资产商业模式,通过提供一站式解决方案,提升服务水平的方式以维持运营,从中收取费用,实现服务水平提升和企业盈利的双赢局面。其次,技术赋能的基础上,让社会力量成为养老服务的主体是中国智慧社区养老医疗发展另一特点。依托专业养老服务机构和医疗机构,进入街道、社区、家庭多层次服务领域,使得老年群体居家获得专业照料和护理。最后,政府主导,推动中国社区养老医疗智慧化转型。政府主导,使民政、卫健部门等职能部门与养老机构数据端口相互对接,打通部门间的壁垒,推动信息共享,有效整合社区各系统信息,集成化模式,提升公共服务供给水平。

2.5 疫情防控,政府引导多元主体转型

疫情防控主题凸显了疫情防控背景下,政府、企业合作,以互联网技术为基础,社区服务信息化建设为主要内容,助力社区疫情防控。突发公共卫生危机刺激了社区智慧化转型,要求基层治理的智慧化以应对外部环境变化。

基层社区信息化建设前期经验与疫情外部危机共同推动社区治理发生颠覆性革新,朝向智慧社区的方向转变。中国智慧社区建设实践可追溯到2013年,智慧社区建设情况是智慧城市的重要建设指标,各地在广泛的城市信息化、智能化的潮流中,探索基层社区的智慧化发展。不过,部分地区虽有智慧社区实践,但大部分地区仍以传统科层治理方式为主,将信息化视为技术工具的使用。疫情爆发后,健康码、人口流动状态、健康监测等治理要求驱使着基层社区治理智慧化转型,技术平台工具提供了治理新的解决方案。同时,为满足隔离状态物资供给,发展出线上团购等多种商业模式,平台功能和作用在疫情期间大显身手。公共卫生危机中,政府承担着风险沟通者、应急主导者、资源协调者、创新促进者4种类型的角色[27]。智慧社区信息平台在信息传播、资源供需对接、人口流动等方面掌握数据与分析的优势,积极数字化转型是政府在疫情防控中承担责任的方式。

政府主导、企业支撑、社会参与是智慧社区的重要特征。智慧社区实现模式中,从主体责任划分,可分为政府主导型、市场化与政企合作型模式[28]。从建设类型进行划分,可分为两种类型:一种是开发商和物业公司为主的重资产模式,囊括了自有小区的基础设施、物业服务、智慧化应用等全流程业务,投资要求较大;另外一种是后期改造,统一数据接口和格式,打通社区管理各个部门的数据,进而提供智慧社区服务。无论是哪种类型,政府与企业都是智慧社区的重要主体。其中,政府发挥着重要主导作用。疫情爆发以来,各部门纷纷发文支持、引导地方开展智慧社区、社区信息化建设工作,有力推动了社区智慧化转型。2020年3月,民政部发布《新冠肺炎疫情社区防控工作信息化建设和应用指引》,“依托各类现有信息平台特别是社区信息平台,开发适用社区防控工作全流程和各环节的功能应用”。另外,高新技术企业、专家等力量支持着社区的创新智慧化转型。北京5G智慧社区的实践离不开多元主体的合作。政府与各类创新主体深化合作,邀请专家学者担任科学顾问,构建“创新合伙人关系”,并与众多高新技术企业进行渠道、空间等资源对接,为智慧社区转型提供智力支持[29]。

3 结论与讨论

大数据、物联网、人工智能等新兴技术改变了基层社区治理的形式和内容,催生了智慧社区这一社区治理的新形态。本文采用LDA主题模型法对智慧社区建设新闻报道展开分析,从宏观视角整体性把握智慧社区的建设现状,弥补了智慧社区案例研究的数量局限性。研究结果表明,当前中国智慧社区建设实践主要集中在“一核多元”“企业供给”“警务安全”“养老医疗”“疫情防控”。“一核多元”主题反映出“党建+网格”化是智慧社区建设的重要组织支撑,发挥着强大的统筹和社会动员功能;“企业供给”主题则表明企业不仅是重要的技术支撑、功能开发主体,在技术治理背景下还承担了一定的社会责任;警务安全、养老医疗是目前中国智慧社区重点发挥的功能,体现出基层公共服务适应信息化、平台化建设的趋势;新冠肺炎疫情加速了基层社区智慧化转型,政府主导、多元主体合作是智慧社区建设成功的重要特征。

研究结果凸显了“党建+网格”化在智慧社区建设的重要作用,印证了中国基层智慧化转型中具有独特的制度基础,该治理模式凭借合理的组织机构和成熟的技术运用经验支撑了智慧社区的建设。政府、企业在社区智慧化转型中分别扮演着不同的角色,其中政府占据主导地位,是技术运用到社区治理过程中的重要构建者、协调者[30]。另外,从主题内容上可看出,中国智慧社区建设以人民为中心,重视人民群众的安全和养老医疗;但与此同时,作为服务对象的居民在智慧社区建设过程中参与度不高,没有发挥应有的重要建设性作用。展望未来,在创新政府企业合作模式的基础上,更应该强调居民的主体建设者身份,培育多元主体参与,打造共建、共治、共享的智慧社区格局。

本文的研究贡献在于以LDA主题模型法对智慧社区新闻报道进行分析,全面展现了中国智慧社区实践现状,识别出中国智慧社区实践中的重要主体及其主要功能,丰富了智慧社区的相关研究。但本研究仍然存在以下几点局限性:①本文只对2015—2021年以“智慧社区”为题名的新闻报道进行了整体分析,没有进行分时段进行对比性主题分析。智慧社区集中在2020、2021年,同时囿于技术条件,智慧社区建设虽有背景条件的变化,但整体发展方向、路径较为一致。未来研究可在智慧社区发展成熟期展开分时段主题比较分析。②治理智慧化是全球发展议题,后续研究可基于此进行中外对比分析,探索不同制度背景下推动基层智慧化转型的特征和因素。

猜你喜欢
警务网格养老
养老生活
追逐
环球警务专访
重叠网格装配中的一种改进ADT搜索方法
养老更无忧了
以房养老为何会“水土不服”?
浅谈港航公安网上警务公开的现状和问题
基于曲面展开的自由曲面网格划分
警务训练中腹痛的成因及预防
养老之要在于“安”