徐 萌 张思文 肖 文
(辽宁中医药大学经济管理学院,辽宁 沈阳 110847)
随着互联网技术的发展和信息化的普及,越来越多的用户倾向于通过网络平台分享观点和交流经验,学者研究发现对在线数据的挖掘能够为企业和用户提供直接的参考。在医疗健康领域,《国务院关于积极推进“互联网+”行动的指导意见》和《关于促进“互联网+医疗健康”发展意见》等政策颁布的推动下,“互联网+医疗”的就诊模式被广泛应用,在线健康社区就是其中一种。作为医生和患者高效沟通的媒介,在线健康社区为患者提供就诊服务和健康咨询的同时,也支持患者进行信息和诊疗经验的共享,由此,产生了大量的在线医评信息。在线医评对提高在线健康社区医疗服务质量、患者就诊体验和疾病治疗效率具有重要作用,所以,如何从海量的在线医评中挖掘高质量信息成为当前学者研究的热点。
鉴于此,本文选取“好大夫”在线健康社区中的患者在线评论作为数据来源,运用主题图谱和情感分析的方法,依据词频-云图和主题图谱从在线医评中挖掘患者关注主题,借助情感量化结果探讨患者就诊过程的满意度,从而为在线健康社区平台的建设、医生和医疗服务质量的提高等提供一定的实践指导作用。
目前,国内现有的在线健康社区研究尚处于探索阶段,主要集中在患者择医行为、使用意愿和满意度的影响因素上。易梦馨等基于文本图片多源信息,构建回归分析模型,探讨影响患者在线择医行为的因素有声誉可信度、能力可信度和面孔可信度;郭宇等利用元分析方法指出感知有用性、情感信任、感知风险等33个因素影响用户在线医疗社区使用意愿;王若佳等基于扎根理论提出在线问诊用户满意度受环境、平台、医生和用户因素的影响;徐孝婷等借助线性回归模型得出医生的口碑包括疗效、态度、感谢信、评论数和情感倾向等指标,会正向影响患者的选择。可见,虽然已有少数研究基于患者在线评论进行探讨,但主要借助理论模型和问卷调查展开,具有一定的主观性,很少有研究借助主题聚类-图谱可视化和情感分析进行主题挖掘。
主题图谱源于知识图谱用于聚焦主题及其之间的逻辑关系,并构成相应的语义网络图。国内学者主要针对网络舆情、文献统计、在线评论等文本信息构建主题图谱。陈健瑶等基于主题图谱从用户、账户、内容三个维度展示网络舆情特征的演化规律;李新根等借助文献计量法和主题共现的可视化,分析国内数字化治理研究的主题与演进趋势;祝琳琳等基于在线评论构建主题图谱,展示主题之间的层次和共现关系以及主题的情感强度。可见,主题图谱应用于各研究领域,但基于患者在线评论构建主题图谱挖掘主题的研究较少,将主题图谱与情感分析融合的研究更是有限。因此,本文应用主题图谱工具,对在线健康社区的患者在线评论进行分析,以了解患者对在线问诊过程关注的内容和情感倾向。
本文尝试针对在线健康社区平台的患者评论数据,利用词频分析、共现网络和情感分析方法,对患者在线就诊关注主题和情感倾向进行分析,研究框架如图1所示。
图1 患者在线评论主题挖掘及情感倾向分析框架
Step1:数据采集与预处理。选取适用的网站及疾病类型作为数据来源进行爬取,对在线评论进行过滤、分词和去停词的预处理,获取词汇数据库。
Step2:在线评论主题挖掘。提取在线评论高频词,通过高频词间内在联系挖掘主题,依据评论集中是否包含相同高频词来构建共现关系,形成节点为相同关键词,边为在线评论的共现网络。
Step3:在线评论情感倾向分析。计算每条评论的情感得分,按照分数将评论分为好、中、差三个档,并对好评和差评细分为轻度、中度和高度三个区间。
好大夫在线健康社区是中国领先的互联网医疗平台,该平台以查询医院/医生信息、多形式问诊和疾病知识科普等内容为主要功能,用户可以根据就诊体验在平台上分享经验,评价医院或医生。由于好大夫在线具有15年的成熟运营经验,在多个领域取得显著成果,拥有数量众多的优质医生群体,故选其为本文的数据来源。
根据近几年《中国卫生和计划生育统计年鉴》中的发病率数据,选取5种高风险疾病和5种低风险疾病进行数据筛选,即高风险疾病:糖尿病、冠心病、肺癌、乳腺癌、脑梗塞;低风险疾病:高血压、胃炎、类风湿性关节炎、抑郁症、月经失调。利用八爪鱼采集器抓取2022年5月前好大夫在线平台上这10种疾病的前10名医生的患者就诊反馈数据,共获取28975条评论,去除无效及重复数据,得到27995条有效评论。
为了更好地分析在线健康社区用户就诊的满意度,进一步规范初始语料库,使用R语言对采集到的反馈数据进行以下预处理:(1)过滤在线评论中包含的大量标点符号、表情、英语单词等低代表性信息;(2)对在线评论文本进行分词处理;(3)去除文本中出现频率高但无实际意义的词,如介词、代词、停用词等。
2.3.1 词频统计
为直观地反映在线问诊用户所关注的焦点和主题,利用R语言进行词频统计并绘制前500个词语的词云图实现特征的可视化,如图2所示。图中字体越大,说明出现的频次越高,结合表1中排名前30的高频词,可以发现除了“医生”“主任”“大夫”等专有名词外,主要包括“耐心”“医术”“态度”“治疗”“病情”“精湛”“医德”等高频词。初步提炼在线健康社区患者评论的关注点,主要集中于服务态度、医术水平、就医体验、医德医风等方面,可以作为后续患者满意度因素归纳及判定的研究基础。
图2 高频词词云
表1 TOP30高频词
2.3.2 患者在线评论主题图谱
为更精准地提炼患者在线评论主题,在词频分析的基础上,使用VOS Viewer软件对评论文本构建特征词主题图谱,设置频次阈值为150,聚类分辨率和最小聚类项数为1,结果如图3所示。图谱中不同颜色的节点集合代表不同的聚类簇;节点代表特征词,节点越大代表在评论中共同出现的次数越多。
图3 患者在线评论主题图谱
由图可见,图谱中主要形成5种颜色的聚类簇,其中,红色节点可以概括为就医体验主题,主要包括与问诊相关的“网上”“门诊”“就诊”“预约”,与治疗相关的“治疗”“手术”“检查”“用药”,以及与疗效相关的“恢复”“效果”“好转”“改善”等特征词。黄色节点可以归纳为解释清晰度主题,包括“耐心”“病情”“详细”“解答”等特征词。绿色节点包括“病人”“看病”“照顾”“情绪”“安慰”等与医生人文关怀主题相关的词汇。蓝色节点以“医生”为中心,分散为两部分,分别是以服务态度为主题的“态度”“服务”“热情”“负责”“和蔼可亲”等词汇,和以医术水平为主题的“医术”“精湛”“高超”“技术”等词汇。最后,节点最少、分散最广的紫色聚类簇主要包括“感谢”“感激”等与患者满意度相关的词汇。
综合主题图谱的颜色分类和特征关联分析可见,患者对在线健康社区的关注反映了患者满意度对应的影响因素,除了与情感倾向相关的聚类主题,大致可以归纳为5个方面。进一步结合聚类簇中节点间的关联度、节点的数量和大小,可以发现,按照患者满意度因素的重视程度,这5个主题依次是就医体验、医术水平、服务态度、解释清晰度和人文关怀。
2.3.3 患者在线评论情感倾向分析
运用ROST CM6软件中的“情感分析”功能计算27995条患者在线评论的情感得分,根据量化结果将情感倾向设置为好评、中评和差评3个程度,并统计出各情感倾向所占的比例,如表2所示。
表2 各情感倾向所占比例
从表2可见,患者对在线健康社区的总体满意度良好。78.54%的评论对就诊过程给出了好评,好评率较高,有7.08%的评论持中立态度,另有14.38%的评论表示了不满,给出了差评。分析评论情感得分,发现分数由-100~+243不等,故考虑对情感倾向进一步细化,将好评和差评的情感得分划分为3个区间:绝对值0-10分的为轻度情感倾向,绝对值11-20分的为中度情感倾向,绝对值20分以上的为高度情感倾向,统计结果如表3所示。
表3 细分情感倾向所占比例(好评和差评数据)
由表3可见,对于占比较高的好评数据,其细分情感倾向比较均衡,比例在33.33%上下浮动,充分说明患者对在线健康社区的就诊过程满意度很高,但大多的好评倾向不是太强烈,所以对于在线健康社区来说,仍有很大的进步空间。在差评数据中,轻度情感倾向占比最高,达79.31%,中度和高度情感倾向的评论所占比例较小,分别为17.88%和2.81%,可以反映出虽然有一定数量的差评,但是总体程度为轻度,这就要求在线健康社区需要及时关注患者就诊反馈,实时做出响应,提高服务态度、医生技术水平、人文关怀和就诊体验满意度等。总之,患者对在线健康社区的就诊体验是满意度较高的,但依据具体的数值分析,保持时刻关注是有必要的。
本文运用主题图谱和情感分析方法,采集在线健康社区内10种疾病的患者评论文本,挖掘患者在线医评的主题和情感倾向,得到以下研究结论:
(1)基于高频词统计和词云分析,初步判断患者在线医评的关注热点集中于服务态度、医术水平、就医体验、医德医风等方面,患者对在线健康社区的就诊过程较为满意。
(2)依据共现网络和主题图谱方法,深入挖掘患者在线评论主题。研究表明,在线健康社区患者评论主题按照关注程度依次是就医体验、医术水平、服务态度、解释清晰度和人文关怀五个方面,其中就医体验包括从问诊到治疗和疗效的关注。可见患者关注更多的是医生的专业素养,即就医体验和医术水平,其次是用户感知因素,即服务态度、解释清晰度和人文关怀。
(3)通过情感计算发现评论中情感倾向为好评的占78.54%,中评占7.08%,差评占14.38%,充分表明患者对在线健康社区的总体满意度较高。进一步细分好评和差评数据为轻、中、高三个程度,得出好评数据中各比例浮动于33.33%上下,还未形成较高的满意度;在差评数据中,轻度占比79.31%,中度和高度占比分别为17.88%和2.81%,可见多数患者的不满情绪程度为轻度。
本文具有一定的理论和实践意义。在理论层面上,基于主题图谱和情感分析的方法,对患者在线评论进行文本挖掘,较之以往的理论模型和问卷式研究方法,提供了新的研究视角,并且对于该类数据的主题挖掘具有非常好的适用性,可以更直观、有效地揭示在线健康社区内患者关注内容。在实践层面上,通过在线评论可以快速挖掘患者关注内容和情感倾向,有助于平台、医院及医生针对性地改善和提高医疗服务,以促进在线健康社区的发展。
基于上述患者在线医评数据的主题挖掘和情感计算,为促进互联网医疗的可持续发展,本文对医生和在线健康社区平台提出以下建议:
(1)对于医生来讲,精进医术,提高医德。首先,医生的医术是满足患者就医需求、治疗疾病和提供健康服务的基础,医生应该将提高专业素养以消除患者病症作为核心任务,即使在隔空就医形式下,也可以准确判断患者病症,提出可靠的治疗方案。其次,医生的医德、服务态度和对患者的人文关怀,可以帮助患者舒缓情绪并有效提升患者的信任度。医生在接诊时应保持同理心和耐心与患者进行沟通,提高疾病解释的清晰度,为患者有效地答疑解惑;面对患者就诊后的在线点评,及时关注评论内容并与其互动,针对性地做出医疗服务调整。
(2)对于在线健康社区来讲,鼓励患者进行在线点评的共享行为,并整理评论信息,为平台、医生和潜在患者提供参考。以好大夫在线平台为例,患者对医生的评价以满意为主,难以帮助用户进行差异化选择,故平台可以根据患者评论中的关注点优化评价体系。评论数据中包含患者的健康需求和就医体验,平台对其进行整合和挖掘,反馈给医生以完善和提供更精准的医疗服务,并将高价值的共享信息提供给潜在用户,吸引更多的用户参与到互动中,促进在线健康社区的发展。
此外,本文也存在一定的局限性:一是本文数据样本仅来源于“好大夫”网站,未能融合在线健康社区内的多个平台数据进行实证分析。二是鉴于情感分析的满意度较高,并未对各主题的情感倾向进行分析。因此,在未来研究中,可以选择多个在线医疗社区平台、多种数据进行主题挖掘、情感分析以及对比分析,并从情感分析的角度对各个主题内的数据进行情感分析和满意度研究。