徐孝婷 杨梦晴 宋小康
关键词:在线健康社区;医生口碑;患者选择;线性回归;好大夫在线
“互联网+医疗”国家战略推动移动医疗行业的飞速发展,在线健康社区成为时代发展的产物,不仅有效缓解了“看病难”现状,且对由信息不对称而引发的一系列“医患纠纷”的社会问题也发挥了积极作用,患者可以在线预约、电话咨询、查看医生信息、了解医院动态等。目前以医患互动为代表的在线健康社区主要有好大夫在线、春雨医生等,虚拟的网络环境给服务过程带来了不确定性感知,患者对于健康信息服务的选择没有足够把握,存在潜在风险和未知,但平台中会公布医生的学历、职称、所在医院、价格、态度、疗效、患者投票、发表文章等等多方面信息,这在一定程度上缓解这一现状并给患者选择时提供了一定参考。同时伴随Web2.0时代的发展,用户不再仅是信息的消费者更是信息的生成者,尤其是各类评价系统带给用户广泛的参与感,如豆瓣评分、淘宝评价、星级打分、排行榜等,用户可以以点赞、评论、打分、赠送虚拟礼物等多种形式表达个人体验,由此形成了大量的用户生成内容(UGC),而这些内容对于不同行业来说也是口碑的一种体现,分值高、评价好的内容可提高影响力、知名度进而增加销量,反之会产生不好的声誉等负面的影响。对应于在线健康社区中,一些医生的数据如感谢信、礼物、评论等正是患者生成内容的一种表现给其他患者决策提供支持。
以往對口碑的研究多集中在对消费者购买的影响研究.Hennig-Thurau T等认为网络口碑是用户根据亲身经历将产品或商家的正面或负面的评论通过网络发布出来,给其他用户提供有价值的参考依据,口碑对消费者购买行为、认知[、持续使用、满意度以及产品销量具有显著影响。李维安在研究淘宝的交易数据时.将卖方好评率和差评率同时作为在线口碑来研究:Liu Y对某部电影的网络评论进行研究,评论数量与电影的票房有显著关系,而正、负面口碑与票房关系并不显著。在网购平台中可知,只有当消费者对购买的商品很满意或很不满意才会愿意付出时间进行评价,评论数量多反映出消费者对此商品的关注,同时也体现了一定的高销量。而在健康领域中,医生的口碑被学者们用来探索对患者选择的影响,Rothenfluh F等认为基于评论的网站,用户选择酒店和选择医生行为具有很大差异:Gao G G等通过研究5年内患者对医生的在线评分探索医生服务质量,发现评分高低对患者选择明显相关;孙磊研究移动医疗中的用户服务选择,以春雨医生为例,发现在线医生口碑(用户评价、粉丝数和心意)对用户服务的选择具有显著影响;郭东飞以信任为中介变量.通过问卷调查的方法得出在线医疗中网络口碑的数量、质量、时效性对购买意愿具有正向影响:DiMatteo M R等发现医生和患者之间具有交流且医生表现出关心会对患者选择过程具有重要影响:Melissa Ti-Ting Hsu发现当与医生口碑有关的信息数量少时,患者会扩大选择医生的范围、延长选择时间等,反之当存在较多口碑信息时,患者因无法判别会减少选择范围和选择时间;医生口碑作为医患互动的产物,不仅需要医生注意自己的一言一行、医德道德等来规范、约束和激励医生的行为,同时为患者选择医生提供了“信号”。以往对医生口碑的研究多集中在概念、问卷调查的主观维度,对医生口碑的测量缺乏实际数据和时间维度的衡量,没有形成较成熟的理论模型。基于此,提出本研究中涉及的研究问题:1)哪些指标可以衡量医生口碑?这些指标与患者选择之间有什么关系?2)不同疾病风险对医生口碑和患者选择之间的关系有没有调节作用?本研究以好大夫在线中的医生数据为基础,探索性分析不同医生口碑的指标对患者择医的影响,并分析不同疾病风险的调节作用。在当前时代背景下,了解用户的行为对于指导在线健康社区的发展至关重要,同时明确患者的需求也是医生更好提供健康服务的基础。
1理论基础
1.1医生口碑与患者选择
国内外学者对医生评价的数据定义不同,有学者统称为口碑(Word of Mouth)、有的称之为声誉(Reputation),而两者之间往往也存在很多指标上的重叠,本文不作区分将其统称为口碑,并认为医生口碑为一切可以反映医生技术能力、行为表现的信息。对于医生口碑的表示,有学者认为是患者最关心的疗效和态度,如Gronroos C认为医生口碑主要反映了服务质量,服务质量包含技术质量和功能质量,Lu N J等将技术质量和功能质量用好大夫在线平台中医生疗效和态度表示,通过回归分析发现好大夫在线中医生的态度和疗效正向影响患者的预定和选择服务。实际就诊中,患者选择医生可能更多关注疗效,疗效好反映出医生医术高,患者具有较高的期望,但医生提供健康服务过程中的行为举止也会影响患者的情绪和对医生技术的感知,医生态度好、表达关心给患者亲和感,患者更能清楚表达个人健康需求。还有的学者选取具体的指标进行衡量,如国内学者曾宇颖以好大夫在线的患者为研究对象,仅利用医生收到的感谢信这一指标反映医生口碑.虽然在论证结果中发现感谢信数量显著且正向影响患者择医,但显然这样选择不够全面:马骋宇认为患者为了表达对医生的感谢,会通过赠送虚拟产品、感谢信的方式表达,这是医患互动的方式之一:Deng z H等抓取好大夫在线中的面板数据,用访问数、患者投票、礼物、感谢信表示医生声誉,得出访问数和患者投票显著影响患者选择,礼物不显著且感谢信只在固定效应模型中显著。还有学者认为患者的评价能够反映医生的一些表现.已有研究表明评论会对消费者购买意愿具有显著影响,消费者在决策前经常需要依赖商品的在线评论,在线评论是反映口碑的形式之一。Widmer R J通过研究医生有无负面评论分析对患者满意度的影响,结果发现有负面评价的医生和没有负面评价的医生之间的满意度并无差异;Ryan T等以大学耳鼻喉科为例,选取16名主治医生的满意度数据,研究发现在线评价时间和评分无关、评分与患者满意度无关;Diana G等以好/差排名研究对用户酒店预订行为的影响,结果发现当排名为好时.评论数量决定用户的信任进而选择酒店,反之排名很差则评论数量对信任不产生影响。可见,由上述已有研究发现医生态度、疗效、患者的打分、评价数量以及评价好坏都会对患者的选择以及满意度具有一定的相关关系。
1.2疾病风险的调节作用
已有对消费者的研究发现,消费者购买决策行为会因商品类型和消费者特征的调节作用而产生不同的影响。在医疗环境中,对于患有不同疾病的患者,其对健康信息质量的认知需求和涉人度不同;相较于疾病风险低的患者,高风险疾病的患者对医生展示的事实型信息具有更大的认知需求.认知需求会影响用户对信息加工处理的程度,认知需求高的患者可能会有更大的动机去付出更多的认知努力,处理与医生自身相关的事实型信息,即具有高涉人度,疾病风险高的患者会有更高的涉入度。也有研究已经表明医生会根据患者所患疾病的差异进行不同的健康服务来满足不同的健康需求,病人所患疾病如果较轻时,患者会较多在意与医生的交流,此时医生的关心对患者满意度影响较大,故高风险疾病的患者会更关注疗效而忽略态度,而低风险疾病的患者则相对疗效会更在意态度。正是患者的差异性决定了其不同的健康行为,尤其是当患者就诊病情不同时,可能会产生不同健康需求,对应于其选择行为也会发具有差异性。
1.3小结
在好大夫在线平台中.患者就诊后可对医生的态度和疗效进行打分,每位医生的主页都会展示其态度满意度和疗效满意度的百分比:同时患者在结束诊疗后可对医生的服务进行反馈.好的体验患者可撰写感谢信表示对医生的感谢、赠送礼物表达对医生的信任和认可:而其他不同体验还可以通过写评论的方式表达诊疗服务过程中的真实体验和详细治疗情况,同样会展示在医生的主页上,每个医生的主页中会展示获得的评论数量以及具体的评论内容,有的医生获得评论数量较多而有的则较少,其中的评论有表达是医生支持认可的,也有对医生不好的评价,结合已有文献以及具体平台中的数据,本研究认为态度、疗效、感谢信、礼物以及评论数量及评价隋感倾向值6个指标可以用来初步反映医生口碑,将作为本文的自变量开展研究。同时好大夫在线中涉及的疾病数据繁多,笔者认为当患者疾病风险较高时,会更重视谨慎、不接受不利因素的存在,一旦发现分值低、评论差会影响患者的信任和选择,如果患者症状很轻微,此时的选择就变得随意快速,因此本研究选取疾病风险作为调节变量来探索其对医生口碑与患者选择之间关系的影响。最后对于患者选择的测量本研究参照多数学者采用的医生总咨询量来表示。
2数据采集
本研究的样本选择来自好大夫在线,该平台创立于2006年,目前包含全国近万家医院和注冊医生已高达59万,具备雄厚的医疗资源和服务,其主要服务有:在线诊疗、电子处方、送药上门、远程会诊、专家手术、预约转诊、家庭医生等,是较为成熟的医患互动平台之一具有典型性。疾病类型选择消化内科,涉及食管、胃、小肠、大肠、肝、胆及胰腺等多种类型疾病,需要医生医学知识面广,操作复杂而精细,所以注册的医生是获得内科专科医师资格,医生资历较高且数据完整。数据的获取利用自编程序借助Python爬取好大夫在线上的真实医生数据,抓取时按照疾病分类抓取消化内科常见疾病(包含胃癌、肝硬化、便秘、消化不良)活跃度高的医生,活跃度根据主页中显示最近一次登录时间在1个月以内的医生同时这些医生的数据信息也较为完善。爬取时间为2019年1月6号和2019年3月6号,时间间隔为2个月,两次分别抓取数据10970条和9963条(其中部分医生数据在第二阶段缺失),最终经过清理后共获取有效数据8649条数据.本研究涉及的具体变量以及变量解释见表1。
需要说明的是:1)因医生开通线上服务的时间有差别,有的文章直接用总咨询量进行分析本研究认为是不合理的,相对来说开通时间较早的医生其累计的患者咨询量也就较多,不能反映单位时间内患者选择的情况,本研究选择两个时间段各变量的变化量作为进行分析.反映的一段时间内医生各项口碑数据变化会对咨询量变化的影响情况,分析相对较为合理。2)态度和疗效的数值并没有像其他研究直接用平台中提供的数据,本研究选择活跃度较高的医生.在通过抓取数据分析发现好大夫在线中这些医生的态度和疗效的分值都较高,基本都在95%左右且个体差异较小,分析不具有意义。笔者发现好大夫在线“全部分享”中的评价系统有对医生态度和疗效打分,打分包含很满意、满意、一般、不满意、很不满意5个等级,本研究将其赋值为{很满意、满意、一般、不满意、很不满意}={5、4、3、2、1},这样同样可以反映出每个医生态度和疗效的分值且样本差异性较高,符合数据分析要求。3)评论情感倾向的取值,根据患者的评价,赋值为{好评、有好有差、差评}={1、0、-1},通过计算获得每个医生的评论情感倾向值,能够较好地表示该医生的评论倾向,值越大表示医生获得患者的好评越多。4)按照《医院分级管理标准》将医院等级划分为一级、二级、三级,一级指直接为社区提供医疗卫生服务的基层医院为主;二级指跨多个社区的地区性医院为主、三级以跨地区、省市向全国范围提供服务的技术中心医院为主。
3数据分析
3.1变量描述
通过对两个时间段抓取的数据进行描述统计,首先是对8649位医生基本情况的介绍,可见好大夫在线中,医生学历分布中,博士比例达75.49%、硕士达21.22%;职称分布中主任医师占73.70%、副主任医师占23.32%;所在医院等级的分布中三级医院有83.43%、二级医院16.12%,具体见表2;可以发现高学历、高职称、高医院等级占据比例近95%,这说明好大夫在线具有雄厚的医疗资源和实力,提供在线健康服务的医生水平都较高,这为患者提供服务鉴定了良好的基础。
对于自变量和因变量的描述.可以发现两个时间段各个变量的极小值、极大值、均值以及标准差变化不大,同时好大夫在线中态度、疗效、感谢信、礼物、评论都是累积数据,所以一般第二阶段的极大值和均值都较第一阶段要大,具体见表3。变量描述结果说明8649位医生在两个时间段的口碑数据和咨询量并没有发生较大改变,但不同医生的态度、疗效、感谢信、礼物、评论数据偏度较大,数据没有呈现正态分布。为了既不改变数据性质又增加数据的稳定性.在后期的研究中将需要对所有变量数据进行log对数转换进行分析。同时由数据散点图可以发现呈现一定的线性走势且各数据没有表现出明显的非线性特征,下一步本研究将建立线性回归模型研究医生口碑的影响。
3.2模型构建
首先本研究中涉及的3个控制变量是学历、职称、医院等级,分别属于4分类、3分类和3分类变量,为了探索其控制作用需要引入3个虚拟变量,其中Eieducation表示学历是博士、硕士、学士或其他;Fititle表示职称是主治医生、副主任医师或主任医师;Girank表示医院等级是一级、二级或三级,虚拟变量构建如下:
进一步将所有虚拟变量和自变量引入函数模型,建立多元线性回归函数,建模函数(a)如下:
3.3模型拟合
本研究自变量以及因变量利用两个时间段的变化量进行运算,采用多元线性回归方法分析疗效、态度、感谢信、礼物、评论数以及评论情感倾向值等与患者选择之间的关系,根据上节建立的多元线性回归模型,利用最小二乘法(OLS)对进行数据拟合,结果如表4。该部分构建了两个模型,模型1是只有控制变量,模型2是在模型l的基础上再引入自变量。对于模型1:R2=0.281、F8649=18.334;对于模型2:R2=0.693说明解释变量对被解释变量的解释程度为69.3%.解释程度较高则拟合优度较好;F8649=65.132可知模型整体显著,同时VIF均小于10表明各变量之间不存在多重共线性,可见大多医生口碑数据是显著性的,但也存在部分不显著的情况,具体分析如下。
由表4模型2可见,对于虚拟变量的t检验,只有医生职称为主任医师时显著,其他虚拟变量都不显著,即医生学历和所在医院等级对患者的选择并没有直接影响,患者较多关注的只有医生职称,且职称为主治医师时患者会更关注其口碑:对于自变量:疗效对应的系数β1=1.933>0(在p<0.1下显著),表示疗效与咨询量之间是正相关,可以说明好大夫在线中医生疗效值较高时.会给将要选择医生的患者更高的信任感和认可度,从而增加医生的咨询量,即疗效好促进患者的选择;态度对应的系数β2=1.870>0(在p<0.1下显著),表示态度与咨询量之间是正相关,同样说明医生态度数值高,会给即将选择医生的患者一种亲切感和好的期望,从而促进咨询量的提高,即态度好促进患者的选择;礼物数量对应的标准化系数β3=1.231>0(在p<0.1下不显著),表示医生获得的礼物数量与咨询量之间是不相关的,医生礼物数量多并不会促进患者选择,这可能由于好大夫在线中礼物的赠送是需要付费的,有的患者在就诊后有意愿对医生表示感激,但由于需要支付一定金额的费用,部分患者会拒绝,因此医生收到的礼物数并不能完全代表患者对医生口碑的评价:感谢信数量对应的标准化系数β4=0.119>0(在p<0.05下显著),表示感谢信数量与咨询量之间是正相关.医生收到的感谢信数量越多同样表明对医生的认可,感谢信数量多可刺激其他患者的选择进而增加咨询量:评论数量对应的标准化系数β5=0.253>0(在p<0.05下显著),表示评论数量与咨询量之间是正相关,即医生收到的评论数量越多反映出该医生受到较多的关注,会刺激患者的选择进而咨询量增多:评论情感倾向值对应的标准化系数β6=1.095>0(在p<0.05下显著),表示评论情感倾向值与咨询量之间是正相关.即医生收到的评论情感倾向值越高表明该医生好评较多,好评多表示医生服务质量高可促进患者的选择;可见,选取的6个指标中,最终只有态度、疗效、感谢信、评论数和评论情感倾向值5个指标可以测量医生口碑且与患者选择正向相关,问题(1)得到了解答。
对于疾病风险调节作用的研究.由上述多元线性回归的结果可知,除礼物这一指标不显著外.其他5个自变量都显著且正向影响患者选择。因5个自变量与因变量的相关关系都是同一方向的,本研究用这5个自变量的和来表示医生口碑.记为WOM,.和越大对应医生口碑越好.符合上述研究结果。并进一步引入疾病风险和口碑的交互项,建立函数模型表示高疾病风险;D1disease=0,表示其他。在抓取的4类疾病的医生中,胃癌和肝硬化相对便秘和消化不良来说疾病风险更高,本研究将胃癌和肝硬化分为高风险组,便秘和消化不良分为低风险组)。进行线性阶层回归分析,结果只有在高风险时显著(a3=1.307,p<0.05),低风险时并不显著,调节效果如图1。表明如果患者就诊时是风险较高的疾病,医生口碑好会促进患者选择.这时患者会更谨慎更细心去多关注医生口碑有关的数据信息:但是如果患者就诊时是病情并不严重.这时可能有的患者对医生口碑很关注,有的则较少去了解,选择医生可能具有随意性,这说明高风险疾病对医生口碑与患者选择之间的关系具有正向调节作用,问题(2)得到了解答。
3.4模型检验
为了验证模型的稳定性.需要借助样本数据进行检验,本研究按照上述不同疾病风险分组,继续探索口碑与患者选择之间的关系.进行回归结果见表5,高风险组样本R2=0.725.F=89.348表示模型拟好优度较好,解释变量对被解释变量的解释程度为72.5%且模型整体显著:同样的低风险样本R2=0.793,F=92.007拟合优度较好且模型显著。对于t检验结果,已有结论职称Fltitle为主治医师以及疗效、态度、感谢信、评论数、评论情感倾向值的显著性并没有改变,表明模型较为稳定。
4研究结果
本文以好大夫在线为例.抓取两个时间段的医生数据,研究医生口碑对患者选择的影响以及不同疾病风险的调节作用,发现医生口碑可以用态度、疗效、感谢信、评论数以及评论情感倾向值来测量(礼物不显著),结果显著且与患者选择正向相关,问题1得到解决。而关于疾病风险的调节作用,低风险时不显著,但在高风险时显著且具有正向调节作用,问题2得到解决。最后对模型进行检验,稳定性得到了验证。具体结论有:1)疗效和医生态度的口碑来自于患者的打分.结果发现疗效和态度都显著且正向影响患者选择。这表明患者选择医生时不仅只是传统的注重疗效,同时态度也十分关注,结果对医生个人绩效具有重要借鉴作用,医生需要具有医术、专业知识做保障,这至关重要但也不应该忽略诊疗中的个人行为举止,积极的互动会给患者好的就诊感受,医术和医德缺一不可。2)感谢信和礼物数是患者对医生口碑正向传播的一种表现,需要花费时间、精力和金钱,结果感谢信显著且正向影响患者选择而礼物数并不显著。在线健康社区中,信息不对称现状严重,很多医患问题的存在是因为對医生的不了解.而感谢信和礼物数是医生口碑一个很好的表现,数量多表示就诊过的患者很认可和信任,这给即将就诊的患者提供了重要的“信号”。但本研究礼物数不显著的原因可能与需要付费有关,并不能体现患者真实的行为。3)评论数量和评论情感倾向值的口碑来自患者的评价,有好评、有差评,结果评论数量、评论情感倾向值都显著且正向影响患者选择。在线健康社区中医生评论数量多说明患者在就诊后愿意付出时间成本,是医生服务质量的一种体现;而情感倾向值高表明医生获得的好评多.是对医生的一种肯定和认可。4)对疾病风险调节作用的研究发现,只有高风险疾病显著,低风险并不显著。这说明患者患病风险不同,侧重的需求是存在差异的。高风险疾病的患者会重视了解医生的口碑进而选择,而低风险疾病的患者则显得较为随意。
本研究的结果对医生、在线健康社区平台也具有一定的启示作用。1)对于医生:医术是医生提供健康服务的必要基础,但个人行为举止、职业素养、医德等同等重要,好的沟通、关心的语言会达到更好的效果;通过感谢信、礼物的研究可以发现.医生想要建立好的在线口碑需要重视对个人网页的维护,完整的信息有利于建立线上信任的医患关系,消除患者就诊的不确定性;此外评论是真正反映患者感受的重要体现.是选择医生的重要参考.医生应关注评论内容和质量.及时和患者互动反馈,完善服务、提供更精准的健康服务;最后患者就诊需要承受生理和心理上的双重压力,不同疾病类型的患者健康需求不同,医生需要明确患者的差异提供针对性的服务。2)对于在线健康社区:好大夫在线中,有关疗效和医生态度的口碑数据差异性较小,多以高分值出现,对于患者的选择不具有参考意义,构建完善的评价体系是互联网医疗行业发展所必需的:同时平台应该重视对用户生成内容的方式.为了真正让患者表达需求和参与医生互动,建议去除付费项目(如礼物),采用开放式、免费的方式:此外好大夫在线的评价系统还处于初步阶段中,用户的评价多以正面褒义为主,负面差评较少,信息质量不高给人感觉并不真实可靠.无法真正消除信息不对称壁垒,真实完整的评价系统是用户需要的,重视对患者评论的挖掘,患者评论隐含一定的健康需求,明确患者的健康诉求并及时反馈给医生,为患者提供持续性健康管理、健康服务是在线健康社区发展之关键。
本研究丰富了在线健康社区中医生口碑对患者选择的影响研究内容,同时发现不同疾病风险的调节作用,为指导医生、在线健康社区的发展提供建议,具有一定的理论和实践意义。此外,本研究也存在不足之处:仅选择一个平台的医生进行研究,同时抓取的数据只是两个时间段并不够全面,模型的普适性还需更多样本的验证.未来应该对多种平台、多种疾病进行深入研究。同时模型中涉及的患者评论是健康信息学关注的重点之一,对于指导患者各类健康行为具有重要价值,本研究选取的好大夫在线平台其医评系统还不够完善,爬取的内容差异较小,并未深入探究,患者评论内容、评论信息质量、评价意愿等将是未来需要进一步探索的,还有待挖掘。患者选择作为用户行为表现之一在目前“大数据”、“互联网+医疗”等环境背景下需要高度重视,为个人健康管理、平台健康服务以及国民健康预测等辅助决策。