王焓骁 ,康艾嘉 ,赵玉宝 ,赵福容 ,蒋晓江 ,郝凤仪 ,*,唐向东
(1.重庆两江新区第一人民医院,重庆 401120;2.中国人民大学,北京 100872;3.多伦多大学,加拿大多伦多 M5S 2E8;4.杭州安肯医疗科技有限公司,浙江 杭州 311121;5.陆军特色医学中心,重庆 400042;6.四川大学华西医院睡眠医学中心,四川 成都 610041*通信作者:郝凤仪,E-mail:fengyihao@cqljrmyy.com)
自杀是个体蓄意或自愿采取各种手段结束自己生命的行为,自杀死亡占所有死亡人数的1.4%[1]。既往研究[2]阐述了潜在的自杀风险因素,包括心理健康状况、经济社会地位、文化和道德因素等,为自杀风险评估提供了理论模型,但传统统计分析方法处理复杂数据的能力有限,且研究同质性强,导致模型仅在较狭窄的限定范围内有意义[3]。且由于自杀意念的隐蔽性,既往自杀预测方法难以对高危人群做出准确的、主动的识别[4-5]。
机器学习是人工智能(Artificial Intelligence,AI)学科的重要分支,它使用计算机模拟人类学习过程,并通过不断适应新数据以优化算法,从而提高模型的预测准确性[6],是一类能从数据中自动分析并掌握规律,再利用规律对未知数据进行预测的方法。与传统分析方法相比,机器学习能为给定数据集确定最有效的模型,并且更适合处理复杂数据[7],但需要更大的数据集来构建预测模型。目前在自杀预测领域常用的算法有随机森林、支持向量机、神经网络、自然语言、深度学习等,均表现出良好潜力。近年来,自杀意念的表达不再局限于口头形式,通过电子手段(包括论坛、博客、轻博客、即时消息、电子邮件、私信等)表达痛苦和自杀意念的情况逐渐增多。青年人是网络平台的主要用户,也是自杀的高风险人群,网络平台的数据公开化为自杀预测的机器学习提供了数据来源。
1.1.1 资料来源
于2021年4月-5月对PubMed、中国知网、万方医学网的相关文献进行检索。检索时限为2016年1月1日-2020年12月31日。
1.1.2 检索策略
中文检索词:“机器学习”“人工智能”“决策树”“分类树”“支持向量机”“随机森林”“神经网络”“深度学习”“自然语言”和“自杀”;中文检索式:(机器学习+人工智能+决策树+分类树+支持向量机+随机森林+神经网络+深度学习+自然语言)*(自杀);英 文 检 索 词 :“Machine Learning”“Artificial Intelli⁃gence”“Decision Trees”“Classification Trees”“Support Vector Machines”“Random Forests”“Neural Network”“Deep Learning”“Natural Language”“Suicide”“Social media”“Social Network”“Facebook”“Twitter”“Reddit”“Instagram”“Snapchat”“YouTube”“Weibo”“Forums”;英文检索式:((Machine Learning OR Artificial Intelli⁃gence OR Decision Trees OR Classification Trees OR Support Vector Machines OR Random Forests OR Neural Networks OR Deep Learning OR Natural Language)AND(Suicide)AND(Social media OR Social Network OR Facebook OR Twitter OR Reddit OR Instagram OR Snapchat OR YouTube OR Weibo OR Forums))AND((Machine Learning OR Artificial Intelligence OR Decision Trees OR Classification Trees OR Support Vector Machines OR Random Forests OR Neural Net⁃works OR Deep Learning OR Natural Language)AND(Suicide)AND(Social media OR Social Network OR Facebook OR Twitter OR Reddit OR Instagram OR Snapchat OR YouTube OR Weibo OR Forums))。
由三位作者共同制定文献的纳入与排除标准。纳入标准:①采用各类机器学习方法,从网络社交平台采集数据并预测自杀的研究;②具有代表性的关于基于机器学习的网络社交平台用户自杀预测的重要综述和原创研究性文献。排除标准:①重复的文献;②非中英文文献;③无法获取全文的文献。
由两名研究者独立进行文献检索,在剔除重复文献后,由两名研究者阅读文献标题、摘要和全文,进行人工交叉复审;严格按照纳入和排除标准筛选文献。
初步检索共获取文献114篇,其中中文文献44篇,英文文献70篇。排除重复文献18篇,剩余96篇。再通过阅读文献标题、摘要及全文,排除60篇,最终纳入文献36篇。见图1。
图1 文献筛选流程图
2.2.1 微博与轻博客是目前机器学习预测自杀的主战场
微博与轻博客因用户可自由匿名发言且信息公开,容易实现数据采集,为机器学习提供了海量训练素材。在基于Twitter的研究中[8],自杀预测的准确率为68%~92%,使用神经网络可探索与自杀相关的心理因素,包括负担、压力、孤独、绝望、失眠、抑郁和焦虑,并预测自杀行为发生风险较高时间。
在中国,基于微博的“树洞行动”以已故用户的微博账号下的留言为数据库,筛查具有情绪低落甚至包含自杀意念的信息。杨芳等[9]研究显示,留言用户主要集中在16~26岁年龄段,跳楼、割腕、烧炭等是高风险人群表达的主要自杀方式。留言用户在各时间段中负性情绪的表达均多于正性情绪,留言文本内容可概括为情绪倾诉、人际关系和社会支持、睡眠、死亡等方面[10]。章宣等[11]提出混合架构的神经网络模型,进一步提升了自杀风险的预测精度。庄婷婷等[12]研究表明,微博用户自杀敏感信息的发布具有周期规律,约50%的信息发布于23∶00至次日05∶00。许立鹏等[13]提供了较为完备的中国互联网用户“自杀词典”,以提高自杀意念模型的分类准确率。Cheng等[14]研究显示,高自杀风险者代词、前置词、多功能词的使用频率高,而动词使用频率较低,总字数较多。然而,由于网络信息的真实性问题,发言文本中信息的准确性仍需人工进一步甄别。
2.2.2 熟人社交平台Facebook已启动自杀审查与监测系统
个体在熟人社交平台暴露自杀意念可能意味着更迫切的求助与发泄需求。2017年,Facebook开始自动化监测自杀相关内容,利用网站即时消息界面与用户交流情绪和认知,洞察用户行为模式,此外,平台还包括情绪追踪、每日签到和心理教育等功能。如果监测到用户存在自杀风险,则会启动危机应对方案,包括向用户提供心理支持资源和危机干预热线,或提醒当地应急人员。Facebook正在扩大自动监测范围,以监视和删除包含敏感视频的帖子,防止自杀直播[15]。
在Facebook的自杀审查监测系统中,使用随机森林加上Deep Text(由Facebook发布,能够准确识别聊天内容)和线性回归是最有效的,机器学习在自杀表达上得到了更加精确的训练,使工作人员能够更好地区分自杀意念的讽刺表达和严肃表达,从而使模型更加健全和准确[16]。
2.2.3 机器学习可识别讨论论坛中的自杀内容
自杀意念的表达有时兼具抒情、澄清、告别和遗嘱的功能,这些内容被用户发表在相应的“社区”以引起共鸣。国外学者在讨论论坛Reddit进行了调查[17-18],结果表明,使用自然语言处理,可识别用户的情绪困扰和自杀风险。Logistic回归和支持向量机分类器算法显示,在线帖子中的自杀内容监测准确率为80%~92%[19]。一些担心被污名化者,例如阿片类药物使用者也倾向于在论坛求助。过量使用阿片类药物是其常见的自杀手段,然而机器学习对该类人群的自杀风险识别具有较多假阳性结果[20]。在线心理健康论坛可以为心理痛苦者提供支持性网络环境,同时生成大量数据,可利用机器学习挖掘这些数据以预测其心理健康状态[21]。在CO⁃VID-19流行期间,机器学习也被用来识别自杀相关的论坛发言,并发现其数量增加了1倍多,且边缘型人格障碍患者和创伤后应激障碍患者存在较高的自杀倾向[22]。
2.2.4 图片与视频社交平台数据具有潜力,但需更精准的图像识别技术
Brown等[23]研究表明,Instagram上活跃程度和语言使用的差异与急性自杀无关。机器学习的其他机制(如识别图片内容)可能更有价值。Dagar等[24]分析了YouTube上有关青少年自杀预防和相关健康教育视频的用户留言,约7.5%的用户坦率表达了自杀意念或留言寻求帮助。机器学习可监视各类照片和视频共享网站,例如Instagram、Snapchat和YouTube,以减少涉及自伤和自杀图像的传播[25-26]。随着计算机视觉研究和深度学习技术的发展,AI图像分类技术也许会从血腥、暴力或悲伤的图片或视频信息中识别出潜在的自杀风险。
2.2.5 机器学习结合临床数据库,用于群体筛查
机器学习可适用于各种临床环境和人群,且可以胜任对疾病高危人群的初级筛查工作。2018年初,加拿大公共卫生局与AI公司Advanced Symbolics合作,启动了对区域自杀模式的研究。该公司从加拿大社交媒体帐户中公开获取匿名数据,以监测自杀高危人群并预测自杀高峰[15]。Zheng等[27]通过开发基于人群的风险分层监测系统,使用机器学习算法和深度神经网络建立具有电子健康记录的模型,结合社会经济因素及人口学数据,预测未来12个月的自杀未遂概率。Walsh等[28]将机器学习算法应用于纵向临床数据,以预测青少年的自杀未遂风险,将预测准确性提高了9倍。
目前机器学习已从大型数据库中识别出的自杀相关危险指标包括临床风险(精神疾病或躯体疾病史)与认知风险(生活满意度、目标、绝望、自尊和自我感知能力等)[29-30]。群体纵向临床数据的使用不仅提供了结合健康数据库进行纵向预测的可能性,更有利于对高危者进行长期管理。
2.3.1 准确性和效率需进一步提升
机器学习的算法需不断完善,以兼顾预测准确性和处理速度,这主要是由于:①关键信息难以识别。目前基于互联网平台的算法更多关注与自杀相关的关键词,而忽略包含压力、痛苦、抱怨等可能含有自杀风险的部分。②由于自杀死亡是低概率事件,机器学习算法需在精度和召回率之间寻找平衡。过多地将用户判读为高风险人群会增加非必要的人工筛选和救援工作量,反之,则可能遗漏需要被救援的用户。由于存在自杀意念的人群比例相对较高,而自杀死亡率相对更低,大多数自杀预测模型会存在极低的阳性预测值[5],且即使在自杀高风险人群中,该现象仍存在,这限制了机器学习的实际应用。自1990年以来,全球自杀死亡率大幅降低,其中中国下降幅度最大,达到64.1%[31]。大量人群在临床和生活中表达过负性想法或存在自杀意念,但最终不会付诸行动。潜在的解决方法是,首先保证较高的召回率和偏低的精度,然后引入“触发事件”机制,在识别到有自杀倾向的情况下,获取可靠的触发事件(例如用户在线询问如何购买自杀工具)有助于提高预测的精度。③不同人群有其特殊性,单一算法难以适配所有人群,例如,患有抑郁症、双相障碍、焦虑症、物质滥用、冲动控制障碍以及社会经济地位较低,都被认为是与自杀未遂事件相关的重要特征,至少患有一种精神障碍的个体自杀未遂风险是无精神障碍者的10倍以上[27]。因此,应建立针对特殊人群的自杀风险预测模型。
2.3.2 隐私泄露、污名化问题
首先,基于社交媒体的网络平台尚未受到隐私法规的管制。用户自杀相关信息的收集可能侵犯隐私权,从而引发不信任感,并降低用户寻求支持的可能性。同时,个体自杀意念与行为被泄露可能对其工作和生活造成困扰。例如,在军事系统和校园中,单位对个人健康状况有一定的知情权,这将影响其职业和学业生涯,导致当事人利益受损,尤其是自杀识别失误,不仅未能提供帮助,还会给当事人带来污名化[32]。
机器学习可以依据收集到的社交网络文字、图片和视频等资料预测用户的自杀风险。在现有自杀预测手段难以满足大规模筛查需求、海量自杀相关数据真假难辨的情况下,机器学习有望成为突破口。机器学习在轻博客、Facebook、讨论论坛、图片与视频社交平台用户自杀预测中的表现值得期待,然而,也需要进一步提升算法的准确性和效率,平衡精度与召回率之间的矛盾,建立不同人群的自杀预测模型,注重隐私保护与污名化问题,并解决后续自杀干预手段不足的问题。
目前,由于机器学习算法仍不够成熟,由计算机进行海量数据的甄别,再由医师做出临床判断的人机结合的预测方式可能是风险最低、效率最高的选择。这需要制定安全处理高风险病例、假阳性或假阴性的预案以及在专家判断和算法判断有冲突时给出决策。在未来的研究中,应注重自杀预测模型的优化。智能手机收集的用户输入信息及穿戴式设备收集的生理数据可能是自杀预测模型的重要补充[33];结合临床数据,如电子病历、就诊记录[34]及静息态功能磁共振数据[35]等也可能有助于提高预测准确率和效率;机器学习亦有望通过对自杀相关脑区的识别[36],并与神经调控技术相结合[37],实现对自杀的实时监测与干预。