人工智能应用于心理学领域研究现状

2022-05-31 01:13杨利丁娇胡天寒刘影王婷婷

电脑知识与技术 2022年11期

杨利丁娇胡天寒刘影王婷婷

摘要：人工智能技术被广泛应用于心理学的各个领域，研究方法和工具能够促进心理学的发展，对于心理学而言具有重要意义。文章梳理社交网络、语音、面部表情、其他心理数据及多元心理数据融合的应用现状，比较分析决策树、人工神经网络、支持向量机和深度学习等心理数据分析算法，深度学习能抽取更高级别的特征数据，更具优势。对人工智能应用于心理学领域的研究进行了总结和展望。

关键词：人工智能;心理学;深度学习

中图分类号：TP391 文献标识码：A

文章编号：1009-3044（2022）11-0001-03

心理学主要研究人的心理、精神和行为及其之间的相互关系，研究对象为个体或群体的情绪、认知、思维、人格、人际关系、行为等，常见的研究方法有：实验法、访谈法、调查法、比较法等[1-2]。心理学的研究方法和工具对心理学的研究具有重要意义，例如，1879年冯特首创了心理研究实验室，将特定的心理现象置于某种受控条件下进行研究，直接促使了心理学从哲学的分离，成为一门独立的科学[1]。近年来，统计学中的t检验、方差分析、回归分析等工具广泛应用于心理学的研究，并取得了一定的成果[3]。但这些传统的统计学方法存在两个方面的问题：一是传统的统计学方法需设置前提条件才能对数据进行分析;二是影响人类心理现象的因素众多，且这些因素之间存在错综复杂的关系，数据量巨大，传统的统计学方法难以进行分析。

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学[4]。人工智能的工作原理是使用机器学习算法对大量数据进行训练学习，从而构造模式识别模型，并使用该模型对未知数据做出类似于人的决策。人工智能技术相对于传统的统计学方法在大数据处理和数据分析方面有着显著的优势。

1 人工智能在心理测量领域的应用

目前，使用各种心理测量量表获取人们的心理特征是心理学测量领域的普遍方法，这种方法可以快速获得受试者不同视角下的心理特征，但是受试者在评测过程中，存在记忆偏差、主观随意性强、审答题不仔细等因素，造成所获取的心理特征数据不能客观地反映受试者的心理状态。

人工智能在获取数据方面有着天然优势，除使用心理量表采集数据外，还可从受试对象的社交网络、语音、面部表情、生理信号等方面获取相关数据，社交网络内容往往是内心情感的真实写照，语音和面部表情也是传达情感状态的自然、普遍方式，相对于从心理量表所得数据而言更具客观性，各种生理指标数据也被应用于心理分析。心理数据应用的一般过程为：采集某种或几种心理数据，生成有结构的心理特征数据，使用机器学习算法提取出重要特征，再使用分类算法进行分类或预测，如图1所示。

1.1 社交网络心理数据

随着社交网络的兴起，人们将部分社会行为转移至网络上，常见的表现形式有：撰写博文、发表评论、互动留言、关注他人社交网络主页、阅读博文等，这些网络行为可以是匿名的，因此往往是人们真实心理活动的对照，具有较强的自发性和真实性，同时这些行为数据可被记录下来，将其有效地组织起来可构成不同情境下的用户行为数据。

社交网络心理数据应用于心理领域的任务十分广泛，如抑郁、自杀倾向、压力、舆情等。Nadeem M构建了250万条的语料库，每条语料库对应一篇Twitter博文，然后用几个统计分类器估计抑郁症的风险，其准确率达到86%[5]。Yates A等人提出了一个识别社区用户抑郁的神经框架，从Twitter和Facebook上获取社区用户发帖，使用框架分析处理后能有效识别用户的抑郁程度，结果与自我报告的抑郁症诊断结果基本相符[6]。朱廷劭等人提出一種基于网络行为时频的抑郁检测方法，通过抑郁自评量表和网络行为采集获取了728名受试者心理特征数据，使用时频分析构建了时频特征，该方法能有效地捕捉抑郁状况变化[7]。刘德喜等人对QQ空间、微信朋友圈等准私密社交网络上的数据进行采集和分析，论证了基于准私密社交网络检测用户抑郁的可行性[8]。林靖怡等利用网络爬虫技术获取微博内容，并从中提取心理健康数据，构建基于社交网络数据挖掘的心理健康预警模型，分类准确率高到91%[9]。王海起等也从社交网络中爬取情感信息，并以此分析地理情感特征[10]。

1.2 语音心理数据

语言是人们之间最普遍的交流方式，语音则是语言表达的重要形式，富含表达者丰富的情感、态度等心理特征。近年来，研究者主要聚焦于语音的情感识别的研究，研究重点为语音特征和语音数据库的构建。在语音特征方面，李田港等设计了一种基于集成学习的语音情感算法，在生气、悲伤、高兴、惊慌及中性情感上都有着较好的识别效果[11];IBM （International Business Machines Corporation，国际商业机器公司）研发了一种临床高危人群精神障碍发作预测系统，该系统能自动采集患者的说话声音并进行分析处理，预测准确率达到了79%[12]。Ben Alex S等提出一种基于深度学习的语的Emo-DB情感识别系统，对语音中的韵律特征进行提取和分割，具有较好的情感识别效果[13]。陈颖等构建一个包含7种情感共计5376条语音样本的汉语情感语音数据库，分别并从差异性、一致性、集中性和及情感识别率分析样本数据库的质量，结果表明样本数据库的情感一致性较高且具有明显的可区分性[14]。

1.3 面部表情心理数据

面部表情是人们内心活动的真实写照，面部表情同语音相同，也蕴含着大量的心理特征信息。目前，基于面部表情的情感识别主要分为两大类：静态图像和视频图像。在静态图像方面：杨金朋等对在线学习平台学习者的人脸表情进行采集和分析，计算其情感值，为个性化学习方式提供支持[15];张海峰针对人脸识别的身份认证、特征提取和特征提取方式等应用场景分别设计了相应算法，对人脸识别的全过程进行了优化，提高了识别精度[16]。在视频图像方面，LI Q等在提取面部表情的基础上，提取了微表情的光流特征，再对这些光流特征进行细化，最后利用SVM（Support Vector Machine，支持向量机）进行了分类[17]。

1.4 其他心理数据

生理信号、医学影像图片等也包含着许多心理特征数据。Kim等开发了一种基于生理信号数据的短期情绪监控系统，识别准确率为75%[18];Sarraf S等使用机器学习算法分析MRI（Magnetic Resonance Imaging，磁共振成像）结构成像数据，对阿尔茨海默病患者和健康老年人进行分类，分类准确度高达95%左右[19]。Bahado-Singh RO等提出了一种基于外周血表观遗传基因的识别系统，该系统能有效预测新生儿时期的孤独症谱系障碍（Autism Spectrum Disorders，ASD） [20]。

1.5 多元心理数据融合

单一心理数据来源不够全面，将语音、面部表情、生理信息等特征融合起来进行分析已成为行业共识。具体实现路径有两种，一是先提取单种心理特征数据再融合，二是先融合再进行心理特征数据提取。范习健等利用多种机器学习模型对语音和面部表情两种特征数据进行融合分析，对比实验表明，融合后的数据模型识别效果优于单一数据模型[21]。陈敏提出了一种融合文本和短视频的情感分析方法，在中性、积极和消极三种情感类别识别上表现较好[22]。袁鹏提出了基于注意力机制Dempster-Shafer（D-S）证据理论的融合策略，先通过深度学习算法直接提取心理特征数据，再用融合策略进行特征筛选，其有效识别率达到了85.73%[23]。

2 人工智能应用于心理分析的常见算法

人工智能的核心技术是通过构建机器学习算法模型对数据进行分析。机器学习是研究计算机模拟或实现人类的学习行为，重组已有的知识结构并使之不断改善[24]。余凯等将机器学习算法分为两大类：浅层学习和深度学习。浅层学习算法如决策树、人工神经网络和支持向量机等，目前已广泛应用于心理学领域，但其模型的评估效果与经验相关，难以取得较好的评估结果。深度学习是目前性能表现最优的机器学习算法，主要包括卷积神经网络、循环神经网络和深度信念网络等[25]。主要的机器学习算法的发展历程如图2所示。

2.1 决策树

决策树算法通过把数据样本分配到某个叶子节点确定数据集中样本所属的分类，利用树形模型不断递归样本空间，树形模型由决策节点、分支和叶子节点组成[26]。树中的每个决策节点表示一个样本空间，每个决策节点到叶子节点的连接都是一条路径规则，每个叶子节点代表一个判断类别，主要用于解决分类问题。

李梦然使用决策树模型找出影响大学生亚健康的重要因素有：学习时长、经济困难、熬夜、身体锻炼等，对样本的分类准确率达到83.9%[27]。侯继文收集了青岛大学附院住院部及体检中心的330例MCI（Mild Cognitive Impairment，轻度认知障碍）患者数据，使用决策树模型筛选出影响MCI指标的重要因素有教育程度、社会交往、业余爱好、高脂饮食、高脂血症等，模型的AUC（Area Under Curve）值达到0.81[28]。

2.2 人工神经网络

人工神经网络是一种模仿生物学中神经元的计算模型[29]，其网络结构由大量的类似于神经元的节点构成，每个节点都有输入值、输出值，输入值进行线性组合后，再经过某种激励函数即为输出值，神经元节点按其功能可分为输入层、隐藏层和输出层。人工神经网络不同于传统的逻辑推理，仅通过计算输入值的权值，便能获得类似于人的简单决策能力。奚晓岚等构建了基于神经网络的大学生心理健康评估模型，对150名大学生的SCL-90量表数据进行分析，实验结果显示模型的收敛性和准确性较好[30]。王丽使用优化后的神经网络对研究生群体的SCL-90心理数据进行分析，结果显示预测值接近实际值[31]。

2.3 支持向量机

支持向量机将样本数据表示为空间的点，利用核函数转换将低维样本空间转换为高维样本空间，在高维空间中，取间隔空间最大的线性分类表面作为决策边界，各类样本点距离决策边界越大，其分类误差越小，主要用于解决分类问题[32]。

王琳虹等提出了一种基于粒子群与支持向量机的驾驶疲劳等级判别模型，对驾驶员的生理特征：心电RR间期标准差、脑电的α波和β波和心率均值等进行分析，其判别准确率超过85%[33]。庄媛通设计了一种基于支持向量机和随机森林的情绪分类模型，对60名学生的情绪数据进行分析。情绪的最高识别率达到75.13%[34]。

2.4 深度学习

深度学习源自人工神经网络，通过建立基于反向传播的深层次神经网络，模仿人脑的机制分析处理各类数据。以深度神经网络为代表的深度学习包含了更多的隐含层，能够抽取更高级别的抽象特征，是人工神经网络的进化和提升，因此深度学习比浅层学习更具优势[25]。Zhou J等通过构建基于深度学习模型，揭示了非编码突变对ASD（Autism Spectrum Disorder，自闭症谱系障碍）的影响[35]。徐其华等提出了一种基于深度自编码网络和自注意力的表情识别模型，可自动提取人脸表情特征，该模型表情识别的准确率达到90%以上[36]。刘小沣分别用自适应深度度量学习和对抗训练两种方法解构面部表情信息，并在IJB-A/B/C系列数据集、Celebrity-1000视频数据集上验证了该算法的有效性[37]。

3 结束語

综上所述，人智能技术已经成功应用于心理学诸多领域，文本、语音、面部表情等多元心理数据融合更具有全面性，深度学习算法比传统的支向量机、决策树等浅层学习算法具有更好的评估性能。针对不同的任务，导致各种技术的预测结果准确率相差很大，有的能达到90%，有的却只有70%，原因在于应用场景各异，数据集大小、参数设置、标注质量都不相同。心理数据的主体为人，相较于自然科学下的数据而言，主观性更强，因此如何构建高质量、可复用的心理数据库是这一领域的重大挑战。

参考文献：

[1] 高学德.心理学研究方法的回顾和思考[J].甘肃联合大学学报（社会科学版），2005，21（2）：90-92.

[2] 李宇，王沛.心理学研究方法的前沿创新之作——评《心理学研究方法》[J].教育研究，2013，34（6）：158-159.

[3] 焦璨，黄泽娟，张敏强，等.心理研究中统计方法应用的元分析——以《心理学报》《心理科学》（1998—2008）统计方法应用为例[J].心理科学，2010，33（1）：48-54.

[4] 钟义信.人工智能的突破与科学方法的创新[J].模式识别与人工智能，2012，25（3）：456-461.

[5] Nadeem M.Identifying depression on twitter[J]. arXivpreprintarXiv：1607.07384，2016.

[6] Yates A，Cohan A，Goharian N.Depression and self-harm risk assessment in online forums[C]//Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing.Copenhagen，Denmark.Stroudsburg，PA，USA：Association for Computational Linguistics，2017.

[7] Zhu C Y，Li B B，Li A，et al.Predicting depression from Internet behaviors by time-frequency features[C]//2016 IEEE/WIC/ACM International Conference on Web Intelligence （WI）.October 13-16，2016，Omaha，NE，USA.IEEE，2016：383-390.

[8] 刘德喜，邱家洪，万常选，等.利用准私密社交网络文本数据检测抑郁用户的可行性分析[J].中文信息学报，2018，32（9）：93-102.

[9] 林靖怡，黎大坤，吴平鑫，等.基于社交数据挖掘的心理健康预警建模与分析[J].电子技术与软件工程，2020（8）：172-173.

[10] 王海起，陈冉，魏世清，等.利用中文微博数据的地理情感特征挖掘[J].武汉大学学报·信息科学版，2020，45（5）：699-708.

[11] 李田港，叶硕，叶光明，等.基于集成学习的语音情感识别算法研究[J].计算机技术与发展，2020，30（6）：82-86.

[12] Corcoran C M，Carrillo F，Fernández-Slezak D，et al.Prediction of psychosis across protocols and risk cohorts using automated language analysis[J].World Psychiatry，2018，17（1）：67-75.

[13] Alex S B，Babu B P，Mary L.Utterance and syllable level prosodic features for automatic emotion recognition[C]//2018 IEEE Recent Advances in Intelligent Computational Systems.December 6-8，2018，Thiruvananthapuram，India.IEEE，2018：31-35.

[14] 陳颖，肖仲喆.离散标签与维度空间结合的语音数据库设计[J].声学技术，2018，37（4）：380-387.

[15] 杨金朋，薛耀锋，李佳璇，等.基于人脸表情识别的在线学习情感计算研究[J].中国教育技术装备，2017（18）：35-36，43.

[16] 张海峰.基于多特征融合的人脸表情识别研究[D].合肥：中国科学技术大学，2020.

[17] Li Q Y，Zhan S，Xu L F，et al.Facial micro-expression recognition based on the fusion of deep learning and enhanced optical flow[J].Multimedia Tools and Applications，2019，78（20）：29307-29322.

[18] Kim K H，Bang S W，Kim S R.Emotion recognition system using short-term monitoring of physiological signals[J].Medical and Biological Engineering and Computing，2004，42（3）：419-427.

[19] Sarraf S，Tofighi G.Deep learning-based pipeline to recognize Alzheimer's disease using fMRI data[C]//2016 Future Technologies Conference （FTC）.December 6-7，2016，San Francisco，CA，USA.IEEE，2016：816-820.

[20] Bahado-Singh R O，Vishweswaraiah S，Aydas B，et al.Artificial intelligence analysis of newborn leucocyte epigenomic markers for the prediction of autism[J].Brain Research，2019，1724：146457.

[21] 范习健，杨绪兵，张礼，等.一种融合视觉和听觉信息的双模态情感识别算法[J].南京大学学报（自然科学），2021，57（2）：309-317.

[22] 陈敏.融合文本和短视频的双模态情感分析[D].南京：南京邮电大学，2020.

[23] 袁鹏.基于深度学习的情感识别算法研究[D].南京：东南大学，2019.

[24] 陈凯，朱钰.机器学习及其相关算法综述[J].统计与信息论坛，2007，22（5）：105-112.

[25] 余凯，贾磊，陈雨强，等.深度学习的昨天、今天和明天[J].计算机研究与发展，2013，50（9）：1799-1804.

[26] 杨静，张楠男，李建，等.决策树算法的研究与应用[J].计算机技术与发展，2010，20（2）：114-116，120.

[27] 李梦然.基于Logistic和决策树模型的大学生亚健康状况及影响因素分析[D].北京：北京交通大学，2015.

[28] 侯继文.轻度认知障碍影响因素分析及决策树模型研究[D].青岛：青岛大学，2020.

[29] 毛健，赵红东，姚婧婧.人工神经网络的发展及应用[J].电子设计工程，2011，19（24）：62-65.

[30] 奚晓岚，程灶火.基于神经网络的大学生心理健康评估模型[J].中国临床心理学杂志，2011，19（6）：746-747，733.

[31] 王丽.基于神经网络的研究生心理健康状况预测分析[D].西安：西安科技大学，2016.

[32] 丁世飞，齐丙娟，谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报，2011，40（1）：2-10.

[33] 王琳虹，李世武，高振海，等.基于粒子群优化与支持向量机的驾驶员疲劳等级判别[J].哈尔滨工业大学学报，2014，46（12）：102-107.

[34] 庄媛.基于符号动力学的心率变异性情绪识别研究[D].济南：山东大学，2019.

[35] Zhou J，Park C Y，Theesfeld C L，et al.Whole-genome deep-learning analysis identifies contribution of noncoding mutations to autism risk[J].Nature Genetics，2019，51（6）：973-980.

[36] 徐其華，孙波.基于深度学习和证据理论的表情识别模型[J].计算机工程与科学，2021，43（4）：704-711.

[37] 刘小沣.基于深度学习的人脸图像识别技术的研究[D].北京：中国科学院大学（中国科学院长春光学精密机械与物理研究所），2019.

收稿日期：2021-09-01

基金项目：安徽高校人文社会科学研究重点项目（SK2020A0380，SK2021A0468，SK2021A0466）;大学生心理健康教育研究中心安徽省人文社会科学重点研究基地校级课题（SJD202001）;安徽高校自然科学研究重点项目（KJ2020A0822）;高校优秀青年人才支持项目（gxyq2020106）;皖南医学院中青年科研基金自然科学项目（WK202115）

作者简介：杨利（1984—），男，安徽池州人，讲师，硕士，主要从事信息技术教学研究和机器学习研究。