【摘 要】人工智能的飞速发展让各平台相应推出人工智能服务以满足用户需求。本研究基于词频分析法和语义网络分析模型,以“人工智能辅助学习”为主题,对Bilibili弹幕视频网播放量前五的视频评论内容进行分析,从文本特征的角度分析用户对人工智能辅助学习这一现象的关注和讨论,以期帮助用户更好地理解并使用人工智能,以提高学习效率。
【关键词】人工智能;用户评论;热点分析
一、人工智能应用场景
人工智能之父图灵创立的自动机理论促进了人工智能的研究[1]。发展至今,人工智能的应用范围已经涉及到各个领域。2016年AlphaGo在围棋比赛中战胜世界冠军,企业研发自动驾驶汽车在街道上行驶,教育机构通过使用人工智能为学生定制个性化学习计划。人工智能是否真的能帮助学生学习、提升学习效率,人们提出了诸多观点,一部分人认为,人工智能辅助学习,能够帮助学生更好地掌握知识。也有声音指出,过度依赖人工智能会导致学生自主学习能力下降。我国学者许亚锋等认为,人工智能时代的教育目标更强调高阶思维、价值观等要素,教学内容由标准化转向定制化、教学组织形式更加灵活多样[2]。学者赵洪山和郑永进认为,高职院校应顺应人工智能发展态势,重视培养适应人工智能发展的技能,从而保障学生就业,促进技能型社会建设[3]。学者余胜泉指出,未来教育将是教师与人工智能教师协同共存的时代[4]。
百度推出人工智能模型文心一言,网易旗下有道翻译推出了AI翻译功能。小红书、抖音等新媒体平台也顺应潮流,推出的AI绘画创作、写作一键生成等功能被用户广泛使用。
本文以人工智能辅助学习为主题,深入探索人们对这一领域的看法和期望。分析视频评论区的用户评论,能够更全面地理解公众对人工智能辅助学习的认知和态度。用户评论涵盖了各种观点,包括对人工智能辅助学习潜力的乐观态度,对其可能带来的挑战和问题的担忧,以及对特定应用场景的期待和建议。对这些评论的深入分析,可以挖掘出用户对人工智能辅助学习这一现象的关注点,包括效果、可靠性、伦理问题等。通过分析可以发现,用户对人工智能辅助学习现象的关注倾向与讨论角度,例如,一些人可能更关注技术的进步和应用前景,而另一些人可能把目光投向人工智能辅助学习对人类工作和生活的影响。
二、研究设计与方法
(一)研究设计
将评论区对这一类型视频的评论文本作为研究文本。通过使用网络爬虫的方法,收集用户评论,随后对获取的用户评论进行清洗,构建关键字语义网络图,并从词频分析和语义网络分析维度深入分析当前使用者对人工智能辅助学习的关注点。
使用ROST_CM6软件对用户评论文本进行分词处理后,使用词频分析功能,对用户评论出现的高频词汇进行分析查询,确定当前用户评论的关注点,随后在这些热点词汇的基础上构建语义网络图。ROST_CM6是由武汉大学的沈阳等研制的一款社会科学资料分析软件,可以进行文字策略的分词和聚类分析[5]。本文运用ROST_CM6分词软件进行用户评论的语义网络分析与关键词提取及词频分析,通过当前环境下使用者使用人工智能辅助学习后的评论感受,对未来人工智能的规范化使用提供合理建议。
为了解大众对人工智能辅助学习这一现象的关注点和讨论点,保证样本选取具有代表性,本文选择Bilibili弹幕视频网发布的以“人工智能辅助学习”为主题的播放量前五的视频的评论区内容作为研究对象,通过网络爬虫对目标数据进行采集。随后,去除“三连”等无意义词语,对采集到的评论数据进行整理和清洗。对清洗后的数据进行词频统计分析,然后绘制词语义网络图,对所得结果进行描述与分析。
(二)研究方法
1.词频分析
词频分析法,主要通过统计文本中各个词汇出现的频率以揭示文本的主要内容、主题和潜在的模式,目前被多次运用于政策类文本分析、用户需求挖掘等领域。自二十世纪六七十年代文献计量学正式形成后,在文献计量学的发展与应用过程中,词频一直是重要的统计项目。词频分析是文献计量学的基石之一,通过词频分析,研究者可以从大量的文本数据中快速提取出频率最高的词汇,这些词汇往往代表了文本的主要内容和焦点。学者张洁等认为,词频分析法能够对揭示文献核心内容的关键词出现的频次进行统计,当某个关键词在该领域反复出现时,该词就能反映这一领域的研究重点及热点[6]。学者金红英和由亚男从游客体验感知角度进行研究,以网络文本和ASEB栅格分析相结合的方法,对新疆禾木村旅游产品进行深度分析,从而提出有效的营销策略[7]。通过词频分析,研究者可以快速获取用户评论中的核心概念和热点词汇,这对于理解用户对人工智能辅助学习的态度和兴趣点有一定帮助。
2.语义网络分析
语义网络分析,侧重于理解和分析词汇之间的关系。构建语义网络,可以揭示文本数据中隐藏的知识结构及其更加深层的意义,进而帮助理解词语之间的隐含主题、概念模式和结构关系。在体现语义网络分析结果的图形中,某一节点的连通性反映了该词语在网络中的重要性,而连接数较多的节点通常被认为是网络中的核心概念或实体。在用户评论中,如果发现两个关键词同时出现的次数较多,并且它们的连接频率较高,则意味着关键词之间可能存在某种功能关系、情感倾向或是文本背景所涉及的研究趋势、社会热点。
词频分析提供的词汇频率信息可以为语义网络分析提供数据支持,而语义网络分析揭示的词汇关系则可以进一步验证和解释词频分析的结果。二者相互结合可以更全面地揭示用户对人工智能辅助学习的看法、关注重点和讨论角度,为相关研究提供依据。
三、用户对人工智能多元化的需求
(一)“人工智能辅助学习”主题的视频评论收集
为保证用户评论的客观性和有效性,在用户评论选择阶段通过搜索以“人工智能” “学习”等为关键字的视频进行筛选。研究视频选取了以Bilibili弹幕视频网站中播放量较高、评论数量较高、讨论数量较多的人工智能学习相关视频,以保证视频样本选取的有效性。评论内容为“我把写好的代码给它,让它帮我纠错,结果它告诉我它不行?”的回复得到400多点赞和网友的讨论;另一条“那又如何?就因为有人会失业,所以拒绝科技进步?”的评论得到了7000多点赞;也有网友对于学生使用人工智能辅助学习的现象发出疑惑“很多学生没有老师的情况下会自主用它学习吗?”,该评论引起了400余条讨论。
(二)用户评论数据处理
随着新媒体平台的发展,用户在评论区留下的评论信息和在视频中发布的弹幕数据都已成为不可忽视的研究数据。然而,新媒体平台上的评论信息在准确性上存在一定的不足。首先,新媒体平台上的评论信息时间点不一。有些评论可能是过去发布的,他们发布评论时,人工智能还没有得到广泛应用,这些评论不再适用当前环境。其次,获取到的用户评论也存在不真实、不客观等问题。
虽然Bilibili弹幕视频网站用户评论有效性相对其他视频网站较高,但仍有一部分评论属于无效评论。对收集到的数据进行观察,制定数据清洗规则:第一种是重复评论。账号信息及评论内容完全一致的信息,研究中需要从原始的评论数据中删除。这类信息可能是因为用户出现误操作或者平台数据出现异常而导致的。第二种是打卡类观光评论。这类用户喜欢在不同类型视频下方留言,所评论内容和视频内容完全无关。
四、“人工智能辅助学习”视频的主要特征
(一)高频词特征
随着视频网站的不断发展,所选视频网站特有的“三连”等词语未添加进词库中,也有“支持UP主”“助力热门”等无关评论。因此,本研究中选择了具有一定准确性的人工方法进行分词,将部分连续的评论语句分解成一个个单独的词汇。随后将分词后的文本数据导入软件中,利用其功能进行高频特征词的分析。在处理过的文本上进行词频统计,以此来获取文本的词频数据(见表1)。
在文本评论中,高频词汇通常表示了评论中的主要话题、用户的关注点或者文本的核心内容,也可能表达了用户对于某一主题的情感倾向,而在特定情境或主题的评论中,高频词汇可能与情境或主题紧密相关。在以“人工智能辅助学习”为主题的用户评论中,当前用户评论的关注点,大致分为以下三种:
(1)对视频主题的表述。“学习”“问题”“学生”三个词的词频最高,是对“人工智能辅助学习”这个主题的描述。由此分析得知,在以“人工智能辅助学习”为主题的视频中,“学习”是人们表达的主体对象。
(2)对人工智能使用规范的表述。“写作”“软件”“程序”等词汇表达的是使用者在使用人工智能时,对自身需求的阐述及要求,并期望通过人工智能可以帮助解决。“收费”“免费”等词汇是使用者在使用人工智能完成工作时产生的顾虑。付费的人工智能可以为使用者提供精准度更高、更符合使用者需求的内容,然而其增加了使用者的成本。而使用者在使用免费的人工智能时,其平台给出的结果未必符合使用者需求,需要使用者反复询问,反复对话,才能提供更加清晰的学习思路,却增加了使用者的时间成本,使其效率低下。与此同时,使用者对隐私性的要求也被纳入使用者对人工智能平台使用的考虑中。
(3)对人工智能未来发展的表述。“老师”“学生”“取代”等词汇表述的是使用者基于对人工智能辅助学习这一观点,讨论人工智能的兴起是否可以在一定程度上替代教师工作。“AI是否可以帮人完成工作”等话题,同样是使用者对人工智能未来发展的探讨和描述。
(二)情绪特征
评论文本中积极情绪占45.96%,中性情绪占38.83%,消极情绪占15.21%,说明在使用人工智能辅助学习这一过程中,大多数呈现积极倾向(见表2)。这意味着绝大部分Z世代使用者认为,人工智能可以很好地辅助人们学习,帮助他们减轻心理负担,提供个性化需求,从而减少现实环境所带来的学习压力,进而提高学习和工作效率。从评论的语句分析结果上来看,消极情绪多为对人工智能的怀疑,认为人工智能不能帮助使用者解决问题。中性情绪多为讨论人工智能未来发展趋势,认为人工智能可以帮助人们节约时间,但不能完全代替人工,认为人工智能会促使人们进行对自我技能的磨练和增长。由情绪分析结果可知,在使用人工智能辅助学习的过程中,人们更容易产生积极情绪,反映了人们对使用人工智能辅助学习持积极态度表示认可。
(三)语义网络特征
使用ROST_CM6软件中的语义网络分析功能整理形成了高频词汇语义网络图(见图1)。语义网络图的绘制是基于对数据文本的高频词汇分析,将评论语句中共现的高频词汇用线段连接,从而构造可视化图形。在语义网络图中,线条越密集,表示该词汇与其他词汇共现的次数越频繁。
使用人工智能目前以网站为主要途径,辅助学习的需求仍在进一步提升,并希望其能够更加智能化,为使用者提供更多的学习思路与灵感。与“教师”“问题”相连密切的还有“使用”“知识”,这说明尽管人工智能已经可以解决使用者部分问题,但是在使用人工智能的过程中,仍然需要教师予以帮助,以加深对知识的理解。
五、结语
目前,人工智能正处于一个快速发展和应用的时期。人工智能已经经历了从最初的图灵测试,到机器学习和神经网络等方法,进而发展到了如今的自动驾驶、智能机器人、自然语言处理等领域。数据的精准化分析、各类智能平台的灵活应用促进了个性化学习,有利于使用者自我学习与诊断。随着技术的进步,人工智能正在不断改变人们的工作方式、生活方式和思维方式。
人工智能的应用,使得人们在学习效率上实现了巨大的飞跃,这种进步体现在学习的速度、深度和广度上。人工智能为用户提供的自动化知识管理,可以帮助学习者快速定位到所需的知识点,节省了用户在检索和获取知识上的时间。这种自动化的服务,使得学习变得更加高效,也让使用者能够更好地进行知识整合和应用。它通过个性化的学习推荐、智能化的教学辅助、自动化的知识管理等手段,极大地丰富了学习体验,提高了用户的学习成果。
人工智能为用户自主高效学习提供了新的契机,同时也更需要多方面加以考量。不仅需要出台相关政策推进人工智能的发展,保障使用者个人信息的安全性,也增加更多可提供个性化学习定制的人工智能平台,确保人工智能平台使用更加规范。而面对被质疑可能会被人工智能所替代的教师行业,不仅需要增加多领域的学习,也需要能够灵活使用人工智能来辅助教学工作,通过人工智能使学习过程更加互动和趣味;学生需要不断增加自身知识储备,为更高效使用人工智能提供相关知识基础,培养独立思考和解决问题的能力。人工智能的发展势不可挡,互联网的发展让人工智能对软件、硬件及道德伦理等方面提出了更加严格的要求。面对人工智能技术的迅速发展,在迎接人工智能时代到来的同时,人们更应不断深入学习。
随着公开共享的人工智能模型平台的增加,人工智能模型提供的相关信息将越发聚焦于用户需求,并能提供更加准确的信息,引起越来越多研究者的关注。
注释:
[1]蔡自兴.中国人工智能40年[J].科技导报,2016,34(15):12-32.
[2]许亚锋,高红英.面向人工智能时代的学习空间变革研究[J].远程教育杂志,2018,36(01):48-60.
[3]赵洪山,郑永进.人工智能背景下高职学生就业技能提升研究[J].教育与职业,2024(04):92-96.
[4]余胜泉.人工智能教师的未来角色[J].开放教育研究,2018,24(01):16-28.
[5]张莉,杨剑.基于ROSTCM的安徽省科技创新政策文本量化分析[J].技术与市场,2021,28(05):30-33.
[6]张洁,王红.基于词频分析和可视化共词网络图的国内外移动学习研究热点对比分析[J].现代远距离教育,2014(02):76-83.
[7]金红英,由亚男.基于网络文本和ASEB栅格分析的体验营销策略研究——以新疆禾木村为例[J].四川旅游学院学报,2018(06):66-69.
参考文献:
[1]彭佳玲,周茂林,杨青.公众对上门护理服务的态度和关注点:基于网络爬虫的文本挖掘[J].护理学杂志,2023,38(05):110-113+116.
[2]李实,叶强,李一军 等.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报,2009,12(02):142-152.
[3]阮光册.基于LDA的网络评论主题发现研究[J].情报杂志,2014,33(03):161-164.
[4]陆泉,曹越,陈静.基于语义关联与模糊聚类的共词分析方法[J].情报学报,2022,41(10):1003-1014.
(作者单位:桂林电子科技大学商学院)
责编:刘纯友