基于微博数据的人工智能网络舆情分析

2023-11-25 21:01代一方

传播与版权 2023年21期

代一方

［摘要］随着社交媒体的兴起，微博作为一种广泛使用的社交平台，吸引了大量用户参与讨论。本研究通过对微博ChatGPT话题数据进行主题分析和情感分析等，以识别公众在该话题上的观点和态度。本研究成果可以为政府、企业等提供有价值的信息，帮助其更好地理解公众对ChatGPT的态度，从而根据这些信息来制定相应的策略。

［关键词］ChatGPT；微博话题；LDA主题模型；公众态度

一、研究背景

当今时代，人工智能飞速发展，逐渐被应用于各个领域，人类生活、经济社会变得越来越智能化。涂良川认为，人工智能定义了新的科技时代，其具有强大的能力和广泛的影响，拥有高阶自动化逻辑的人工智能继承并超越了机器自动化逻辑的技术［1］。

目前，关于公众对人工智能的态度的研究大多通过案例研究或问卷调查的方式进行，刁生富和冯桂锋的研究指出，媒体的宣传和报道可以帮助公众更好地理解和接受人工智能，从而影响他们的思维模式和价值观念［2］。张海等构建了影响ChatGPT用户使用意向因素的研究模型，探讨了ChatGPT用户的行为特征［3］。此外，方旭等基于期望—确认理论和信息系统成功模型，探索影响中学生持久性使用人工智能技术的因素，其目的在于研究如何进一步提高中学生对人工智能技术的满意度和感知效用［4］。

尽管问卷调查具有一定的代表性，但由于样本量的限制，其可靠性仍然有待提高。此外，从心理学的角度来看，问卷调查的结果可能与人们的真实情况和想法存在一定的出入。相对而言，网络评论的数据更能够反映客观真实的情况。学者们正在努力利用网络文本大数据分析来深入探究公众的观点。徐红霞等采用文本筛选、情感分析、关键词筛选、主题模型等多种技术，以知乎社区为例，结合社区特征和交互数据，构建出一个能够准确反映观点对抗性的分析模型，从而更好地收集和分析公众对人工智能Alphago的观点［5］。

为了弥补问卷调查存在的缺点，获得更加真实可靠的数据，本研究收集微博ChatGPT话题的帖子和评论，并进行舆情分析，研究大数据环境下公众对人工智能产品的态度，从而为政府、企业等提供有价值的信息。

二、数据处理与主要研究方法

（一）数据处理

笔者使用Python爬虫算法，从微博ChatGPT话题中提取有价值的评论文本。微博ChatGPT话题下共有19.4万条评论，笔者从中爬取2022年12月20日到2023年4月7日的一级评论，共11395条数据，并对数据进行筛选，去掉重复项、空白项等无关数据，最终得到10400条数据。

（二）主要研究方法

1.语义网络分析

语义网络分析是一种分析和理解文本或语言数据的方法，基于语义关系构建图结构，并通过对图结构的分析来揭示语义信息的关联性。在语义网络分析中，文本中的单词或短语表示为节点，而它们之间的语义关系表示为边。这些语义关系可以是同义关系、上下文关系、关联关系等。通过构建语义网络，我们可以捕捉到文本中的关键概念、主题以及它们之间的关联性。语义网络分析的目的是提取出文本的重要信息和关系，并以可视化的方式呈现，揭示文本中隐藏的模式、主题和结构，帮助人们更好地理解文本内容。

2.LDA主题分析

LDA主题分析是一种文本分析方法，通过对文本数据进行统计、计算和建模来确定文本中的主题或话题。LDA主题分析对理解大量文本数据中的关键主题和话题，并揭示它们之间的关系起到重要作用。LDA主题模型是一种统计模型，通过分析文本中词语的共现模式，自动发现主题。我们将LDA主题模型用于舆情分析，可以了解热门话题和舆论动态，揭示网民的偏好和需求，从海量文本数据中提取有用的信息，从而为决策制定提供支持。

三、研究发现

（一）语义网络分析

从语义网络分析图中（图1），我们可以得到以下信息，“技术”和“人工智能”是最核心的概念，它们之间的连线数量最多，这从侧面说明网民对人工智能产品ChatGPT的基本认知是“一种技术的进步”。“应用”“人类”“学习”“机器人”等处于次核心位置，表明网民对ChatGPT的進一步认识包括其在各个领域的应用、技术对人类生活和学习的影响等。核心和次核心概念词汇的外围词汇包括“全球视角”“人才培养”

“未来发展”等，这些词汇与核心概念和次核心概念词汇之间有一定的关联，进一步完善和补充了对ChatGPT的解释。笔者通过语义网络分析，发现ChatGPT作为一个人工智能产品，在技术领域具有重要地位，同时也在新技术应用、人类生活和学习等方面产生广泛影响。此外，“全球视角”“人才培养”和“未来发展”也是与ChatGPT相关的重要话题。

（二）主题分析

笔者对文本数据进行整理和分词，得到评论词集合，然后利用LDA主题模型进行主题分析。笔者通过使用中文分词工具Jieba，得到一个包含所有评论词的词汇集，然后对此词汇集内的词汇做主题聚类。笔者主要运用LDA主题模型方法，将筛选后的文档词集合作为模型输入，调整参数并对其进行1000次迭代，从而获得四个主题的占比和主题特征词。其中：人才培养主题占比41.3%（主题特征词：教育、搜索、方式、学生、论文）；产业生态主题占比24.7%（主题特征词：市场、马斯克、服务、学习、行业）；人类生活主题占比18.4%（主题特征词：对话、影响、思考、生活、失业）；投资决策主题占比15.6%（主题特征词：消息、大涨、震荡、风险、股票）。人才培养主题评论数最多，一方面，因为其涉及教育、就业、社会发展等方面的问题，对大多数人来说都具有直接的利益关系；另一方面，微博作为一个社交媒体平台，学生、教育从业者用户数量庞大，导致舆情导向倾向于此主题，而投资决策主题需要用户具备专业的知识背景才能发表有主见的内容，因此评论较少。

（三）对抗性情感分析

对抗性观点指积极倾向文本和消极倾向文本之间的对立性，这种对立性可以从海量信息中挖掘出来，本研究使用情感分析方法和主题模型分析方法，具体的技术流程如图2所示。

对网络舆情进行情感分析，能够帮助我们更好地了解公众对ChatGPT的正负面情感及其背后的原因。笔者利用百度智能云情感分析平臺提供的“情感倾向分析”API对微博ChatGPT话题评论数据进行分析，得分越靠近1，表示该评论越积极，得分越靠近0，表示该评论越消极。笔者将得分大于0.5的评论设置为积极倾向评论，小于0.5的设置为消极倾向评论，最终获得4538条消极倾向数据，占比约为43.6%；5862条积极倾向数据，占比约为56.4%，在数量方面，积极倾向评论占比更高。随后笔者在积极倾向评论集合和消极倾向评论集合内分别利用LDA主题模型进行主题分析，进而得到主题分布，在经过参数调整后，发现主题数量为3时效果最佳，具体的主题特征词与示例如表1所示。

综合来看，支持ChatGPT和反对ChatGPT两种态度的观点对抗性显著，笔者结合各主题下的具体文本，可以大致总结出两种态度的对立特征。

第一，对ChatGPT与人类的关系，积极态度认为ChatGPT的出现标志着人工智能的一次重大突破，为人们提供了一种全新的与计算机交互的方式，期待ChatGPT未来能够产生更多令人兴奋的成果。消极态度认为核心技术掌握在国外，这会使中国的科技发展面临巨大的挑战，对中国是否能够在这股科技浪潮中占据主导地位的不确定性感到担忧。

第二，对ChatGPT的发展，积极态度认为ChatGPT的学习能力日益增强，可以对大量的数据进行分析，并根据问题或需求生成相应的回复或建议，能够从各种来源的数据中提取关键信息，帮助企业快速洞察市场动态、了解客户需求、预测趋势变化等。消极态度认为一些传统工作可能会受到ChatGPT的冲击，导致部分人员失去工作，ChatGPT的应用可能引发失业高峰等问题。

第三，对ChatGPT的应用，积极态度认为ChatGPT不仅可以提供一种快速、准确、高效的方法来处理大量文本数据，还能帮助诸多公司提高工作效率。消极态度认为ChatGPT的功能还没有被人们充分挖掘，目前生成的某些回复依旧不符合人们预期，对学生来说，将ChatGPT作为辅助学习工具也会引发一系列负面问题，这需要引起教育界的重视。

四、讨论

（一）增强用户体验和加强隐私保护

在信息时代，用户体验和数据安全是ChatGPT发展的两个重要方面。一方面，为了提高用户满意度，ChatGPT需要关注用户体验，并改进对话流程。这包括增强对话内容的丰富性、准确性和实用性，以确保用户能够获得满意的交互体验。此外，为了提高竞争力，ChatGPT还可以考虑增加更多的服务和功能，以满足用户多样化的需求。另一方面，随着数据泄漏和隐私泄露事件的频发，数据安全和隐私保护问题成为用户关注的焦点。在这方面，ChatGPT需要采取切实可行的措施来加强数据安全和隐私保护。这包括建立健全的数据保护机制，确保用户的个人信息得到妥善处理和保护，采用加密和安全传输技术来防止未经授权的数据被访问和泄露。同时，ChatGPT也应该明确隐私政策，并与用户建立信任关系，使用户对其数据的安全性和隐私保护有信心。

（二）加大投资力度和加强监管

在人工智能快速发展和广泛应用的背景下，政府在引导、推动技术研发和创新方面扮演着关键的角色。政府应积极履行职责，确保人工智能技术符合公众利益和社会价值。首先，政府可以通过资助研究机构和高等教育机构，支持人工智能领域的研发和创新，鼓励科学家、工程师和创业者对前沿技术进行探索，推动人工智能技术的不断进步和应用领域的不断拓展。其次，政府应加强对人工智能领域的监管，确保人工智能的发展和应用符合公众对隐私、安全和伦理等方面的需求。政府还可以设立专门的机构或部门来监督人工智能技术的应用，确保其规范运作。最后，政府应加强人工智能领域的国际合作和交流，与其他国家和组织共同制定国际标准和规范，推动人工智能技术的全球发展和治理，实现共同繁荣和可持续发展。

［参考文献］

［1］涂良川.人工智能的发展与青年人格的时代建构［J］.青年探索，2023（01）：34-42.

［2］刁生富，冯桂锋.媒体传播与公众的人工智能态度［J］.长沙理工大学学报（社会科学版），2018（05）：1-6.

［3］张海，刘畅，王东波，等.ChatGPT用户使用意愿影响因素研究［J］.情报理论与实践，2023（04）：15-22.

［4］方旭，许磊，窦慧敏.中学生人工智能技术使用持续性行为意向影响因素研究［J］.信阳师范学院学报（哲学社会科学版），2023（03）：79-87.

［5］徐红霞，于倩倩，钱力.基于主题模型和情感分析的话题交互数据观点对抗性分析［J］.数据分析与知识发现，2020（07）：110-117.

传播与版权2023年21期

传播与版权的其它文章: 现实场景游戏的改编权侵权问题研究; 基层融媒新闻工作高质量发展路径研究; 基于课程思政建设的新闻采访与写作课程教学改革研究; 国内外科教类期刊服务学科教学发展现状和路径探索; 高质量发展语境下职业教育类学术期刊高被引论文的特征及启示; 党建引领高校学术期刊高质量发展的实践探索