文/陈健坤 武迪
图1
人工智能不仅成为业界的宠儿,也成为教育的主题词。2017 年7 月,国务院颁布了《新一代人工智能发展规划的通知》。如何将人工智能带入中学也成为热门话题。2018年5月,第一本面向高中生的人工智能教材《人工智能基础(高中版)》发布,上海交通大学附属中学、清华大学附属中学等40 所学校成为首批“人工智能教育实验基地学校”。正如工程院院士、人工智能学会会长李德毅所说,“人工智能冲击最大的行业当数教育,这就引发我们要对教育本源重新认识。教育本质上是对人脑的塑造,每节课都是一次脑认知的实践”。
人工智能已经不再是一个专业的技术,专业的课程。面对新一轮人工智能浪潮,2018 年秋季,中国人民大学附属中学在“人工智能+”系列课程里新增了“计算社会科学”的选修课,将社会科学纳入人工智能教学体系,培养学生的跨学科思维和实践能力。这门课由在康奈尔就读的陈健坤与人大附中的资深计算机教师武迪共同设计并授课。
第一次在人大附中设立这门课程,最后共有11 位同学选修,这次探索给了未来社会科学教育很多启示,在此共享。
什么是计算社会科学?为什么是“计算”?
人工神经网络的发展与应用是人工智能第三次浪潮兴起的核心动力,在科技、社会、生产、生活等方方面面取得了广泛的应用与成功。目前较为庞大的人工神经网络由多达千万个数字神经元或成百上千层神经网络组成,但与数百亿个神经元组成的人脑神经网络仍然有本质差别。人们已经能够画出部分简单生物的神经系统,如图1 所示。
高等生物——特别是人类的神经网络远比线虫的神经网络复杂,受到技术限制,我们目前还画不出来。即使画得出来,要摸清人类神经网络的运作方式也是一个挑战。
生物神经网络属于图2 的小世界网络(Small-World Network)。在这样的网络里,信息传递速度快,并且少量改变几个连接,就可以显著地改变网络的表现,对已存在的网络进行调整。人类社会中也存在这种小世界网络。
真实世界是由数以亿计的异质个体在不同维度的网络里相互作用,如图3 所示。我们目前受制于数据和技术限制还画不出这些网络,且同生物神经网络一样,即使画出了网络,要理解网络的运作方式还有很长的一段路要走。而且,社会网络分析(Social Network Analysis, SNA)只是分析、理解社会现象的一个方法。
图2
图3
人工智能的发展和数据样本量及种类的飞速增长使得很多领域,不论是自然科学还是社会科学甚至人文学科,可以去研究之前受制于技术限制无法研究的现象。计算社会科学便是计算科学、复杂性科学和社会科学交叉的领域。这个领域国内大学刚刚重视起来,清华大学也刚建立了专门的跨学科合作平台,整合了做相关方向研究的社科和计算机科学的学者。
计算社会科学在国内称为社会计算,是一个比较宽泛的概念,从研究方向定义,计算社会科学是包括了自动化社会信息提取(Automated Social Information Extraction),社会网络(Social Networks),社会复杂性(Social Complexity)和社会模拟建模(Social Simulation Modeling)四个方面的一系列社会科学分支的统称。而从研究方法和技术上定义,计算社会科学是“广泛应用计算机技术研究、认知和理解社会现象的社会学分支,包括计算机模拟、人工智能、复杂统计方法、社会网络分析技术等在内的多种手段和工具,通过多样化社会互动的基础建模方式而提出并检验的关于复杂社会进程的多种理论发现”。
我们按照学科的四个大研究方向设计了这门十节课的选修课。以下是教学提纲。
第一次课:引言:交叉学科背景下的科学研究
第二次课:大数据(1)
第三次课:大数据(2)
第四次课:社会实验
第五次课:社会模拟
第六次课:计算社会科学回顾与展望
第七次课:网络科学(1):社会网络
第八次课:网络科学(2):复杂网络
第九次课:复杂适应系统
第十次课:研究提纲答辩
考核方式:选择实际生活中的具体问题,提交一个研究提纲。
评价标准:过程性评价占30%,其中:考勤及课堂表现15 分;课堂作业及平时作业15 分;最后一次课的考核:终结性评价占70%。
在报名上课的11 个学生里,最终8 个人上完课程并提交研究设计作业。这其中,有一些学生的研究设计非常值得探讨。
如“利用代理人基模型模拟探究原创内容社区的‘劣币驱逐良币’现象 ”的研究设计。原创内容(音乐,视频,绘画等)社区是随着互联网行业兴起的一个群体,群体内的用户基于共同爱好通过原创内容互相交流。在社区发展到一定程度后会商业化,有些社区内出现了盗用别人原创内容分流流量,赚取巨额收益本的现象,导致社区优质内容降低,用户失去信心。然而,即使我们在多个社区内观察到了这种现象,却尚未有理论能够全面地解释这种现象。本研究计划在一个抽象成小世界网络的社区内以顶点(Vertex)为单位进行代理人基建模,模拟一个原创内容社区商业化之后出现的内容质量降低的现象并重点观察用户对这个社区的信心,并调整模型参数,观察不同的参数对信心变化趋势的影响。研究者已经设计好了模型初始化和模型迭代的具体步骤。
此外,其余学生的研究设计也都反映了对课上核心知识内容的理解和一定的应用能力。当初规划这门课的时候,请领域知名教授Michael Macy 看课程设计,Macy 教授觉得课程内容太多,难度过高,中学生可能听不懂。但从最后结果来看,具有良好计算机基础的学生几乎都能较好理解课程内容并且应用。有一定理科基础的学生也能听懂大部分内容。因此,我们认为这个领域想要普及给高中生的话,须将课程融入中学的计算机教学体系中。
根据开课的经验,我们的体会是,对于有能力的中学,应该把社科教学融入人工智能教学体系。人大附中将计算社会科学相关内容融入自然语言处理、建模与仿真、数据挖掘、机器学习等课程,培养学生跨学科思维。用收集到的样本作为训练集,通过机器学习来预测,可以达到很高的精度并大大降低时间和资金成本。
同时,应该从三个方面改变当前的社科教学:
1.社会科学应该作为一个整体来让学生接触
社会科学在普及教育阶段不应该细分成经济学,政治学,心理学,社会学等等。过去的一百多年里,学科被不断细分,然而在这个过程中我们却忽略了对整体的认知和理解。理解每个细节并不等于理解一个复杂现象整体是怎么运作的。社会科学本质上是用科学假说的观测、理论和验证这一步骤来研究和学习社会上的现象和问题。而信息时代也给社会科学带来了无限潜力,拉近了社会科学和自然科学从研究方法上的差距。准确地说,从Duncan Watts 发表他的小世界理论已经过去了二十一年,从领域正式定名为计算社会科学也过去了十年。
2.培养学生用知识解决实际问题,淡化社科理论教学
在我们的教学中发现,对研究社会现象、提出解决思路感兴趣的学生远远多于大学专业志向是社会科学的同学。Duncan Watts 认为社会科学的未来发展方向是以数据驱动解决实际问题的实证研究。在过去一百多年里社科学者的研究重点放在了发明新的理论,而忽略了对实际问题的解决以及对相互矛盾的理论的验证和修正。
3.充分利用并跟大学资源结合
由于是前沿领域,这门课没有任何中学阶段的教材可用,所有教材都来自大学。我们主要参考了Matthew Salganik 的领域入门书Bit by Bit和Scott Page 的Complex Adaptive Systems,并将其中部分章节做成PPT 用于讲课。通常,一节课会有自己做的简单P P T 和一个领域知名学者的材料或者讲义,比如Joshua Blumenstock 关于卢旺达数据收集研究的PPT,Duncan Watts 关于小世界理论的PPT 和David Lazer 关于计算社会科学领域的PPT。
这种教学方法,更好地培养了学生对社会科学领域研究方法和现状的了解以及对社科复杂性的认知。
跨领域思维的培养一定是建立在学生有良好理科基础上的,而目前来看融入人工智能教学体系最为现实。所谓的“文理交叉”,不论是电子人文,社会计算还是认知科学、哲学、机器学习交叉的学科都需要学生具有良好的理科基础。斯坦福,卡内基梅隆等大学开设了C S+X(人文学科)的专业,康奈尔大学有信息科学(Information Science)。
我们计划今年秋季学期继续开设这门课,并打算编写一本针对高中生的校本教材,在相应章节配上更多让学生动手、自己实践理解的环节。同时,积极和相关领域学者联系,从而得到更多技术上的支持和反馈。此外,期待从计算社会科学的广泛研究问题中,精选、简化一些可以融于高中教育阶段知识水平的、具有突出育人价值的教学实例与真实问题,真正将关系未来的社科研究纳入国家重视的人工智能教育体系,培养学生的高阶跨学科思维。