我是清华“旁听生”

2020-05-14 13:31王春元
大学生 2020年5期
关键词:编程语言吉尼斯世界纪录刘老师

王春元

好奇心背后的思维逻辑

打开B站,找到“清华大学”账号。我屏住呼吸,小心慎点,毕竟学渣还是有自知之明的。正在纠结选理科还是工科课程时,一个标题吸引了我的眼球:“毕导:好奇心给我带来了什么?”仔细一看,这节时长60分钟的课,吸引了22.2万次播放量,1.6万次点赞,有6846条实时弹幕,评分很不错。有句话说得好:“学霸与学渣的差别往往是思维模式的不同。”于是,我打算先学一门“思维课”,打开脑洞。

主讲人是毕啸天,本科、研究生皆就读于清华,高分子材料与工程专业2014级博士,曾任2012级辅导员,被大家亲切地称为“毕导”。2016年8月又开始运营自媒体,2016年一篇文章《清华博士:“秋衣外穿”更保暖》,有高达300万的阅读量,2017年的《微信抢红包是先抢钱多,还是后抢钱多》更是火遍了朋友圈,从此“毕导”一称流传江湖。

在这堂课里,毕导从创作者的角度,跟大家分享了他一系列文章背后的创作历程。原来,看似简单的“秋衣外穿”理论,背后有传热学模型的理论分析,需要理工科的知识作为基础,才能深入浅出地解释原理。再比如“微信抢红包定律”,毕导得出的结论是第一个抢红包的永远不会是手气最佳的一个,越是排名靠后的手气会越好。看似简单的结论,背后的科学验证过程却很是波折。为了做这个实验,毕导找来5部手机,请5个人来抢50块钱的红包,前后发了150次,然后统计这5个人每一次的数据,再从750个数据中去分析,去思考……

实际上,实验的繁琐复杂倒是其次,重要的是怎么找到解决问题的方法。“微信红包先抢后抢有区别,这个规律能否被科学论证,以及如何算出什么时候抢红包是最优策略是关键。在这个过程中,关键是你是否知道应该怎么做,以及应该调动哪些知识去做。”这时候有人回复说,可以用手机做实验嘛,毕导又抛出新的问题:“那么你知道应该用几个手机去抢,抢多少钱的红包,一共需要进行多少次實验,才能消去误差,会不会存在意外情况,如果发现手机与手机之间存在误差,又该怎么消除影响……”一波波问题如海浪一般拍打着我的大脑,原来,这就是从0到1的过程,写一篇有趣的文章,背后的难度不亚于做一次完整的科学实验。

毕导说,做自媒体主要是找选题,写文章,做视频。看似简单,但为了把文章做得有趣好玩,常常要想破了脑袋,花很长时间去琢磨和尝试。“在生活中,你比别人多想一层,比别人多做一点,你就会变得很好玩,生活就会变得很有趣。”这,就是好奇心与探索的硬核内容。

这个时候,我再去反观,毕导的文章真的是科普文章吗?好像并不是如此,看完一篇文章后,我们并不能从中得到很具体的知识,学到什么科研理论,却能实实在在体会到毕导的思考能力,以及从他发现问题,面对问题,解决问题的思维方式中会心一笑。

当我们是小孩子时,常常喜欢问为什么。现在我觉得,我们成年人更应该多问问为什么,因为人类的好奇心永远都不会消失。“我希望从‘接地气讲到‘桃花源,希望从我们共同的知识背景出发,最后引你入胜,带领你到科学的桃花源,飞入到宇宙的世界。”毕导讲完这段话时,弹幕几乎都快溢出屏幕了,五湖四海的“学生”们纷纷表达着对毕导的赞许和认同。

所谓“大学之道,在明明德”。回到课程的标题“好奇心给我带来了什么”,或许,其本身就是一次思维启迪之旅。

自然语言很高级

听完毕导的课后,我的内心有点小膨胀,准备挑战一点高难度的课程。作为一名与文字打交道多年的文科生,我对互联网界的IT人才一直有迷思,好奇每天用“非语言”和世界打交道的“程序猿”到底活在怎样的世界里?每当听大家乐此不疲地谈论大数据、编程、人工智能等话题时,我的内心也是痒痒的,很想学习一些系统知识,于是,我决定从清华大学的UP主中寻找答案。

我选择了《闲话AI:自然语言理解难在哪?》这门课,开课者是清华大学计算机系的青年教师刘知远。瞧这课程的标题,就很高大上的样子。令我意外的是,刘老师通过生动的逆向思维式解说,让我很快理解了这门课的精髓。

刘老师说,交流的时候,人类用自然语言,计算机则通过编程语言。如今,人工智能已经在很多方面超越了人类,但在识别自然语言方面依然存在瓶颈。AI是由人类制造的,要让这个机器不断智能,我们就要从计算机的角度出发,不断去钻研编程语言,让它更准确地理解人类的语言,从而为人类服务。

这番话不由得让我联想到,自己在写文章的时候,经常会纠结用什么语句,什么词汇来表达,才会让读者看起来更舒适。而对于AI来说,这样的问题完全不存在。因为计算机“看到”的都是语言结构,它们对自然语言的理解,从本质上来说都是对结构的预测,只要它能从一句话中发现有结构的语义,就是读懂了自然语言。

然而,中国文化博大精深,汉语的表达更是五花八门,要让计算机准确识别人类的语言,程序员需要掌握的可不仅仅是编程语言这门单一的知识。“当我们搜索2019年的网络热词时,会弹出‘上头‘盘它‘我酸了‘我太难了等一系列词语,它们都带有创新性。”刘老师说,一位优秀的程序员,不仅要读懂字面意思,还要会读懂言外之意,不仅要学习计算机的专业知识,还要广泛涉猎各类学科文化,否则在编写代码时就不能很好地表达出自然语言的内涵。“要能字斟句酌,精准理解消除歧义;还要瞻前顾后,理解语境;同时博学广识,实现跨模态理解语义。社会性、心理学、语言学、神经语言学等书籍都要去阅读……”哇哦,这么说来,“程序猿”并不是我想象中呆头呆脑的一群人,而是一群知识渊博的语言通呢。

此外,自然语言的多义性、主观性、社会性等特点,也会让它在被计算机理解时造成困难。”刘老师在课程中举了很多例子,最令我印象深刻的要数“吉尼斯世界纪录因纪录了最多吉尼斯世界纪录被吉尼斯世界纪录纪录为纪录吉尼斯世界纪录最多的吉尼斯世界纪录”这句话了,就连我都是读了两遍才读顺的,可想而知,要通过编程让计算机去识别,的确是要好好把句子捋顺喽。刘老师说,这就是计算机语言处理过程中的难点。因此,从2013年开始,“深度学习”成为自然语言处理的一个探究领域,就是为了让AI可以更精确地识别人类语言。

如此说来,身为一名文科生,虽然不懂编程语言,但是我的内心反而有种自豪感。因为,刘老师的课程让我明白,“聪明”的AI想要破解人类的自然语言,还是很困难的。

护肤课变化学课

在接受一番烧脑的知识洗礼后,我决定还是学习点简单又实用的知识。

当我看到网站里一门名为“做好清洁、保湿和防晒,不交护肤智商税”的课程后,眼睛一下亮了起来。主讲人王植是一个肤白貌美的“小哥哥”,化学系大三的他不仅长得帅,而且声音超级温柔,还是清华大学科学护肤协会会长呢。

不过,王植可不是靠这些吸引观众的,随后的知识让我大开眼界。他说,要想护肤,先要全面客观地认识自己。根据科学分类,皮肤有4个维度,分别是“Oily/Dry”“Resistant/Sensitive”“Pigmented/Non-pigmented”“Tight/Wrinkled”。我只知道第一组油皮和干皮,没想到还有“耐受皮/敏感皮”“容易色沉皮肤/不容易色沉皮肤”“紧实的皮肤/有皱纹的皮肤”这样的分法。这还没完,这4组还可以分别组合,构成“ORPT/ORPW/DRPT/DRPW……”等16种类型的肤质。“不管你属于哪种皮肤,要想保持好的状态,清洁、保湿和防晒三个关键步骤都不可少。只要做好这3个步骤,就跑赢了99%的朋友,你看起来一定会比同龄小姐妹年轻许多。”

对于清洁这个步骤,王植说,干皮最好选择氨基酸表活和两性基表活为主的复配型洁面,以及含有甘油、透明质酸、丁二醇、氨基酸的保湿成分。油性皮肤在选择时还需要细分。油皮耐受型皮肤可选含皂基和水杨酸、白柳皮提取物、葡糖酸锌等有一定控油成分的复配型洁面,油皮敏感型则最好选用以氨基酸表活和两性基表活为主的复配型洁面……

本以为是门轻松的课,但上着上着,我越来越觉得自己上的是一堂化学课。

责任编辑:曹晓晨

猜你喜欢
编程语言吉尼斯世界纪录刘老师
“咕咚”因何加引号?
借助连环画讲故事
压力-体积转换在CFC编程语言中的实现解析
吉尼斯世界纪录
Guinness World Records吉尼斯世界纪录
Java编程语言的特点与应用
吉尼斯世界纪录
吉尼斯世界纪录
幽默的刘老师
浅谈不同编程语言对计算机软件开发的影响