在2020年新冠肺炎疫情防控期间,为保障“停课不停学”的顺利开展,教育部与各家网络科技平台相继推出了服务于大中小学生的网络课程学习平台。报告指出,“停课不停学”以来,国内在线直播教学学习平台表现相对稳定,得到了多数学校的认可和应用,如国家中小学网络云平台、腾讯课堂、钉钉、Welink、中国大学MOOC直播平台、ZOOM、学而思、网易有道、超星直播客户端、超星学习通同步课堂、优课联盟、优学院、高校邦平台、好大学在线、Cctalk、UMU、智慧树等。通过调研分析不难发现,不管是在产品功能还是服务方面,各个平台并未真正地拉开差距。每家都有自己独特的服务方向,不同的只是服务方式上的大同小异。
报告显示,在线教学平台的功能要求目标包括可直播、可交互、不卡顿、低延迟、不掉线、无宕机等。其业务架构整体来说包含3层,第一层是数据源,其中包含接结构化数据库、缓存数据REDIS、混存数据等;第二层为功能模块组合,包含常规的课程任务、考试任务、权限服务、考点服务等;第三层是数据分析检索平台和网校管理平台,以及Web和APP的展示平台。
据报告分析,在线教学平台提供基础内容的技术前提保障主要呈现出三个特征:一是呈现知识的客户端包括PC、手机、Pad等;二是教师和学生的通信网络需要保障2M以上的带宽,服务商需要1T以上;三是服务器多依赖于第三方的云服务平台来提供,如百度云、阿里云、腾讯云、华为云等。报告对百度智能云、阿里云、腾讯云、华为云四种云视频会议系统进行了对比分析得出,四种视频会议软件均能够支持同时参与会议人数在300人的会议,其中腾讯会议、钉钉、华为WeLink目前对于30人以内的视频会议均能够免费使用,足以满足大多数日常會议,均推出专业版满足企业客户的需求,专业版同时参会人数支持到300人以上,均不限时长、不限次数。
在大规模在线教学开展初期,“平台崩溃”的消息不断在网上传出。报告对在线教学平台的崩溃原因进行了分析,主要包括以下几种。
一是因适配崩溃——在主播推流端。如今移动端手机直播占据着网络视频直播的主要地位,主流的手机系统无非就是iOS与安卓。相对而言,iOS的机型较少,在进行直播App制作时比较容易适配,而安卓手机厂商众多,手机型号众多,需要进行大量的机型适配、版本适配等。如果适配工作做不好,直播系统的运行就会崩溃。
二是高并发、突发性流量增长崩溃。在内容分发网络(CDN)中,用户可以就近获取所需内容,解决网络拥塞、延迟较高的问题。但是遇到突发性流量增长,分发网络难以扛过流量高峰,对于用户出现的卡顿、延时、花屏等问题,内容分发网络负载超标,难以均衡,不能保证用户访问速度和系统稳定性。
三是终端播放适配崩溃。观看直播的用户端是最终环节,推流过程中所有问题会集中在这里“爆发”。而播放器作为直播系统直面用户的关键一环,直播App制作人员需要做多种分辨率的适配方案,只有在用户直播观看分辨率和直播流畅度之间找到合适的平衡点,才能给用户带来最佳的直播观看体验。用户激增状况下,系统难以满足在用户直播观看市场分辨率和直播流畅度之间找到合适的平衡点。
四是盲目扩容导致应用服务阻塞。对于接入层、应用层、资源层没有系统地扩容。遇到用户激增,造成资源层的服务响应时间过长,也会造成应用层对外的请求响应失败,重试请求会继续涌入,当数个应用服务因过量请求阻塞后,外部请求会落入其余应用服务上,于是就引起“雪崩”效应,所有服务就都会崩溃。
五是限流降级流于形式,致使服务器压力过大。限流降级本身是两个不同的技术点,但是限流就是有损服务,有损服务又必须有良好的降级方案去应对。限流从接入层到资源层都需要面对,降级更是需要在系统架构设计之初就需要考虑。在服务器量级不变的情况下,此次的用户激增单纯从限流降级的层面去处理根本不足以解决问题,直接导致服务器压力过大崩溃。
报告结尾对在线教学平台建设和发展提出了如下总结和建议。一是基础平台搭建需要过硬的平台服务商。没有过硬的基础平台体系,想获得稳定的产品基本是空中楼阁。稳定的基础平台是需要时间积淀、不断趟坑才能获得的。二是满足高并发的架构必然带来极高的研发成本以及运营成本。高并发不是架构方案的模仿以及想当然的扩容,它需要架构与业务的深度结合、认真的压测准备以及团队的整体意识提升。三是全栈式一体化解决方案是刚需。教育主管机构和学校应当尽可能选择门槛较低、集成度高、覆盖IaaS、PaaS到SaaS的全栈式一体化解决方案,以公共云的方式进行搭建,降低人员技术需求、降低安装部署难度、提高系统验收上线速度。四是弹性收缩的云端避免资源浪费。云上的弹性扩展不仅仅是应对峰值那么简单,传统的虚拟化技术存在大量“峰值后浪费”,造成对资源的严重浪费,随着云原生技术的普及,容器成为弹性扩容的新选择,结合DevOps体系,既能够弹性扩展,又能够弹性收缩。此外,云上正在兴起的Serverless,面对流量突增和突降,可以在保障应用可用性的同时,降低波谷引起的闲置计算资源。五是多人互动教学、学生交流式学习等多种形态,未来可能还会有更多的新形态出现,这意味着在线教育的技术需求堆栈是极其复杂而且未知的,可能从支持万人在线、多种交互到自动翻译等不一而足,在线教育企业需要云上快速迭代的创新解决方案。
(徐靖程摘编)