左毅 孙卓
摘要:近年,大量的数据朝着公开化发展,很多数据已经可以在网络上直接进行存储、读写乃至计算等操作。随之而来的大数据时代和云计算时代,要求学生具备效率的数据存储能力、快速的数据处理能力以及有效的数据分析能力。因此,在教学中针对以上三个主要问题,将引入云存储和云计算等新一代信息技术,并结合航海特色对实际数据进行存储、读写和分析等处理。使学生在大数据时代和云计算时代,掌握实际应用的一系列相关技能和技术。
关键词:云存储;云计算;大数据;航海科学与技术;AIS数据
21世纪是海洋的世纪,“向海则兴,背海则衰”已在世界范畴形成广泛共识。2019年,交通运输部联合中央网信办、国家发改委等7部门发布《智能航运发展指导意见》,同样为智能航运未来30年发展指明方向,要求以一流的技术、一流的管理为“一带一路”建设服务好,提升港口码头和航运基础设施的信息化智能化水平。根据《智能航运发展指导意见》,将通过融合大数据、云计算、人工智能等新一代信息技术、建设“1个平台+N个应用”的综合智能航运示范工程,以突破关键技术瓶颈,填补国内交叉学科领域的空白。
一、新技术需求下面临的主要科学与技术问题
在各行各业都热烈拥抱人工智能,推动数字化改革的创新新时代,航运业的信息化、网络化乃至智能化的发展略显滞后,甚至出现与时代脱节的种种迹象。究其原因,主要体现在以下几个方面:
(1)现有的船舶管理多集中于线下服务、以人工为主,航企亟需从传统的粗放管理模式向信息化的精细管理模式转变。
(2)由于航运业务建设的阶段性,业务数据呈现出多样性,采用不同的存储方式,使得数据多源异构问题尚未得到根本解决,航运数字化进程推展缓慢。
(3)缺乏深度挖掘海事大数据价值的系统性技术和智能化方法,在数据计算、结果分析以及决策支持等方面仍存在一定的技术性空白亟待填补。
二、新时代引领下航海类创新人才的必备条件
在“十四五”和国家一流学科建设规划中,明确提出了“兴海强校”发展战略,并把海事大数据以及航运通用人工智能等作为学科建设的重点科研发展方向。本课程旨在通过整合学校优势资源,围绕主要研究方向开展联合攻关,以高素质拔尖创新人才和学际融合数据科学家培养为首要目标,以建成交通运输工程以及海上信息工程领域航海类人才培养高地为最高远景。
(1)通过引入数据库基础知识,使学生掌握数据的结构化特点,并能够掌握效率化的存储、读写等技巧。
(2)通過引入统计学基础知识,使学生具备数据分析能力,并掌握基本的数据可视化技术。
(3)应用实验室的云平台,使学生掌握云存储、云计算、机器学习等相关技能。
三、新一代信息技术在教学中的应用实践
本课程立足于新一代信息技术、交通运输工程与计算机科学的交叉学科领域,推动技术进程和产业进程交互发展,培养航海类学生在大数据、云计算和人工智能三个方面的理论应用与实践创新。
3.1 AIS数据的云存储
AIS(Automatic Identification System)即船舶自动识别系统,是一种不依赖于雷达的助航系统,将船舶的航行信息包括经纬度、航速、航向等信息实时的传送至AIS基站以及附近船舶,多用于船舶航行监管以及会遇预警等方面。在船舶高速行驶中,AIS的传输频次高达2秒/次,即使在使用信息压缩等技术前提下,依然会产生海量数据,也使得AIS数据成为真正意义上的大数据。本课程中,将通过非关系型数据库来对AIS数据进行存储,并将AIS数据库置于云端服务器,解决多用户同时访问带来的高并发问题。同时,课程给学生提供多样化的终端访问,包括个人电脑和智能手机,让学生可以随时随地的访问AIS数据,并对数据进行各种操作。
3.2 AIS数据的云计算
在存储空间受限、以及通信实效性高等前提要求下,AIS数据通常采用了压缩编码的方式进行存储,仅在需要的时候,利用解码技术将数据转化为实际的AIS数据。通常需要转化的数据包括:记录时间、经纬度、航速和航向。授课中,学生可以通过各自的客户终端对服务器云端的数据进行直接访问,根据船舶的MMSI(Maritime Mobile Service Identify)水上移动通信业务标识码提取目标船舶的航迹信息。之后,根据各自需求,可以将提取的AIS数据下载到本地,以便后续进行分析。
3.3 AIS数据的应用实践
本课程在应用实践方面,将引导学生自主完成基于AIS数据的航迹预测专家系统建立,包括以下3项内容:
(1)AIS数据的预处理:主要是剔除AIS数据中异常点的过程,包含位置异常点、航速异常点以及航向异常点。位置异常点通常指航迹位置信息超出目标区域边界,通过边界约束条件来剔除异常点;航速异常点和航向异常点通常指相邻两点的航速/航向变化超过规定阈值,通过阈值来判定并剔除异常点。
(2)航迹的特征提取:通常采用的方法有DP法(Douglas–Peucker algorithm)和LCSCA(Least-squares Cubic Spline Curves Approximation)最小二乘三次样条拟合算法,在保持航迹复现率的情况,优化航迹的简化率。
(3)航迹拟合及预测:为学生提供线性回归、支持向量回归以及人工神经网络等方法,让学生自主完成航迹预测模型的建立,形成从数据的存储读写、计算分析到应用实践的体系化闭环培养模式。
四、结语
随着大数据、云计算、人工智能等技术的推进,各行各业在规划、管理、决策等方面都要以大数据分析为基础,依托云计算平台的支撑,通过基于人工智能的专家系统来提供决策支持服务。因此,在推动技术进程和产业进程交互发展的双轮驱动下,满足产业发展需求的数据科学家成为新一代信息技术时代最为紧缺的人才。所以,本课程以培养能够科学地分析各行各业大数据的专业型人才为目标,使学生们掌握云存储和云计算等实际应用的一系列技能和技术,为学生们提供数理统计、计算机科学、人工智能等交叉学科领域的跨学科教育体制,拓展他们的学术视野,助力他们成为新一代学际融合数据科学家,为各行各业提供高素质拔尖创新人才。
参考文献:
[1]交通运输部.智能航运发展指导意见.交海发〔2019〕66号,2019.
[2]李建中、王珊.数据库系统原理.电子工业出版社,2008.
[3]刘志红. Excel统计分析与应用.电子工业出版社,2016.
[4]Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer,2006.
本文系辽宁省教育厅普通高等学校校际合作项目委托课题“研究生联合培养”(10151)的成果之一。
作者简介:
左毅,大连海事大学航海学院特聘教授/海事大数据与航运通用人工智能协同创新中心主任,博士研究生,从事数据科学、机器学习、人工智能等研究;
孙卓,大连海事大学交通运输管理学院教授,博士研究生。