王一鸣
摘 要:如今,很多上班族和學生将共享单车作为出行的首选工具。每一辆单车都配有一个智能锁,通过运营商的无线网络,连接到单车企业的系统平台。数以千万计的共享单车为市民出行带来了便利,也给通信网络的性能监控和运营带来了新的挑战。文章旨在通过对共享单车应用的系统架构、业务机制进行研究,对行业终端(智能锁)的通信行为进行分析,掌握共享单车的解锁、闭锁流程,提炼出业务流程中的网络行为模型,并建立针对应用的网络性能指标体系,最终利用自动化的大数据分析平台,开发出一套行之有效的业务监测系统。
关键词:共享单车;物联网;智能锁
1 共享单车概念
1.1 共享单车发展简史
20世纪60年代,共享单车的概念就已经产生。
21世纪初,企业使用电子设备和计算机系统对单车进行管理和调度,借用单车的人可通过专用的电子卡,在存放站中解锁固定的桩锁,取走单车。
2015年,一种新兴的共享单车模式(文章研究的重点)出现:每辆单车配有一个可联网的智能锁,车子的存放不再需要专用的存放点和固定桩。
1.2 共享单车的应用特性概述
从产品的技术角度来看,2015年出现的共享单车,其核心部件—智能锁具有网络信息化的特征,是一种“智能互联产品”[1](也称为智能终端或物联网终端)。通过远程通信,应用系统可以控制、管理智能终端,也可以接受手机请求,向其用户提供相应服务。
从通信的技术角度来看,各类“共享”产品,是“M2M”应用的突破性延伸。“M2M”原指“机器和机器之间建立连接”[2],将两端(云端和终端)进行连接,而共享应用涉及三端(智能终端、云端、用户端)的信息协同,其业务流程复杂程度更高,对通信质量要求也随之提高。
1.3 运营商面临的挑战
自2017年开始,在全国范围内,千万级别数量的共享单车连接到运营商网络,并向全国用户提供共享服务。和普通个人用户及手机终端不同,共享单车在网络中需要时刻保持数据业务的连接(有心跳报文机制)、对特定通信业务有着非常高的质量要求(下发解锁指令的短信);同时,它们在某些城市热点地区中集中度高,(租车)业务并发的情况也较多,从早到晚的业务/通信活跃度一直较高。它的业务特性,向运营商的网络质量保障提出了挑战,运营商需要特别针对这个千万级别的应用,重新分配或扩展网络资源,并针对某些关键业务的信息交互,调整通信质量指标,进行网络预警监控。
1.4 研究目标
文章旨在通过对具有代表性的物联网应用(共享单车)进行研究,分析这一行业应用的技术特性,构造“业务-网络”的质量模型,并整理出专属的网络质量指标集。同时,面对海量的物联网终端数据,开发高性能的大数据分析工具,监控业务并探索面向行业用户的网络运营新模式。
2 共享单车发展的时代背景
2.1 信息产业背景:物联网进入蓬勃发展的阶段
20世纪90年代,“物联网”的概念由美国麻省理工(Massachusetts Institute of Technology,MIT)的Kevin Ashton教授首次提出。此后,各种传感、通信、控制及计算等信息技术,被运用到各行各业的生产和商业活动中,也渐渐渗透进人们的生活,各类智能家电(扫地机器人、智能音箱等)逐渐成为家中一员。在物联网技术的帮衬下,新兴商业模式的生命力开始展现。
通过物联网技术,企业能够更低成本、更高效率地进行资产管理、远程控制、数据采集和分析;能够分享产品价值,让消费者从中获利;还能够从产品的生命周期中获取使用数据,用以优化应用系统,实现产品迭代。
2.2 通信行业背景:运营商的“大连接战略”
在2019年,“中央经济工作会议”提出了一项重点工作:加强人工智能、工业互联网、物联网等新型基础设施建设。中国希望通过信息化基础设施的铺垫,加快各类信息应用的落地,在传统行业领域中构建新业态、探索新模式、融创新技术,推动传统企业生产、管理和营销模式变革。
在此背景下,中国移动(中国三大电信运营商之一)提出了“大连接战略”“进军”物联网领域。2019年年底,中国移动的物联网连接数超过6亿。面对日益庞大的物联网联接规模,移动网络部门开始探索建立针对物联网的新支撑体系。
2.3 网络运营背景:传统维护模式的特性
运营商围绕网络质量开展网络维护工作:网络建设阶段,通过严格遵循国际网络技术标准(例如3GPP规范)来保证网络服务的整体质量;网络运营阶段,维护工作主要是监控并处理网络故障、分析网络性能并进行网络优化。
传统网络维护工作采用标准化、专业化的精细分工方式。在通信行业的各个细分专业领域(计费、网管、无线、核心网、传输网、数据网等)之间,形成了相对独立的生产分工和环节。
网络部门在投诉和故障处理方面,采取反应式、人工化的问题解决机制:一方面无法实时地发现用户使用中存在的问题;另一方面,技术排障采取耗时耗力的人工查证方式。
2.4 物联网大发展背景下的网络运维挑战
如今,面对千姿百态的智能终端及行业应用,电信运营商传统的通信技术规范和质量标准,已经难以衡量现今及未来的网络服务质量;专注于网络、各自为政的维护模式,也不再适用于日新月异的网络应用。
首先,为满足信息化应用创新的各类需求,网络运营者首先需要深刻理解垂直领域的场景化、个性化需求,掌握客户行为,明晰业务流程。其次,探索新颖的网络管理模式和手段,建立“从应用到网络”的系统化质量保障体系。最后,将业务/网络信息糅合成一个整体,向个人和企业用户提供更为完善的网络信息服务,成为在国家战略框架下互联网/物联网技术创新的基石。
3 共享單车的技术架构
共享单车是一个典型的“物联网+互联网”应用。应用的一边是车(物)、另一边是用户(人),通过云端的应用系统控制终端(单车)来向用户提供租赁服务。
本文将简单地解构共享单车的技术架构,并梳理其主要业务环节的信息交互流程。共享单车应用的网络架构如图1所示。
3.1 共享单车的“云端应用”
3.1.1 云计算和平台服务
共享单车的云端应用建立在云计算之上,一方面能够保证应用的快速部署和高扩展性,另一方面能够应付大规模高并发场景,满足百万级数量的连接需要,可实现大规模的、实时的双向信息交互,并有利于对单车的集中管理。
在云计算之上,共享单车的应用系统还会还会使用平台服务(Platform as a Service,PaaS),使得应用能够动态调配资源和能力,并实现功能的灵活开发。
3.1.2 集成化的应用
在共享单车应用的全部功能中,还包括了许多外部的互联网功能(例如支付、二维码应用、电子地图等)。应用系统整合了大量内外部的信息化能力,将单车和用户连接起来,完成一套完整的租赁服务流程。
共享单车应用需要存储并管理两类关键数据:单车数据和用户数据。其中,单车数据由智能锁通过电信运营商网络送达到云端系统,包括单车的通信连接状态、地理位置、车锁状态等。
3.2 “智能锁”的通信模块和单车数据
共享单车内的通信模块包括:移动通信芯片(Modem),内置电信运营商的SIM卡,负责与云端的应用平台进行通信;蓝牙通信模块,主要用于直连用户手机并实现解锁;全球定位系统(Global Positioning System,GPS)通信模块,用于地理定位。
单车数据由智能锁通过电信运营商网络送达云端系统,包括单车的通信连接状态、地理位置、车锁状态等。
3.3 共享单车的主要业务(信息交互)流程
共享单车依靠在“单车-云端-手机”之间的信息传递,来完成租赁服务,主要包括3个租用环节和一个管理环节(解锁、骑行、闭锁、闲置)。其中,最关键的是解/闭智能锁的两个环节。不同共享单车企业的解/闭锁流程具有一定的差异性。
主流的解/闭锁方式有两种:“短信&流量”和“蓝牙”。其中,短信方式的解锁是需要通过运营商网络下发全球移动通信系统(Global System for Mobile Communication,GSM)短信来实现的。蓝牙的解锁/闭锁则由手机和智能锁直接通过蓝牙连接和交互,不经过运营商网络。
本研究的解/闭锁流程主要为短信解锁和短信/流量闭锁。短信方式的解锁流程:
(1)手机扫描并解析智能锁上的二维码,向应用发起解锁请求。
(2)应用核查用户和单车的信息,再通过短信方式将解锁指令发送给单车,智能锁开锁后向云端回复“解锁成功”。
(3)应用开始计费,并通知用户手机。
3.4 骑行环节的数据上报
在用户骑行过程中,单车和手机会将各自的GPS定位信息上报。短信或流量方式的锁车、还车流程:
(1)用户锁车后,由智能锁(通过短信或数据流量)通知应用:“还车成功”。
(2)应用通知用户手机,并结算费用。
(3)智能锁在还车后将位置信息上报。
3.5 闲置状态下的“心跳”业务
共享单车通过通用分组无线服务技术(General Packet Radio Service,GPRS)网络,周期性地将状态数据和位置信息向应用系统上报,周期间隔为1~4 h。
4 面向行业应用的网络运维体系
本文通过深入研究(共享单车)关键的环节及步骤,从关键步骤中寻找到关键的网络行为;基于网络行为的数据统计,制定出网络质量指标集;开发相应的信息处理系统,对网络行为的数据予以采集和分析,并反馈到相应的监测预警系统。通过探索面向行业的网络支撑模式,为以后针对其他行业领域的业务监测和网络运维积累经验。
4.1 整理业务环节中的关键步骤和网络行为
网络连接是共享业务的基础。在共享单车应用中,智能锁和用户手机都需要和单车应用服务器建立通信连接并交互信息。
根据上文分析,共享单车各类业务环节包含着一系列的信息传递和处理过程。在运营商网络中,每个业务的信息交互步骤,可以对应到不同的网络行为。如表1所示。
4.2 各网络行为的重要性分析
基于业务环节和网络行为矩阵表,对各环节各步骤终端的网络行为进行重要性(关键性)分析。
4.2.1 网络附着行为
“网络附着”是运营商网络对智能锁中的客户识别模块(Subscriber Identity Module,SIM)进行鉴权和功能配置,是所有通信行为的前提。
当SIM欠费停机、功能失配,或共享单车位于信号弱覆盖、无覆盖地区时,会造成附着失败。
4.2.2 解锁环节中的网络行为
从《业务环节和网络行为矩阵表》中可以看出,解锁环节是企业和个人用户(单车租户)最关注的环节。在解锁环节中,终端侧的“短信接收”“行为特质动态衡量系统(Professional Dyna-Metric Programs,PDP)激活”和“传输控制协议(Transmission Control Protocol ,TCP)连接”建立,用户侧的“域名系统(Domain Name System,DNS)查询”“TCP/超文本传输协议(Hypertext Transfer Protocol,HTTP)连接”建立,是5个关键步骤。任何一个步骤出现问题,都有可能造成解锁失败。
(1)“解锁(短信)指令下发”的网络行为:由运营商物联网专用的短信中心向单车智能锁发送解锁短信。
(2)智能锁的“应答解锁指令”:先由智能锁建立PDP连接(建立数据面承载)和TCP连接(连接到应用服务器),再向应用平台推送“解锁完成”消息。
(3)在读取过单车二维码后,用户手机会先发起DNS查询共享单车的应用服务器地址,然后向服务器发起TCP/HTTP连接,最后发起业务请求(租用申请)。
一般情况下,用户手机通过4G无线信号(LTE-EPC网络)连接网络,并一直处于PDP激活状态;智能锁通过2G无线信号连接网络,空闲环节的大部分时间内不激活PDP连接,在收到解锁信息(短信/蓝牙)后再激活PDP连接。由于网络和业务特性的差异,用户侧网络行为的可靠性、稳定性,比终端侧要高。在5个关键步骤中,“终端侧”的网络行为(步骤)相比“用户侧(手机)”更为重要,更值得关注。
4.2.3 其他环节中的网络行为
在其他环节中,终端和用户手机的网络行为以“保持联接”为主,如在这些环节遇到使用问题,则对用户体验影响较小。
4.2.4 识别关键网络行为
基于以上分析,可整理出共享单车关键的网络行为:
(1)向智能锁发送解锁短信。
(2)在运营商核心网中,智能锁激活数据链路(PDP激活)。
(3)智能锁和应用平台服务器建立TCP连接。
(4)单车租户的手机查询应用服务器地址(DNS查询)。
(5)手机和应用服务器建立TCP/HTTP联接。
(6)共享单车在所有环节中的“网络附着”。
其中,(1)和(2)最重要。
4.3 网络行为的数据采集与处理
4.3.1 网络行为的数据采集
经过调研,5种行为数据可以从相关的(网管)采集系统中获取。对于“TCP连接”,由于智能锁使用GPRS网络进行联网,其配套的网管系统未建设,所以不具备信令及数据报文的采集能力。
在采集系统的数据库中,通过对关键标志信息的数据筛选(例如号码APN信息、TCP连接的服务器地址等),可以提取出共享单车应用的全量网络使用记录和统计数据,如表2所示。
4.3.2 共享单车的网络质量指标集
在获取共享单车网络行为的全量数据后,结合地域信息、时间维度,可以对共享单车业务质量的整体和细节进行统计和分析。
运营人员选择并制定与(共享单车)业务现实场景密切相关的网络指标,包括:车辆活跃数、附着成功率、短信解锁成功率、PDP激活成功率、数据流量统计、用户APP连接成功率、用户APP DNS成功率等。其中一部分有正常参考值如表3所示。
4.3.3 智能锁业务质量问题定位
当共享单车出现业务故障时,对智能锁(单车)的问题界定相对较难,原因如下:
(1)终端不会主动上报应用错误。
(2)终端数量巨大,故障初期难以发现问题。
(3)业务测试困难,故障定位困难。
因此,需要进一步开发自动化工具,对智能锁出现的网络错误进行采集、统计和分析,以此来快速、准确地定位业务或网络故障。
在网络交互过程中出现差错时,应用的各端(终端、应用端、客户端)会产生相应的错误码,对错误码的采集和统计,可以帮助运营人员及时发现业务异常,并进行初步的排障,大幅提升故障定位的速度和准确度。
网络故障的错误码,可以在信令采集数据(网络原始数据)中提取和分析。“短信”和“PDP激活”的错误码为重点分析对象。
短信错误码统计分析:短信下发失败主要由用户与无线原因引起(占比:90%),包括“用户不在服务区(包括终端寻呼无响应,75%)”和“用户存储溢出(15%)”。在日常情况下,短信的成功率在98%左右,当短信成功率、短信数量出现波动时,可以通过对短信错误码的统计,结合短信中心自有的日志记录,来初步判断短信故障的原因。
PDP激活错误码统计分析,PDP激活失败的原因可分为3大类9个小项目。
(1)終端系统类:用户掉电、终端无配置信息、流程超时。
(2)业务数据类:无效消息类型,位置APN,请求服务选项未签约,用户鉴权失败。
(3)网络及其他类:激活拒绝、其他。
在日常情况下,PDP激活的整体成功率在99%左右,且失败原因主要集中在终端系统类(50%左右)和业务配置数据类(40%左右)。当PDP激活成功率出现波动时,失败原因可用于初步定位故障。
4.3.4 可视化呈现
对于成功率类、总数类的网络质量指标,可以将做成趋势图的呈现形式,以便于通过纵向比较,发现异常情况。
在一个区域内租赁业务的活跃程度,可以通过业务行为(解锁)热力图的方式呈现。热力图能够直观地展现区域的业务量,在出现故障时也方便判断是否存在区域网络问题。
5 结语
首先,文章深入研究共享单车应用的网络架构和业务流程,分析业务质量与网络行为之间的关联,筛选出关键的网络质量指标,并形成指标集;其次,针对终端侧故障对错误码进行分类统计,纳入排障的分析模型中;再次,通过对网管系统的扩容和二次开发,可以做到自动化、准实时地采集业务数据、提取网络行为信息、计算关键网络指标、可视化呈现业务状态及提供故障分析服务;最终,形成针对行业应用(共享单车)的网络质量监测体系。
经过多次的迭代,质量监测系统逐渐趋于完善,并且可以向其他系统推送分析数据(例如集团的“一户一案”业务平台),形成跨省跨部门的信息分享和联动机制,为保障物联网业务提供了有效支持。
在物联网应用中,终端的标准不统一,信息交互的模式千差万别,业务涉及的系统和环节诸多,且多数的系统和终端自身(故障)感知能力较弱,又很难进行网络测试。通过对共享单车网络架构和质量监测体系的研究和开发,可以为保障其他物联网应用提供借鉴,探索并创造面向行业应用的网络运营模式,为万物互联时代的到来做好准备。
[参考文献]
[1]迈克尔·波特.迎接第三次IT浪潮[J].哈佛商业评论,2015(2):24-25.
[2]JAN H,VLASION T,CATHERINE M,et al.从M2M到物联网(架构、技术及应用)[M].李长乐,译.北京:机械工业出版社,2016.