黄 克,夏 俊,郭 皓,李怀森
(江苏省广电有线信息网络股份有限公司南京分公司,江苏南京 210001)
地理信息系统(GIS)技术因其将图形数据与属性数据完美结合,具有把传统的数据库带入可视化空间的优越性,已经广泛应用于广电行业O域的网络资源管理系统(NRMS)。江苏有线南京分公司经过具体实践,提升了公司专业资源数据的管理水平,并且按照ETOM规范,使IT业务管理、生产数据管理达到新水平。行业中B域的代表系统——业务运营支撑系统(BOSS)是一个综合的业务运营和管理支撑平台,也是最直接面向客户并且融合业务的系统。
如何进行2个系统的交互共享,进行客户和资源关联查询、分析及决策,是具有现实意义的一项战略任务。客户和资源交互的交点在于地址,客户信息带有地址信息,而NRMS由于采用GIS技术,基于地图具有地理坐标。二者通过地址关联,可以由具体客户查询地理位置信息,通过地理位置,从而获取该地址客户的网络资源链路信息,进而进行资源分析;由不同区域的地理位置统计分析客户状态,业务开通状况,可以进行一系列的数据挖掘,从而指导营销决策。
BOSS系统的地址按照国家、省、市、市区、行政区、乡镇街道、小区、楼栋八级进行过一定程度的规范,由于建设时间早,早期用户的地址信息仍然存在大量的不唯一性,用户地址不规范或者冗余性较强。资源管理系统建设时期相对较晚,GIS天然含有地理信息,更加具备建立起规范化的标准地址的能力以及技术优势。
2个系统分属B域和O域,各司其职,而地址就成为了交互的纽带。为规范客户地址的标准化,促进今后公司各业务系统间通过标准地址进行信息互联,需要在资源管理系统中建立企业规范级的标准地址。这样可以使得各类资源信息有效汇总到工程、运维、客服等业务部门,共享广电网络信息资源,建设节约、高效的广电GIS,能够真正提高公司的运维水平、服务水平和运营效率。规范的标准地址管理,同样可以满足BOSS前台业务受理需求,将后端服务和数据转化为生产效益,方便公司业务受理,提升利润,为领导决策和规划等部门提供有效的数据参考。将原来已经建成的各类系统在网络资源管理系统中进行展现和空间查询、分析,避免因重复建设而导致资源浪费,完成资源共享和综合利用,是具有现实意义的。
本文依据江苏有线南京分公司标准地址的建设历程,其具体实践表明了企业规范级的标准地址建设工作是一个工作量庞大并且逐步演进的过程。由于前期BOSS中的地址级别是以楼栋为单位计算的,市区内楼栋级的地址近3万条,覆盖用户近100万,即到户地址达到了百万数量级。如果依托GIS技术,在资源管理系统中可以将3万条楼栋地理定位,去除同一楼栋不同描述,用不同的坐标点表示不同的楼栋,可以有效整理出规范化的楼栋地址,即楼栋级标准地址。将BOSS的楼栋地址和标准地址进行映射,从而将客户匹配到楼栋标准地址。
标准地址用于描述资源管理系统中的地理楼栋。楼栋标准地址首先需要建立规范,数据库中表述为一个楼栋标准地址生成一条记录,该记录在GIS中进行上图操作,即绑定地图坐标。楼栋地址的主要描述字段如表1所示。
(1)街道名称:分为2个字段描述,预留了1个字段,已确保跨2个街道的小区的命名。
(2)道路名称:分为2个字段描述,如果某楼栋属于多个道路,则从第2条道路开始的道路均填写在道路名称的第2个字段中,用逗号隔开。
(3)小区名:地址规范中的小区还包括××大厦等建筑物。(4)小区别名:如果有多个的话,用逗号隔开。
(5)楼栋名:如果是用多个单元号来表示某栋楼的话,则用单元号表示,多个单元号用逗号分隔。
表1 楼栋标准地址主要描述字段
依照上一节的规范描述来进行楼栋标准地址的建立,这其中涉及到地址清查、整理与审核。地址建立可以参考BOSS地址,资源管理系统中已经和坐标关联的楼栋信息,疑难地址由专人去现场清查并进行反馈。在楼栋地址初步整理之后,需要按照标准地址的描述方法整理出约3万条楼栋标准地址信息,按照公司管理区域进行分片,从而使各片区相关人员进行确认。核查需要确认的字段如下:
(1)行政区名。一般无异议,如果遇到某小区属于2个区的交界处,以公安部门的行政区划为主。
(2)核查街道名。如果该小区有街道名,在街道名1中填入,若没有,则不填;如有不止一个街道名,则填入街道名2中。
(3)核查道路名。道路名一般为×××路×××号,如果错了或没有,改正道路名1;如果有多个道路名,放入道路名2中,多个道路名中间用逗号分割。
(4)核查小区名。改正小区名的错误,如果有小区别名,填入小区别名中,多个别名中间用逗号分割。
(5)核查楼号。楼号有的名称为栋,则以“栋”结尾,如“1栋”,有的名称为单元号,则以“号”结尾,如果是多个单元的楼栋,单元号中间用逗号分割,如“21,22,23 号”。
(6)输入核查人。
审核确认结束,最终建立起企业规范楼栋级标准地址。
在资源管理系统中,楼栋标准地址建立完成,是统一、标准、具有唯一地理标识的。一条楼栋标准地址有一个唯一的ID号,以下简称楼栋ID,BOSS地址有文字描述,它有一个CODE编号,以下简称地址CODE,楼栋ID对应地址CODE理论上是一对多的关系。
建立BOSS地址CODE与楼栋ID的映射,是问题的关键。通过建立半智能化处理模块,并辅以人工操作处理疑难地址的映射,最终将BOSS中的客户匹配到楼栋ID中,能够根据地理楼栋分析客户信息,以及与之相关的系列应用。
映射过程也是循序渐进、不断更新的过程,数据的运维同样需要明确标准地址管理方法,建立转化标准地址的管控流程,对存量数据逐步清理,完善映射关系,对于新增地址进行更新维护,最终解决现有地址不统一的难题,为综合资源应用奠定基础。
网络资源管理系统已经建成南京城区范围内的基于楼栋的标准地址。结合已有楼栋地址规范及今后网络资源应用系统的需求,需要细化建设到户的标准地址,即“结构化标准地址库的副本对象”并且进行模型改造,以更好地满足精确到户的营销及宽带业务系统的开通。
(1)根据资源应用规划成果对标准地址模型的前期规划和建议,参考南京广电的实际资源、业务、营销网格等应用,标准地址按照指定规则进行分级描述地理位置,确定南京广电标准地址模型如表2所示。
(2)标准地址的查询。应支持百万级别不区分地址级别的快速汉字模糊查询、快速的拼音查询,查询返回时间小于1s,树形图形生成,点击每个层次时间不大于1s。
(3)标准地址逐级向上/向下检索查询功能。提供通过某级标准地址逐级向上/向下进行查询检索功能,用户可以查询到该级别地址。
表2 南京广电标准地址模型
(4)必须能够支持地址重复叫法的管理。对于道路、小区等实际情况中存在2种或者2种以上的叫法,这种重复问题的解决方法如下:
①对于重复名称的某级地址,重复的叫法作为相同等级的地址都进行数据录入(路、小区等)。
②建立重复名称间的关联关系。
③重复的地址之一,一直延续到10级,其他的就不进行扩展。
(5)同一个小区分属多个不同的区域,应能根据实际情况建立不同的标准地址。
(6)同一个道路分属多个不同的区域,应能根据实际情况建立不同的标准地址。
到户模型建立之后,需要将原有的楼栋标准地址,即存量楼栋地址,迁移到新模型中,在此基础上才能扩展到户地址。数据迁移的过程也是模型匹配的过程,其存储结构、父子节点信息、同义词信息、坐标信息等均需要一一对应。原近3万条楼栋地址迁移到新模型中,对应出来的各级地址数量达到3万7千条左右。
3.3.1 楼栋地址间的3种映射关系
前文已经提到在楼栋级标准地址建立完成之后,用半智能化处理模块,并辅以人工操作,可以将BOSS客户直接匹配到楼栋标准地址,即将客户绑定到楼栋ID。实际存在的同一个楼栋理论上对应多个BOSS楼栋CODE,但是也存在BOSS楼栋CODE在描述中不能表示一栋楼的情况,例如地址过粗或者不规范。
通过客户和楼栋ID的关系,客户能对应上BOSS楼栋CODE,可以从这百万条对应关系中梳理出标准楼栋ID和BOSS楼栋CODE的映射结果,标准楼栋ID、BOSS楼栋CODE,有3种情况,即1对 1、1对多、多对多(含多对 1),如图1所示。
3.3.2 提取映射关系加入策略库
策略库是表示标准楼栋ID和BOSS楼栋CODE之间可以信赖的对应关系。基于实际情况,标准楼栋ID和BOSS楼栋CODE3种映射关系中,1对1、1对多是合理的,将这2种关系通过数据库比对提取出来加入策略库备选,再辅以人工确认环节,最终建立起总计近6万条关系,含有标准楼栋ID近3万条。
图1 地址映射情况举例
多对多的数据通常认为是问题数据,比如BOSS楼栋CODE不能表示到一个楼栋,或者标准地址数据异常等。这些数据经过核准后提取出来,或修正加入策略库,或建议停止继续使用以另一条明确地址取代。
3.3.3 存储过程执行策略库进行自动匹配
策略库表示了2系统存量楼栋的映射关系,需要投入到客户开户或者移机后的自动匹配上来,以此建立存储过程。目前通过数据分析显示,通过JOB进行存储过程匹配,每日自动匹配客户率高于90%,即新客户入网或者移机,根据BOSS楼栋CODE,自动对应到楼栋ID,策略库的建立极大地减少了人工干预匹配的工作量。这样,实现了客户定位、客户信息统计、客户基本信息同步、地址信息同步,也增加使用GIS的灵活性与方便性,提高资源利用效率,一劳永逸。
为了避免地址的多头管理,在策略库对存量进行关系映射之后,新增地址的管控成为了当前需要考量的重要问题。鉴于已经建设了楼栋标准地址,并且进行到户模型改造和扩展的契机,资源管理系统承担建设标准地址管理平台,最终成为公司今后各业务系统间进行信息互联的规范。
目前,新增地址在资源管理系统中管理,楼栋一级的地址通过接口传给BOSS,记录该地址ID号,当客户开户或移机时,楼栋地址自动带有该ID号,到户地址进行扩充,从而实现客户到楼栋的自动匹配。
标准地址管理平台是将楼栋级地址同步给BOSS,但是还没有达到真正到户的匹配和统一。未来的地址源应该唯一,即建立选址平台,能够让BOSS直接调用选址平台的到户地址,最终完成到户地址的统一扎口管理。选址平台的运行流程如下:
(1)资源管理系统对标准地址进行统一管理。
(2)选址平台调用资源系统中的标准地址,提供给BOSS系统选址页面。BOSS完成选址后,选址平台返回地址全称和ID等标准地址信息给BOSS系统。
(3)选址平台向BOSS系统提供地址查询接口,通过此接口BOSS系统通过获取地址信息。
(4)BOSS系统向资源管理系统提供客户地址绑定接口,为资源管理系统提供客户视图基础客户数据。
标准地址从建立伊始,从楼栋到扩展到户,最终实现选址平台,不是一个一次性的过程,也不是一个断裂的分布过程,而是一个连续的并且是不断改进的循环过程,是不断演进发展的。建立选址平台采用国内行业最新的集约化管理模式,会大大降低企业的实际运营成本,为企业持续、健康、快速地发展打下良好的基础,也将会产生显著的经济和社会效益。
[1]龚健雅.地理信息系统基础[M].北京:科学出版社,2001.
[2]李满春,任建武,陈刚,周炎坤.GIS 设计与实现[M].北京:科学出版社,2003.
[3]吴丽清,蒋茂彪,张勇.基于广电GIS信息平台的扩展及其应用[C].2007国际有线电视技术研讨会论文集,2007.
[4]王丽,陈瑞玲,任宁宁,李建华.广电网络资源与用户信息资源共享的探索与实践[J].有线电视技术,2011(8).