出版业数据交换发展现状研究

2021-11-07 11:43王宇
全国新书目 2021年9期
关键词:出版业

王宇

摘要:随着信息时代的快速发展,企业对数据交换(EDI)的需求增加,数据交换已成为企业间相互传递信息、订单、票证等业务中必不可少的环节。本文主要介绍了数据交换的发展及现状,简单分析了EDI目前在出版业应用中遇到的问题,提出了需要研究的方向,使EDI在出版业快速推广及应用。

关键词:出版业;通用数据交换

一、数据交换概念

EDI,全称Electronic Data Interchange,译名:电子数据交换。EDI 的定义至今没有一个统一的标准,但在以下三个方面是相同的:①资料用统一的标准;②利用电信号传递信息;③计算机系统之间的连接。

1.传统EDI

传统的EDI是可以将数据信息进行统一规范、统一格式化后,通过计算机与计算机网络互联传输处理。这样,便取代了以往传统贸易中通过人工传递各种纸质单据、票证的方式。发送方通过制定通用标准格式编制信息报文,并用计算机可识别的语言方式将相关信息按照规定的协议标准进行文件网络传输。接收方按照统一的、规定的语法对传送过来的报文进行处理,通过中间转换系统(如信息管理系统、信息处理系统等)完成信息报文的自动互换及处理。EDI系统的广泛使用,可以减少人工成本、数据处理成本,避免了数据重复录入,节约了交易时间。但是,传统EDI也存在一些弊端:

第一,EDI数据并不是通过统一的、固定的标准进行交换,需要结合各个专业、行业、国家和国际等标准进行交换,绑定规则死、缺乏灵活性,不易于后续的修改。

第二,由于各企业对定义EDI的标准进行选择,导致EDI相容性很差,无法通用,需要针对每个企业的EDI做相应的开发。

第三,费用昂贵。由于传统EDI相容性差、绑定规则死等因素,导致企业需要对现有的系统进行改造升级,其昂贵的费用对一般的中小企业来说很难承担。

2.基于XML的Internet EDI

随着互联网1.0到2.0的快速发展、“互联网+”的时代到来,企业对数据交换的需求与日俱增,便捷的、低成本的新技术随之诞生,采用XML/EDI方式进行数据交换方案,其优点在于:①具可扩展性,XML可以按照需要随意制定自己需要的标记;②独立性,XML与平台、语言和协议无关,数据独立;③简单易学,标准公开;④多语言版本支持。

二、出版业数据交换发展现状

21世纪以来,进入“互联网+”时代,传统出版业正积极变革、推陈出新,实现融合发展,在实现融合发展的进程中,出版企业存在大量數据交换的需要,不仅有来自企业内部的数据交换,还有大量的企业对外数据交换。业内专家指出,数据资产的整合和利用是出版企业提高核心竞争力的关键因素。

当前,电子数据交换技术在出版业的应用,间接推动了出版行业元数据应用及出版发行数据的共享与使用,对加快出版发行数据共享体系的建设起到了重大作用。实际应用就是将EDI系统引入到出版社、图书经销商、图书馆,乃至它们的自动化信息管理系统中,将图书信息依照图书行业的标准格式,通过格式转换软件转换成一种标准的中间文件,生成EDI电子数据,利用通信软件、FTP或电子数据交换平台,以电子信息的传输方式,进行数据的交换工作。数据接收方在接到数据后,再通过翻译软件将数据翻译为自己内部自动化信息管理系统可识别格式的文件,在内部系统中直接处理,这样就避免了信息重复输入、减少数据差异及降低信息传送延误等问题,提高了作业效率,并对出版行业的数据标准化进展起到有力的推动作用。[1]

出版业数据交换领域普遍采用“FTP+XML”模式。基于此模式开发出来的接口是“软件代码与业务代码交织在一起”的,任意节点业务规则发生变化,所有接口都需要重新设计。因此,此种数据交换模式无论是研发费用,还是后续的修改和维护成本都是相当高的,超出了大部分出版企业的可承受范围。

三、出版业数据交换存在的问题

从出版产业的信息化及数据交换现状来看,存在以下四个急待解决的问题。

1.投入费用高

出版企业为了实现既定的数据交换需求,需待交换的双方协商达成交换共识,并就交换规则形成一对一方案,再委托技术厂商进行接口开发。以出版产业内ERP系统为例,当其要与“三大电商”(亚马逊、京东商城、当当网)、新华省店系统、馆配商系统(人天书店、武汉三新、山东中教、百万庄图书大厦)等销售平台实现数据交换时,其需投入的资金是惊人的。

按业内某ERP研发厂商的报价方案:

基础平台费6万元;电商平台每家5万;新华省店系统或馆配商系统每家2万。

所需投入接口开发或使用费为6万元+3*5万元+26*2万元+4*2万元=81万元。即出版单位若要实现以上有限个数的数据交换需求时,每家至少需要投入81万元。

按全国登记在册的584家出版社计算,共需投入费用为81万元*584=4.7亿元。可见需要投入的费用是相当高昂的,而且这还未计算每家需要的硬件投入和维护成本。因为费用过高,导致很多出版企业还在使用传统人工方式在企业内部及企业外部进行信息的传递。

2.绑定规则死

当前,在业界采用的“FTP+XML”进行数据交换的模式中,数据的获取已经实现了与系统业务规则无关性,可以自由读取发送方发送的数据,但为了保证数据写入的有效性,只能沿用与数据接收端的系统业务规则相一致的代码进行写入操作,接口中固化了大量业务规则代码。这就带来了一个严重的问题,一旦数据接收端因系统升级或迭代等原因造成业务规则或逻辑变化时,整个接口就得重新开发,引发新的开发任务与费用投入。在这种机制下,需要接口开发人员对双方的业务规则有准确的了解和把控。显而易见,任何一个技术厂商只能掌握有限数量的系统业务规则,不可能掌握所有系统的业务规则,一旦对业务规则的掌握有了偏差,就会产生严重问题。因此行业迫切需要一个“既能遵循业务规则又能将业务规则与接口适当分离”的新接口规范和新运作机制,将接口与业务规则合理分离,将业务规则这方面的代码交由信息系统原生产厂商负责,最大程度地保障数据操作的一致性和科学性。

3.应用标准难

近年来,出版行业为了推动产业标准化、信息标准化,发布了几百种标准规范,每个标准规范都用了极其详尽的文字表述其内容。出版企业面对如此众多的标准,普遍觉得难以实施和应用。一方面是对标准的认知可能存在偏差,另一方面是觉得缺少合适的平台去应用标准。因此“有标准不用、有标准难用”就成了行业怪象。在出版行业数据交换领域,国家先后出台了若干标准,如2006年颁布的《图书流通信息交换规则》,2013年颁布的《中国出版物在线信息交换(CNONIX)图书产品信息格式》国家标准等,这些都是较规范科学的标准,通用接口云平台必须将标准纳入其体系,一方面保证行業数据交换有标准可依,另一方面可以推动标准的落地应用。

4.保障安全少

在国际通行数据交换实施方案中,需要每个参与数据交换的企业投入几千万的资金进行信息交换安全方面的硬件、软件、网络一体化架构。这就造成了“几千万已投入、真正业务却丝毫未达成”的现象。因此,出版企业一般会基于资金困难等原因,省略在这方面的投入,直接实施接口接入方案,给数据安全带来了极大的隐患。

四、研究出版产业通用数据交换技术

在现实的出版业中,还存在大量的信息系统之间的信息交互不够通畅,形成了数量极大的“信息孤岛”。在互联网以及信息技术飞速发展的互联网经济时代背景下,各种信息系统呈井喷之势,信息系统之间的数据交互或复用需求呈几何级数极速增长,因此无论是对一个出版企业还是整个出版行业,乃至其他行业来说,开发一个多系统间的通用接口系统都是十分必要的。

针对出版产业现有数据交换接口不通用的核心痛点,研究一种“逻辑分离、应用贴合”的新型通用数据交换架构(含关键技术),开展出版领域与数据交换、人工智能、大数据等先进技术的深度融合。解决现有交换接口共性问题,实现企业对内对外无差别的数据交换,通过大数据技术、云平台的方式推进行业智慧决策、智慧生产、智慧服务。

五、结束语

随着信息时代的快速发展,出版业经过了1.0时代、2.0时代,来到了3.0数与网的时代。出版业对信息的数字化、数据交换的需求,都已成为急需解决的问题。虽然EDI目前在出版业只是简单地替代了一部分纸张文字工作,但随着出版业EDI技术的研究发展创新,相信在不久的未来,其可以成为出版业工作赖以存在的环境和基础,发展前景光明。

参考文献

[1]周峥.电子数据交换技术在图书采购业务中的运用[J].数字技术与应用,2019(4):36-38.

(作者单位:出版产业通用数据交换技术重点实验室)

猜你喜欢
出版业
曙光初现了,出版业
由互动到嵌入产业链:出版业跨界影视业的模式变迁
注意力经济时代的出版业危机
抗战时期贵州的出版业探究
韩国网络漫画出版特色解析
国家治理现代化视阈下出版业发展理念与目标
融合出版背景下的出版业管理人才培养
“互联网+出版”背景下的出版价值取向及出版方向
浅谈大数据在出版业的应用
新闻出版业“十三五”规划调研座谈会在长沙召开