高校图书馆超高频RFID数据模型规范研究

2015-01-30 00:21陈嘉懿曲建峰李鲍
大学图书馆学报 2014年5期
关键词:数据模型高校图书馆

陈嘉懿+曲建峰+李鲍

摘要 以高校图书馆的实际应用与需求作为切入点,基于ISO 28560等标准规范的基础研究之上,提出了适用于高校图书馆的UHF-RFID数据模型建设方案,希望实现跨馆之间及不同厂商之间RFID应用的开放性、统一性、兼容性与互操作性。

关键词 高校图书馆 UHF-RFID 数据模型

1 引言

无线射频识别技术(Radio Frequency Identifi-cation,RFID)是一种非接触式的自动识别技术,通过射频信号自动识别目标对象并获取相关数据。目前大量应用于生产自动化、门禁、公路收费、停车场管理、身份识别、货物跟踪等民用领域中。本世纪以来RFID技术在图书馆领域也已经有了广泛的应用,常见的工作频率有高频13.56MHz、超高频860MHz~960MHz两种。由于超高频RFID具备读取距离远、灵敏度高、发展潜力大、成本低、隐蔽性强等一系列显著优点,随着近几年的技术发展,已逐步在图书馆应用中占据了主流地位。

由于RFID芯片可存储相应的数据信息,很多图书馆在使用中逐渐发现芯片数据规范化的重要性,因此形成了一系列RFID数据模型规范。在2011年随着国际标准ISO 28560-1、28560-2、28560-3形成正式版的终稿文件并对外公布,各国也纷纷推出了向该标准看齐的图书馆数据模型标准规范;其中中国国家图书馆早在2010年就参照28560-1和28560-2标准草案向国内图书馆界发出了《射频识别一图书馆一数据模型征求意见稿》,并在2012年正式提交文化部发布成为了文化行业标准。

回顾历史走势,2005年7月丹麦RFID图书馆数据模型DS/INF 163在网上公布,这是最早在国际上公开的图书馆RFID数据模型,提出了标签数据元素名称、序号以及标签标明方案,它是一种采用数据固定长度与可变长度混合模式的编码方案。2006年9月澳大利亚公布“图书馆RFID数据模型提案”,该标准提出了“内容参数”方案及“动态编码”方案,引入出版业在线信息交换媒体格式代码体系,并设定了自选的数据元素和序列,它是图书馆RFID数据模型提案出现非固定长度编码方案的转折点。美国国家信息标准化组织在2007年12月发布“美国图书馆RFID(应用指南)”,表示赞同澳大利亚的“内容参数”表及“动态编码”方案,并设定了自选的数据元素和序列。在2003-2007年期间,荷兰、芬兰、法国、德国以及英国图书馆RFID标准化组织也相继发布了各自的图书馆RFID应用标准。受早期“丹麦数据模型”影响,若干欧洲国家如荷兰、芬兰、法国的图书馆RFID标准组织均发布了与“丹麦数据模型”类似的“固定长度编码”方案;后期澳大利亚图书馆标准组织提出了“动态编码”方案,美国、英国图书馆标准组织表示赞成。丹麦、澳大利亚、美国三者的标准成为图书馆业界最有影响力的数据模型标准,这为ISO28560标准中出现二元化编码方案结果埋下了伏笔。最终IS028560-2、-3的“动态编码”和“固定长度编码”两个编码方案同时发布,各图书馆根据需要选择适合自己的编码方式。

虽然IS028560标准已被大部分国家认同并遵从,但已经正式发布的三个标准文件主要针对高频RFID(HF-RFID)技术编制,而针对图书馆应用的超高频RFID(UHF-RFID)技术,目前国际上仍然没有统一的数据模型标准规范。2011年广东省推出了DB44图书管理射频识别地方标准,主要面向UHF-RFID技术,但总体还是参照IS028560编制,并没有充分体现与发挥UHF-RFID的特点,且并非面向高校图书馆领域。由于高校图书馆与一般的公共图书馆的管理模式与应用需求存在不少差别,因此在数据模型的实际需求上势必也有不同的看法,现有标准规范无法满足UHF-RFID在高校图书馆的应用要求。在此背景下,建立一个开放的、与国际标准兼容,并可实现馆际互借等大流通需求的数据模型规范成为了当前高校图书馆界迫切需要解决的问题。

2 目的与原则

鉴于国内图书馆UHF RFID领域市场混乱、产品不通用、不标准、没有统一数据模型规范的问题,2010年3月内地和香港三所大学图书馆,即香港城市大学、上海交通大学及清华大学初步达成创办“高校图书馆RFID技术应用联盟”(以下简称联盟)的共识,成立了联盟工作小组,截至2013年初共召开了五次工作会议,并吸引了国内几十家知名高校图书馆参与。

上海交通大学图书馆受联盟委托研究并设计一套数据模型规范,其目的是希望为高校图书馆UHF-RFID技术的应用提供一套符合与兼容国际化标准的数据模型规范,从而满足高校图书馆使用UHF-RFID技术来管理图书馆的各项需求。在设计时考虑了如下几个基本原则:

2.1 兼容性原则

从国际上的应用现状与趋势分析,ISO28560标准在未来相当长一段时间内依然会是大部分国家主要参照的标准,因此数据模型的制定必须参照ISO28560,并从架构上与其后续修订版本所兼容,所定义的用户数据元素字段需完全兼容所有出自ISO28560标准的必备用户数据元素。

2.2 开放性原则

由于各高校图书馆的应用需求不可能完全一致,所以必须具备灵活性、留有开放空间;在不违背本规范总体原则的基础上,用户可以根据实际应用需求选择或扩充用户数据元素。用户数据元素包含必备项与可选项两大类,除必备项之外,各馆可按照图书馆应用需要,从可选项中选择或从预留项中扩充用户数据元素(在已有数据元素集合的基础上,增加语义不重合的新数据元素,使其具备新的功能),形成适合的应用模式。

2.3 互操作性原则

必须定义一套统一的编码与存储规则,以便各RFID供应商基于统一的规则供给设备或系统,从而确保不同厂商之间的设备或系统具有互换性和互操作性;这样也可以保障图书馆之间无障碍地完成馆际互借等活动。endprint

3 标签结构解析

经过实际调研发现,目前市场上用于图书馆行业的HF-RFID标签,其用户数据区容量一般都很大,基本上在1024bits以上;而UHF-RFID标签的用户数据区容量通常在96-512bits之间,比HF-RFID标签的容量小很多。因此在数据模型的设计上不得不考虑UHF-RFID标签的容纳性,无法装载ISO28560里定义的所有用户数据元素。

从标签架构上分析,一个UHF-RFID电子标签通常被划分为四个区域,即图1所示的四个存储体。

符合ISO/IEC18000-6C标准的UHF-RFID标签,四个区域分别为:保留内存区、产品电子代码(E-lectronic Product Code,EPC)存储区、标签唯一识别号(Tag Identifier,TID)区、用户数据区。保留内存区主要存放访问口令与杀死口令,TID区主要存放标签的TID代码,该代码为出厂时即烧录进去无法更改。这两个区域用户无法使用。对图书馆应用来讲,可写入与自定义相关数据的区域只有EPC数据区和用户数据区。

实际工作时这两个区域的读写原理有所区别,RFID读写器发出轮询命令,在信号区域内所有RFID标签的EPC数据区的内容可一次全部读取并快速返回;而用户数据区的内容只能每个标签分批分块读写。用户数据区的数据读取速度明显比EPC数据区慢。因此,针对图书馆数据模型的应用,应尽量将最常用、使用频繁的数据,例如条形码等,放在EPC区域。将不常用的、对处理时间要求不高的信息放人用户数据区,以便大幅度提高UHF-RFID标签在实际应用中的读写效率。

4 用户数据元素定义

ISO28560共定义了多达31个用户数据元素,但不完全适用于高校图书馆的应用。因此在研究过程中我们依据IS028560以及高校图书馆应用的特殊需求,对用户数据元素进行了选取与自定义。其中,基于ISO28560,选取了与高校图书馆实际应用需求密切相关的部分用户数据元素;另外,考虑到扩展性,预留了若干用户数据元素项。共定义了19个用户数据元素(其中5个为预留项),由必备项与可选项组成,除“版本(序号101)”之外,其余均出自国际标准ISO28560,且序号与它所定义的完全一致。表1给出了本数据模型中定义的全部19个用户数据元素的基本内容。

与ISO28560定义与阐述基本相同的用户数据元素的解释可参见标准原文,此处不再进行赘述,本文主要对一些定义或著录规则与ISO28560有所不同的用户数据元素进行简单介绍与说明。

4.1 版本

该用户数据元素属于完全自定义,所以分配了一个全新的序号101,以避免与ISO28560未来新增的序号冲突。版本主要有以下两个作用:

(1)用于记载馆藏标识符的编码方式。本数据模型针对96bits、128bits、144bits(含144bits以上)三种市场上较典型的EPC数据区容量的标签,制定了三种不同的针对馆藏标识符的编码压缩方式,具体编码规则与代码可参见联盟网站数据模型规范的原文。

(2)记录数据模型的版本信息。用于提供数据模型的升级更新信息,原则上由联盟负责控制和统一对外发布。例如当一些数据元素的定义发生重大变化时,联盟即修订数据模型规范并发布一个新的版本。软件读到标签的版本信息时即可查阅本地或联盟网站上存放的数据模型内容配置文件,进行对应的解析,从而实现不同版本间的上下兼容,这样即使两个图书馆使用不同版本的数据模型规范也能进行互操作。

4.2 所属馆标识

在IS028560中,所属馆标识的取值参考了ISO15511-ISIL标准,每个图书馆代码由国家代码、区域代码、馆类别、馆代码等最多16位字符组成。对于容量较小的UHF RFID标签来说,该取值方式占用空间太大,不切实际。

针对高校图书馆,中华人民共和国教育部行业标准JY/T1001-2012,《教育管理信息一教育管理基础代码》中有一个《中国高等院校代码表》,可借用高等院校代码来表示所属图书馆。完整高等院校代码为10位编码,但实际上后面5位数字就能够唯一代表每一所高等院校,因此,可仅采用完整编码的后面5位定长数字。例如“上海交通大学图书馆”可表示为“10248”。

所属馆标识是实现馆际大流通等工作的关键,RFID应用系统通过该数据元素可判断是否为本馆馆藏,从而决定是否自动转入馆际互借等流程。

4.3 临时馆藏位置

该数据元素设计的目的是用于记录临时的馆藏位置。例如在智能书架或馆外卫星图书馆等智能RFID应用中,将卫星图书馆放置在宿舍或学院等处,那么这些设备中的馆藏被自动分配一个对应的临时馆藏位置。利用该用户数据元素,就可确保在不改变原馆藏位置信息的前提下,对相应馆藏所在的实际位置进行跟踪。读者在OPAC检索系统中检索时,即可看到馆藏在馆外的真实位置,而非原始的馆藏位置。

4.4 主题

该用户数据元素设计的目的是用于标识馆藏所属的分类主题,参照《中国图书馆分类法》进行取值。在不与图书管理系统互联的情况下,可快速读取到馆藏所属的分类信息,从而为图书馆服务、数据统计等活动提供支持。例如学科馆员在扫架时,用读写器扫描图书即可获取其分类信息,为快速分类提供便利;此外,分类信息还可提供不同类别RFID图书的借阅与阅览信息,实现更全面的统计功能。

4.5 国际标准书/刊号

该用户数据元素设计的目的是用于帮助在馆际互借等情况下,准确识别馆藏信息。由于标签容量限制,在标签中往往不存放题名信息,那么在馆际互借等情况下,通过国际标准书/刊号就可以在本馆的图书管理系统中快速获取该馆藏的题名信息,从而在自助借还等操作中方便读者识别馆藏。

19个用户数据元素中,只有前三项为必备项,其它均为可选,各馆根据自己的应用需求可任意选择。假如标签容量较小且只考虑单馆应用,那么可只选择三个必备项;假如涉及到跨馆的互操作,那么“所属馆标识”也必须写入标签中。在跨馆的互操作中,“版本”与“内容索引”起到了重要的作用,通过这两个必备字段,可以准确识别各馆在标签中写入的内容,从而实现不同标签间无障碍的读写工作。endprint

对于高校图书馆,自定义的用户数据元素如“主题”和“临时馆藏位置”等在实际应用中会起到比较关键的作用,假如想尝试一些更智能化的学科服务工作,那么在数据模型应用中应考虑选择这些数据元素。

与ISO28560一样,数据模型中预留了5个数据元素供未来扩充使用,当国际标准发生变化时,本数据模型也会进行相应的修订,以实现最大程度的兼容性。

5 编码规则

如本文之前所述,UHF-RFID标签的EPC数据区与用户数据区读写原理不一,因此读写速度有显著区别,本数据模型建议将常用的、对读写速度要求较高的用户数据元素放置于EPC数据区,即三个必备用户数据元素:版本、馆藏标识符、内容索引。将不常用、对读写速度要求不高的用户数据元素放置于用户数据区。由于存放内容与读写方式的不同,我们给两个区域分别设计了不同的编码规则,以最大程度发挥UHF-RFID标签的工作效率。

5.1 EPC数据区

由于EPC数据区存放的用户数据元素相对固定,因此推荐使用固定长度编码方式。“版本”与“内容索引”本身为二进制定长字段,无需进行编码压缩。仅针对“馆藏标识符”,即目前广泛使用的条形码,提出了三种不同的编码方式,分别对应96bits、128bits、144bits(含144bits以上)三种不同EPC数据区容量的标签,经过调研基本涵盖了目前国内高校图书馆的所有条码情况(不超过14位字符,字符集为ISO/IEC646 IRV中的任意字符)。

5.2 用户数据区

用户数据区存放的都为可选数据元素,由用户自行选择,每个馆所选择的用户数据元素可能都不一样,那么就不能采用固定长度编码方式,而需要采用类似于IS028560—2中提到的基于ISO15962 E147的变长编码方式。

由于UHF-RFID标签的用户数据区的工作原理为“按字对齐”、“分块读取与存储”,在设计数据模型时我们也充分考虑到了这一特性,每一个可选用户数据元素长度都设计为双字节的倍数,那么在读写时就可以按照“字数据块”轻松提取出每一个单独的用户数据元素。

该区域的用户数据元素存放方式为变长数据块形式,每一个用户数据元素由“序号”、“用户数据元素长度”与“用户数据元素内容”组成,数据结构如表2所示。

●序号:占用6bits,与数据模型中用户数据元素的序号对应,最多可表示64个不同的用户数据元素。

●用户数据元素长度:占用10bits,最大可表示128Bytes的数据元素长度。

●用户数据元素内容:不定长,根据具体的用户数据元素取值而定,最小单位为2Bytes,按字(Word,双字节)对齐,不足部分补0。

图书馆可根据需求选择用户数据区存放的用户数据元素,数据的存储方式如表3所示。

用户数据区的读写机制与EPC数据区不同,需要设定起始位置与数据长度。假如某图书馆选用的用户数据元素固定,即使用的用户数据区最大长度为定值,那么在RFID系统配置表中可记录该数值,每次读写时进行调用;即只从用户数据区的起始位开始,读取该标签用户数据区现使用最大长度的所有数据,无需遍历整块用户数据区,提高读写效率。

6 评价与试验

本数据模型的提出,填补了国内外图书馆UHF-RFID数据模型标准方面的空白,为国际标准ISO 28560的进一步修订与发展提供了有价值的参考与研究思路。很多国内图书馆原先并没有意识到数据模型的重要性,在联盟数据模型推出之后,很多馆都纷纷采纳与接受了这一标准,使得未来国内外图书馆RFID图书的大流通成为了可能,届时不同馆之间所有RFID图书的读取与通借通还都不会存在障碍,给读者带来便利。在数据模型中我们还设计了符合高校图书馆需求的数据元素,对于未来基于图书的使用分析、数据挖掘等大数据应用提供助力;设置的数据元素不乏一些前瞻性的预测,对于未来的一些新型应用如智能书架等也能进行很好地支持,为物联网的快速发展与智慧图书馆的构建奠定坚实基础。UHF-RFID数据模型的提出也使得国内UHF-RFID生产商有了统一可循的标准,使原先由大厂商把持垄断的标准规范公开化、标准化,增强了市场的竞争性,图书馆用户能得到更好更优的产品。

采用本数据模型标准后,不同图书馆之间UHF-RFID图书的互借流程如图2所示。

数据模型推出之后,上海交通大学图书馆与长期合作的国内六家图书馆RFID产品制造商进行了沟通,在他们提供的六种不同的UHF RFID标签上进行了试验。

试验方法为:图书馆给出指定的选取元素与固定值,六家厂商按照数据模型标准进行编码并写入自己的标签芯片中,然后互相进行读取验证。验证结果表明六家厂商的标签采用此数据模型规范后,完全可互相无障碍读取与解析。

截至2014年2月,国内已有多家高校图书馆正在使用本数据模型标准,且整体运行状况良好。

7 结束语

随着UHF-RFID技术的发展,越来越多的图书馆,特别是高校图书馆都看到了这一技术的发展潜力,开始使用UHF-RFID来管理图书馆的日常工作;业界迫切需要“有法可依”:遵循统一的数据模型标准来规范操作与行为,整合当前稍显混乱无序的市场。由此,基于高校图书馆的一些特定应用需求,并参照目前主要针对HF-RFID的ISO28560标准,我们尝试研究并推出这样一套数据模型规范,供高校图书馆间共同探讨与参照,期待能在未来的RFID应用中发挥应有的作用。

2013年,国际标准组织ISO提出会针对UHF-RFID推出ISO28560-4、ISO28560-5标准,其中ISO28560-4规定了图书馆UHF-RFID标签数据编码采用动态格式编码方案——基于ISO/IEC15962的数据编码,不再像HF-RFID标签采用两种编码方案;ISO28560—5规定了业界长期争议的图书馆900MHZ标签的唯一标识符方案。目前ISO的新标准仍然在拟定中,我们的数据模型规范也会按照最新的国际标准进行对应的修订,以期实现最大程度的兼容化,使UHF-RFID技术能在高校图书馆中生根发芽并绽放出最绚丽的光芒。endprint

猜你喜欢
数据模型高校图书馆
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广
面向集成管理的出版原图数据模型
一种顾及级联时空变化描述的土地利用变更数据模型