张久珍 步 一
(北京大学信息管理系,北京 100871)
·技术视角·
智能手机描述元数据研究
张久珍 步 一
(北京大学信息管理系,北京 100871)
随着信息时代的到来,智能手机越发普及,并在人们的日常生活中扮演着越来越重要的角色;而元数据作为图书馆学研究的重要内容,在信息化时代下的新型信息组织活动中仍然起着重要的作用。本文首先对描述元数据和智能手机本身做概述,然后对智能手机所包含的元数据思想进行挖掘和分析,最后指出其中存在的问题并给出改进方案的示意。
描述元数据;元数据;信息资源管理;信息技术
元数据是关于数据的数据,是专门用来描述数据(数字对象)的内容、特征和属性,并对数据进行管理和结构化的数据,是信息组织的基础[1]。元数据有很多类,如描述元数据和管理元数据等。其中,描述元数据是包括信息内容元数据、专门数字对象元数据和资源集合元数据等在内的元数据[2]。描述元数据是本文将要阐述的重点。
描述元数据作为信息内容和信息资源著录的方法规则,具有以下功能:
(1)描述元数据具有优化信息服务的功能[3]。例如,根据信息资源编目的理论,描述元数据能够更为规范和详实地对字段进行标引,也可以建立索引以提高检索效率,这对图书馆等信息服务提供者提供检索服务有正向的促进作用,它帮助用户更为方便、准确和迅捷地得到信息检索结果。这种信息检索不是简单的全文匹配。此外,理论和实践告诉我们,知识资源导航服务也是描述元数据对信息服务促进功能的一个重要体现[2]。
(2)描述元数据沟通了一个系统和另一个系统之间的互操作[1]。元数据标准的存在,使得数据在同一系统类型的不同个体甚至不同系统间可以互换,这对于元数据的互操作性与信息数据的共享和广泛应用具有重要意义。然而,好的元数据方案可以促进这种数据共享,设计不佳的元数据则会起到相反的作用。
(3)描述元数据具有促进信息资源建设的功能[4]。描述元数据对于对象的描述、管理、结构信息和保存等方面都进行了详尽的规定,这对于信息资源,特别是数字资源的产生、制作、管理、发布与保存都具有重要意义[3]。
描述元数据具有以下几个特点:
(1)描述元数据具有灵活性[5]。这种灵活性主要体现在其可扩展性上。描述元数据本身可能很简单,只包含最简单、最基本的元素,但它具有良好的扩展性。例如都柏林核心集(Dublin Core,DC)仅仅有15个元素,但是由它可以依据一定的规则扩充出新的信息资源内容或增加新的信息资源描述。
(2)描述元数据具有互操作性[1]。这主要体现在两方面,一方面描述性元数据应当对不同系统间数据交换能力进行必要的支持;另一方面也应当在统一数据级别上进行一定的映射和对照,以便转化为其他系统的元数据。
(3)描述元数据具有模块化特性[6]。例如,中国机读目录格式(China Machine-Readable Catalogue,CNMARC)就具有记录头标区、地址目次区、数据字段区和记录分隔符等模块。不同模块分具不同的功能,这也使得描述元数据更具有整体性。
智能手机,是指像个人电脑一样,具有独立的操作系统和独立的运行空间,可以由用户自行安装软件、游戏、导航等第三方服务商提供的程序,并可以通过移动通讯网络来实现无线网络接入的一类手机的总称。信息时代的到来使人们的消费习惯发生了翻天覆地的变化,智能手机业已成为当今手机市场主流[7]。
智能手机的涉及范围已经布满全世界,因为智能手机具有优秀的操作系统、可自由安装各类软件、较大屏的全触屏式操作感这三大特性[8],所以几乎完全终结了功能手机。智能手机的操作系统有别于PC机的操作系统,在PC机的操作系统中微软的Windows有着不可撼动的霸主地位。但是在智能手机市场却是呈现百家争鸣百花齐放的局面。目前,市场上智能手机系统有Android、iOS、Windows Phone、Bada、Symbian和BlackBerry等等。
数据显示,截至2014年,在全球范围内Android和iOS操作系统两者共拥有96%的市场份额[9]。因此,对Android和iOS两种操作系统的调研在很大程度上能够代表当今智能手机描述元数据的情况。本文仅以通讯录及其互操作性和信息存储与文件管理为例,从市场占有率较高的Android操作系统的角度进行分析。
3.1 智能手机通讯录及其互操作性
智能手机通讯录的元数据设计比功能手机丰富很多。以典型Android操作系统的小米4手机为例,智能手机通讯录元数据中包含下列常用字段:
表1 智能手机通讯录元数据常见字段(以小米4智能手机为例)
此外,小米4手机通讯录还提供诸如姓名拼音、即时消息、地址、称呼、网站、互联网通话、生日、农历生日、关系和备注等字段。对于英文联系人,通讯录还设有姓氏、中间名、名字、名称后缀、名称前缀等子字段。在以上所述的表中和表外各字段中,只有手机或宅电之一是必填字段,其余均为可选字段[10]。
实际上,不同手机之间要想进行通讯录的互换(即互操作性),需要有以下两点要求:第一,两系统字段设置必须大体相同。一般通讯录都具有姓名、手机、宅电等最基本字段,这也是通讯录可以进行交换的必备条件。第二,同一字段的完整性约束大体相同,否则可能会造成信息丢失。
3.2 智能手机信息存储与文件管理
众所周知,PC机的信息存储在硬盘上,用户可以通过“我的电脑”入口访问各个磁盘借以访问所有的文件;而智能手机的信息和文件则需要通过“文件管理”等入口进入。对于智能手机而言,系统软件在用户购买之前已经存储在相应位置,占有了相应的文件夹和空间;用户自安装软件则每个软件占有一到多个文件夹,其中存储软件具体信息、程序和缓存等。下面从系统软件和用户自安装软件两个方面看智能手机信息存储与文件管理的描述元数据体现。
智能手机的系统软件可以看作必填字段,这些字段的完整性约束条件在系统设计时就已给出,用户不必关心。对于苹果iOS操作系统来说,用户没有权限修改这些描述元数据;而对于Android操作系统来说,如果用户需要修改,必须借助特定的软件(如360 ROOT等)取得一定的权限。
用户自安装软件可看作选填字段,选填字段没有太多的完整性约束。这就类似于CNMARC中200(题名与责任者说明)字段和300(备注)字段的关系。然而这样缺少完整性约束的形式也造成了一些问题,在后面详述。
智能手机在风靡全球的同时,其元数据水平也在逐步发展。但笔者认为现今智能手机元数据发展仍存在以下问题:
4.1 不同操作系统手机元数据差异大
如第二部分所述,智能手机操作系统种类繁多。由于缺少统一的元数据规范,不同操作系统之间的元数据互操作性并不令人满意。以Android和iOS的音乐元数据为例,Android操作系统自带的音乐元数据中包含“歌手”、“歌名”、“风格”等字段,而iOS操作系统的音乐元数据中则包含“歌手”、“歌名”、“歌手(英文)”、“风格”等字段。当两系统进行数据互操作时,因为Android操作系统未区分“歌手”字段的语言,很可能出现“班得瑞Bandari”这样混合语种的内容,但是这样的内容在iOS操作系统中又会分开在“歌手”和“歌手(英文)”中出现。这样在进行系统对接的“连接”操作时,会发生或重复或遗漏的现象[9-10]。
4.2 不同型号手机元数据字段长度有所差异
对于同一操作系统的智能手机,其元数据类型差异应当不大,但是在字段长度这样的细节问题上仍有小的不同。例如,同样为MIUI系统,小米1手机的通讯录中,“姓名”字段长度为12,但是到了小米3手机的通讯录“姓名”字段,长度就变为了10。这种由多变少的字段长度会造成一些问题。例如,当用户将原有通讯录从小米1手机导至小米3手机时,姓名的第11、12位会丢失。
4.3 Android操作系统文件管理元数据较为混乱
与iOS操作系统不同,Android操作系统显得相对“开源”。这在给用户提供了一定的方便的同时,也造成了元数据,特别是文件管理元数据的混乱。PC机中,软件所占空间往往与系统所占空间以不同硬盘的形式分离开来;但是Android操作系统中是处于同一片空间中,形式上也未分开。例如,存储照片的DCIM文件夹往往和软件(如飞信“Fetion”)处于直接相邻的并列位置便是如此。究其原因,一方面,Android操作系统的用户往往通过手机浏览器直接下载或装机助手等下载软件,缺少用户自定义存储路径的窗体;另一方面,Android操作系统缺少统一的文件管理元数据规范的指导。上述两个方面都在很大程度上造成了文件管理不够结构化和有序化,元数据相对混乱。
基于上述问题,有必要制定出较为完善的智能手机描述元数据方案。而制定元数据方案又需要对智能手机用户的需求进行分析。为此,笔者设计了调查问卷和适量的访谈环节,随机选取了200名拥有个体进行调查。在调查地点的选择上,因为智能手机往往集中于在城市生活的用户,故调查地点选在了北京市城区内。调查的主要内容包括:对智能手机的了解程度;(不)使用智能手机的原因;使用智能手机的操作系统类型;最看重智能手机的什么方面;最常使用智能手机做什么;愿意花多少钱购买智能手机;对自己的智能手机(功能机)有多少不满意的地方;对智能手机有何期待和建议;等等。
最终回收到的有效问卷比例约为97%。此外,笔者还查阅了互联网消费调研中心[12](ZDC)提供的数据和图表。限于篇幅所限,关于调查结果的描述性统计略去。根据问卷、访谈和ZDC的数据,笔者得出以下结论:
(1)拥有智能手机的被调查者占多数,对于暂无智能手机的被调查者,男性的换机欲望强于女性。
(2)大学生和白领阶层对智能机了解多些,但大部分只是宏观上的了解,只有一小部分是智能机爱好者。同时,大部分人对智能机的前景保持乐观。
(3)在与智能手机描述元数据有关的问题中,部分智能机发烧友对系统兼容度和同一APP的元数据兼容度提出了不少建议,部分学生对通讯录的兼容度提出了一些质疑和不满。这也为下文智能手机描述元数据方案改进的设计提供了思路。
鉴于智能手机描述元数据涉及方面广、数量大、种类多,笔者仅选取智能手机的通讯录,对其描述元数据方案进行改进。
统一的元数据规范应当具有简易性、易扩展性和易移植性。这是因为统一的规范要能为多种系统、多种形式所兼容。简易性是易扩展性和易移植性的前提和基础,易扩展性和易移植性又是简易性的目的和归宿。正如著名的都柏林核心集,其中仅有必要的15个元素,却成为当今众多纷繁复杂元数据规范的原型和缩影。
对于智能手机通讯录而言,其描述元数据标准需要有以下要求:
(1)仅需要列出最基本字段。对于通讯录而言,姓名、手机和对该人的最基本介绍为基本字段。鉴于电子邮件地址用途愈发广泛,笔者将邮箱作为一个基本字段呈现。
(2)可选字段需要引出。为了减少冗余空间,每张名片的起始位置有一个“长度”字段,标注出本名片使用空间的大小;同时,将非基本字段以指针的形式引出。
(3)可选字段存储需要规定位置。用指针指向存储的位置(字节码),使存放的位置尽量在一起,这有利于减小存储空间。
但需要指出的是,智能终端的描述元数据方案和传统信息资源的描述元数据方案有所不同。因为智能终端后台的代码已成体系,所以元数据方案只需要规定字段长度和要求即可;而传统信息资源因为后台代码未成体系,因而其描述元数据(如USMARC)需要有地址目次、记录标识和字段、子字段之分,等等。
基于上述要求,笔者做出的描述元数据方案改进见表2:
表2 描述元数据方案改进示意
从表2可以看出,整个元数据基本字段所占位数仅有不到200个,十分简练。对于不同手机型号具有的自有特性,此元数据方案采用指针形式进行外在扩充,并将它们存于第197位后。
综上所述,智能手机中的描述元数据对于智能手机的进一步发展起着至关重要的作用。手机之间的互操作程度和能力,决定着智能手机之间、智能手机与其他电子设备之间的数据共享程度,也决定着信息化的层次。因此,亟待产生一部与智能手机元数据相关的完备规则,借以进一步规范智能手机数据,使得智能手机信息组织更为有序化、规范化、结构化。
[1]肖珑,赵亮.中文元数据概论与实例[M].北京:北京图书馆出版社,2007:17-29.
[2]段明莲.现代信息检索[M].北京:高等教育出版社,2006:2-8.
[3]陈建龙.信息服务模式研究[J].北京大学学报:哲学社会科学版,2003,(5):124-132.
[4]刘兹恒.信息媒体及其采集[M].北京:北京大学出版社,2008:120-124.
[5]张广钦,段明莲.中西文文献编目一体化的可行性研究[J].河南图书馆学刊,1994,(3):63-64.
[6]段明莲.信息资源编目[M].北京:北京大学出版社,2008:1-2,132-153.
[7]洪昕,王珏,林花.我国智能手机营销策略分析[J].企业经济,2008,(12):84-86.
[8]师晓青,谢军红.基于3G的智能手机移动图书馆创新研究[J].图书馆建设,2009,(5):52-54.
[9]iOS和Android已占有96%全球智能手机市场份额[EB/OL].http:∥digi.163.com/14/1101/07/A9USR82500162OUT.html,2015-08-28.
[10]萨师煊,王珊.数据库系统概论[M].北京:高等教育出版社,2008:13-15.
[11]萨蕾.元数据互操作研究[J].情报科学,2014,(7):812-814.
[12]小米手机官网[EB/OL].http:∥www.mi.com/index.php f=xiaomi,2015-08-08.
(本文责任编辑:孙国雷)
Towards Descriptive Metadata of Smartphones
Zhang Jiuzhen Bu Yi
(Department of Information Management,Peking University,Beijing 100871,China)
With the arrival of information period,smartphone becomes more and more popular among people,playing an increasingly significant role in our daily life.At the same time,metadata occupy a huge part in information organization recent years as it is still a key content of library science.Basically this paper gave a short introduction on descriptive metadata as well as smartphones,and analysed thinking metadata of smartphones,especially descriptive metadata.Finally this paper uncovered some problems in it and put forward an improved method which is not perfect but can be seen as an example.
descriptive metadata;metadata;information resource management;information technology
2016-01-26
张久珍(1974-),女,党委副书记,副教授,研究方向:信息素养研究,发表论文40余篇。
10.3969/j.issn.1008-0821.2016.03.012
G254.364
A
1008-0821(2016)03-0072-04