罗胜京+黄秀燕
计划缘起
20世纪末,正是电脑科技大发展的时代。信息科技的进步,改变了人类沟通的方式,改变了知识的管理和传承,改变了信息的传播和储存,对人类社会产生革命性的影响。面对此冲击,世界各国和地区都在不断转型以提升自己的竞争力。
文献资料(包括档案、书画、地图、器物等)典藏的数字化,可以有效提升知识的累积、传承与运用,是知识经济的重要基础环节。世界各国和地区也正在积极推动典藏数字化工作,例如联合国的“世界记忆计划”、美国的“美国记忆计划”等。而当时台湾已是全球资讯制造与服务的重镇,网络基础建设逐渐成熟,岛内已有近700万上网人口,全部中小学均已联网,再加上“电子化政府”、电子商务、宽带固网、网络教学及网络医疗等项目推动方兴未艾,在华文市场及汉学研究上皆占有一席地位,台当局希望凭借台湾在全球资讯产业、中文资讯处理成果与能力,及中华文化与语言文字方面的优势地位,能够更上一层楼,加大对数字与网络科技的投入,借机登上世界高科技发展的第一梯队,以此宣示发展知识经济和绿色硅岛的愿景,加速文化资讯产业升级,确保学术发展优势,因此决定推动数字典藏计划。
台湾“国科会”在1998年曾组织实施“数字博物馆专案计划”、“国家典藏数字化计划”和“国际数字图书馆合作计划”,但规模都不大,效果也有限。1999年7月,台湾“行政院”召开第九次“电子、资讯、电信策略会议”,讨论建立所谓“绿色硅岛”、“国家资讯通信基础建设”及“知识经济发展方案”等议题,最后决定根据台湾整体发展的需要,承袭“国科会”往年实施的这些计划,并将其合并为所谓“国家典藏数字化计划”,以此作为“挑战2008:国家发展重点计划”的重要内容。
2001年1月,“国科会”将前述三项计划进行重新规划,整编为所谓“国家型科技计划”,并于同年3月“国科会第152次委员会议”上通过“数字典藏国家型科技计划”的构想书,正式展开筹备工作,于2001年1月正式开始实施,一期计划执行时间为5年(2002~2006年)。计划的首要目标是将台湾重要的文物典藏数字化,建立台湾数字典藏,进而以台湾数字典藏促进台湾人文与社会、产业与经济的发展。这也是当时台湾唯一一个着重人文与科技内涵的“国家型科技计划”。
综观当时世界各发达国家对数字典藏的利用,主要着重于下列领域:传统文化的保存和发扬,以及新文化的肇兴;各级教育和各种教育的提升与革新,促使学习资源开放和学习机会均等,丰富教育的素材,协助推动终身学习和远距教学,以建立公平社会;改善学术研究工具,发展未来各个学门的学术研究环境;产业提升与经济贸易配合知识经济与产业的发展;生态和环境的关怀与生活素质的提升;科学知识和医学知识的普及与民众素养的提升;资讯基础建设的配合。
台湾“数字典藏国家型科技计划”参考了以上内容,其主要目标是:将台湾岛内重要的文物典藏数字化,建立数字典藏档案,希望以此促进台湾人文与社会、产业与经济的发展。其中,在产业与经济方面,除建立公共资讯制度的雏型,促进有价资讯市场的健全发展外,还积极鼓励产业增值,利用各项数字典藏,促进各项相关生产与管理技术(如知识管理技术、多媒体网络技术、本地常用语文及语言相关技术等)的研发,进而推动在商业、产业(特别是文化产业、增值产业、内容产业、软件产业)、教育、学术研究,以及民生、休闲娱乐等方面的利用。在人文与社会方面,创造台湾文化新优势,开启人文与科技融合的新局面,以资讯科技辅佐文化的进程;精致文化普及化,以此陶冶社会的体质,提升人力的素质;发展多元的社会文化与社区文化,以利新文化的肇造,承先启后、继往开来;并得以普及社会大众使用资讯服务掌握资讯与知识的能力,提升生活的品质。
台湾数字典藏计划的特点
2002年,台当局拨发预算经费3.8亿元新台币,并在台北市“中研院”民族研究所内设立总计划办公室。其执行的计划分为核心计划、机构计划及公开征求委外计划等3种。
总计划办公室执行的核心计划共包括“内容发展”、“技术研发”、“应用服务”、“培训推广”、“维运管理”等5个分项计划,分别开展各项研究发展、应用服务及培训推广工作,并沟通协调各参与机构间及各类计划间的整合性工作。各分项计划各司其职,以期达成该计划的目标,如内容发展分项负责调查、建立及发展该计划数字典藏内容;技术研发分项积极研发各项数字典藏相关技术;应用服务分项负责厚植数字典藏整合及增值的研发能力与人力资源,并推动数字交易平台与市场运作;训练推广分项负责数字典藏成果推广及人员培训;维运管理分项则负责协助“计划办公室”推动年度成果展览、开发相关软体系统、出版发行及资料搜集等工作。
机构计划由“国史馆”、台湾自然科学博物馆、台湾故宫博物院、台湾大学、台湾历史博物馆、“国家图书馆”、台湾省文献馆、“行政院文化建设委员会”(简称“文建会”)及“中研院”等9个单位共同参与执行,初步目标是建立一个“台湾数字典藏”数据库,供民众查询使用。
2002年度公开征求计划共有5个委外技术研发计划、9个数字典藏内容开发计划及52个数字典藏应用计划。其中数字典藏应用计划将构建17个主题网站,提供民众数字学习环境。9个数字典藏内容开发计划分别为:
“中研院国家典藏数字化计划” 包括台湾原住民数字典藏计划、语言典藏计划、近代中国外交经济重要档案数字典藏计划、近代中国历史地图与遥测影像资讯典藏计划、珍藏历史文物数字典藏计划、台湾动物相之典藏计划、台湾本土植物数字典藏计划、数字典藏技术发展与技术支持计划。
“文化艺术数字典藏计划” 完成台湾美术馆约1700件前辈美术家美术作品的照相、数字化及诠释资料的研析、著录及建档。
“日据时期与光复初期档案数字化计划”。
“台湾大学典藏数字化计划” 包括台湾大学岛内文献文物典藏数字化计划、植物标本馆典藏数字化计划、昆虫标本馆典藏数字化计划、地质科学典藏数字化计划、人类学系典藏文物数字化计划、动物博物馆典藏数字化计划及数字典藏资讯技术研发计划。
“自然科学博物馆国家典藏数字化计划” 完成馆藏50种昆虫学门鳞翅目标本影像数字化的台湾特有及重要鸟类、兽类32种,两栖类13种、特有节蜱30种标本建档;完成深度介绍代表性馆藏维管束植物标本50种、影像资料500笔,并修订数据库架构,校订馆藏标本各项资料;完成布农族标本文物数字化96件、赛夏族标本文物13件、卑南族标本文物96件;大马璘文化代表性遗物200笔;进行鱼形总纲、两栖纲、爬行纲、鸟纲及哺乳纲等脊椎动物的影像数字化。
“典藏国家档案与总统文物数字化计划” 开发完成“国史馆”档案文物数字典藏系统;开发完成编目著录系统与简易型目录资料检索查询系统;进行“国史馆”数字典藏计划专属网站的研发与建立。
“故宫文物数字典藏系统之研制” 进行“故宫博物院瑰宝—赴法文物精选”数字化;台湾故宫书画数字典藏子计划,检讨各类藏品属性,改进现行数据库的著录栏位;故宫清代档案数字典藏子计划,将分析完成的标准著录格式转档;故宫文物图档建立及管理子计划,完成仪器设备更新及文物图档管理系统开发;台湾故宫文物数字典藏电脑应用系统建立子计划;故宫文物数字典藏电脑网络系统建立子计划;故宫缮本古籍数字典藏子计划。
“国家图书馆国家典藏数字化计划” 包括“国家图书馆”古籍文献典藏数字化、台湾地区地方文献典藏数字化、“国家图书馆”期刊报纸典藏数字化计划、建立“国家图书馆”数字典藏资讯系统软硬件设备。
“国家历史文物数字典藏计划” 包括汇整典藏陶瓷类各类型资料的目录、索引与摘要;完成历史文物分析;整理博物馆网络数据库索引词目;规划历史文物词目架构、建立历史文物索引典;完成各类型文物资料的影像资料数字照片,及具深度内容与提供相关学术索引的专业网站。
台湾“数字典藏国家型科技计划”与同时期的一些国外数字典藏计划相较,其特色为涵盖多样性主题的学科内容,如生物、史地等学科,藏品项目包括档案、书画、地图、器物等多种的型式,数字化藏品有文字、图像、影音等多种的媒体形式,其内容知识专业精深。
为促进台湾人文与社会发展,自2002年度起开始进行“数字典藏联合目录系统建立计划”。建立《数字典藏联合目录》的目的是汇整该计划项下各机构计划数字化后所建立数据库的成果,提供一引介平台,以增加原典藏部门的效能与其典藏品的曝光率,提高网络世界中知识资讯的质量。在联合目录中查询到的每个项目都提供网络连结,可以连到原来的数字典藏子计划或典藏部门的数字典藏品的后设数据(也称诠释资料)页面。因此,使用者可以通过联合目录,连结到原数据库更加丰富、深入的资讯,并进一步使用原典藏部门的检索系统;使用者也可以继续使用联合目录的系统搜寻、浏览,以接触种类更广泛的典藏数据库。联合目录数字化媒体材料汇入数量越多,则可提供使用者的资讯则越丰富与多元。
该计划的产出除了建立后设数据、历史地图、语言时空典藏档案,为数字产出共同参照及互相融合的基础外,还包括原住民、近代史料、动物、植物、矿物、考古、金石拓片、铜玉陶瓷等器物珍藏、古旧照片、书法、绘画、善本古籍、档案及期刊报纸等数字典藏。
所有产出资料都汇集至“台湾数字典藏数据库”,并分为典藏级、电子商务级、公共资讯级3个等级的数字化产品。典藏级档案为精密的数字化产品,目前暂不开放;电子商务级可提供业者进行各种商业产业增值;公共资讯级的典藏将免费开放民众使用。
为达到典藏重要文物、保存传统文化的目标,该计划第一阶段优先发展的项目是充实数字典藏的内容。而发展数字典藏内容,必须先了解岛内的主要典藏,以排定数字化的优先次序,并根据数字化规范相关知识,制定各种技术规格和技术标准,进而与世界上其他的数字典藏计划接轨与相容。
该计划注重人文与科技领域的沟通以及各部门间的合作,对于计划相关的各种文件、档案及资料等皆予以保存,以供后期计划或相关研究参考;此外,也期望通过该计划培育相关人才,延续数字典藏工作。
除了建立台湾数字典藏,该计划更期望能普及精致文化典藏内容的应用。藉由该计划提供大量的数字资讯,做为发展各行各业的应用基础,如教育、研究、商务、产业、民生(食、衣、住、行)及休闲娱乐等,同时建立公共资讯展示系统,开放精致文化典藏内容予民众共享,进而提升民众生活品质,促进社区文化的发展并建立新文化。此外,藉由该计划的推动,形成公开的内容市场,促进文化产业、内容产业、软件产业与增值产业的发展,刺激相关应用技术的研发,为数字台湾打造基础。
一期成果丰富
经过5年的不懈努力,到2006年,该计划一期各项任务目标已基本完成。在内容发展成果方面,根据统计,参与该计划的“中研院”、“国史馆”、台湾文献馆、台湾自然科学博物馆、台湾故宫博物院、台湾大学、台湾历史博物馆、“国家图书馆”、“台湾省咨议会”等机构陆续将其典藏品进行数字化,产生的数字化档案与后设数据结合成数字化产出,包括动画、影片、语音、录音、照片、影像、文字等资料,2005~2006年数字化产出总计达256.77TB。数字典藏联合目录汇入的数字化媒体材料达250万笔。
这些数字化媒体材料包括生物与自然、生活与文化、文献与档案、地图与建筑、艺术与图像、语言、影音与新闻等六大主题,依典藏品类型与特性可细分为16个领域,包括动物、植物、地质、人类学、档案、器物、书画、地图与遥测影像、金石拓片、善本古籍、考古、新闻、语言、汉籍全文、影音、建筑等,并建立联合目录,根据主题分类,建立网站汇入数字典藏品,数量共约26万笔,依11个分类提供查询检索服务。同时记录各项数字化工作流程出版成手册及影片,以供推广与培养数字典藏专业人才及有兴趣的大众使用。2005年进行了15份数字化工作流程简介,全部置于网页,并于2005年完成13部数字化工作流程影片的拍摄,置于网页供使用者免费观赏。
在技术研发成果方面,完成佛像石刻造像拓本系统等46个主题计划的典藏系统支持与服务系统,包括分析后设数据、引进国际标准、开发数据库等工作,开发出多媒体处理技术、典藏系统与数据库技术、环场环物互动系统等核心技术,以及知识产权与隐私权管理机制的核心技术开发与后设数据分析技术。语言处理技术计有汉字构型数据库系统、断词系统、中英语言跨语言资讯检索技术,开发老旧印刷档案光学字元辨识技术并已技术转让。还完成LiveTrans跨语网页搜寻系统,相关研究成果发表在ACMTALIP、ACMTOIS、JASIST等主要期刊以及重要国际会议,如SIGIR、ACL及JCDL等。仅在2007年便发表学术论文228篇,内容涉及对数字典藏学术应用与文化传布议题的创新性研究,以及如何可在理论、实践、技术等方面具体导入各类数字典藏专案计划等。另外,还申请5项专利,包括技术研发分项计划的“无线网络的视讯安全传输技术:可容忍几何处理的数字影像赫序方法与系统”等。
该计划一期重要技术研发成果包括:
多媒体影音典藏技术 整合过去发展的影音技术,包括影片分镜侦测技术、关键画面撷取演算法、浮水印、读取SRT档字幕格式、影片字幕加入、档案格式转换等功能,成为电子编辑工具。开发影音博客系统工具与技术,包括影音线上编辑、整合flash影像串流服务器、整合地理资讯呈现、声音播放、系统管理、Gadget应用程序等,并营运影音博客系统。
Web2.0核心技术研究 包括借重群体智慧来做预测或决策、汇整群众意见的品质、安全性议题及防制恶意行为。
视讯内容了解技术 应用局部不变性特征比对不同类型的视讯内容,发现在比对两两相邻的影片时,对应点的数量会随着视讯分段时的影片过场特效而有明显的减少,能将目前摄影机晃动或是视讯中物体快速移动误判为影片过场特效的问题处理得更好,且发展新的视讯内容自动分镜演算法及测试在不同影片中自动分镜演算法的效果;同时结合局部不变性特征与基于模拟疫苗概念的复制影像侦测方法,首先搜集常见的复制影像攻击方法,并利用这些方法预先攻击原始影像,产生新的复制影像,再从新影像中撷取局部不变性特征,产生模拟影像。采用approximatek-dtree的方式快速地比对出遭复制的影像,经由实验图库进行复制影像侦测实验,所提出的演算法能有效抵抗常见复制影像攻击,并能更有效率地比对出复制影像。
音讯处理及检索技术 开发SoVideo影音新闻检索系统及SoMusic歌曲检索系统。
地理资讯系统 共研发7件系统或技术,包括“跨越时空·鸟瞰地图与数字地球的结合”展示系统及单机版应用程序;地图影像发布及应用软件工具,包括地图影像分割及发布套件以及地图影像分割应用套件;多人互动触控桌与数字地球整合技术;运用谷歌地图Mapplet技术,开发“台湾新旧地图比对-台湾堡图”网络服务;多点触控桌(屏幕)整合应用;车用录影机结合电子地图动态展示街景;建立在影音资料平台上的数字版权管理保护机制。
数字典藏成果推广与应用
为使社会大众能领略多样、深入的典藏内容,带动民众运用典藏内容,该计划从使用者为社会大众的观点及效益出发,将典藏内容经视觉设计包装及互动功能引用,完成FLASH版公共展示系统“数字101【经典意象·珍藏台湾】”,于2005年该计划成果展出期间正式对大众开放,内容包括数字艺廊、藏品目录、专题特展、典藏说明、教学中心、商务授权等。展览为期一个多月,强调“动手动脚玩数字,随时随地做典藏”,参观人潮达1.4万人,有多家知名媒体陆续采访报导,如TVBS、“中国时报”及联合报等。
为建立提供更完整、清楚的成果展现与交流平台,使民众亲近了解数字典藏,在持续改善充实网站内容后,该“计划办公室”又建立“数字典藏国家型科技计划”总门户网站,制作及开发HTML版公共展示系统,提供数字艺廊、精选目录及专题特展等项目,让大众免费体验精致数字典藏。至2006年12月底为止,网页浏览人次已达208,906人次。
为推动数字典藏在文化产业、增值产业、内容产业与软件产业,以及教育、学术研究、民生、休闲娱乐方面的应用,该“计划办公室”每年都通过“国科会”向社会公开征选研发项目,征选的范围包括数字典藏内容开发、数字典藏技术研发、数字典藏创意增值及数字典藏创意学习(2004年度增设)等4类。例如2005年数字典藏内容开发公开征选项目有31件,数字典藏技术研发公开征选项目有15件,数字典藏创意增值公开征选项目18件,数字典藏创意学习公开征选项目23件,共计87项目。
此外,2006年度共举办58场次推广活动与培育课程,参观人数共计18,522人次。例如举办ICDAT2006国际会议,邀请国际Metadata领域及多媒体影音专家演讲。包括美国亚利桑那大学陈炘钧教授发表演讲,主要议题则包括影音典藏技术与后设数据技术,及技术分项的成果展示。参加人数约180人,受邀讲者13人,成果展示有8项。于数字典藏的后设数据方面,研制后设数据需求设计DIY教材,提供15场后设数据培训课程。
为培育数字典藏人员专业能力、加强典藏部门对建立数字典藏的概念与能力,促进参与部门的经验交流,2005年规划14门数字典藏专业培训课程已于2005年10月15日授课完毕,课程讲义全部置于网站供使用者免费下载。为培育台湾文件符码化的种子教师,该“计划办公室”还主办多场文件符码化协会教育培训课程,由国际文件符码化协会主席法兰德斯(Julia Flanders)及文件符码化协会北美地区编辑包曼(Syd Bauman)授课,内容分4个主题,包括文件符码化及标志介绍、文件符码化教学介绍、文件符码化格式与验证及未来文件符码化教学议题。
为探讨数字内容应用的议题,该“计划办公室”还先后举办各类研讨会,如数字典藏增值推动与营销策略座谈会、数字典藏增值应用技术研讨会、数字出版研讨会、品牌创造与品牌策略座谈会、国际授权人才培训研讨会等。2006年以“台湾创新”为主题,带领数字典藏国家型科技计划团队参加纽约国际授权展,以培植岛内典藏部门与增值商品厂商的海外授权能力。参展厂商包括12个典藏部门、8个企业品牌,授权项目计有实体商品40件,图像授权514件,影像授权12件,其他授权69件及品牌授权等,吸引500家以上国际授权买家参观,现场交易延伸产值达3.9亿元新台币。2007年再次参加纽约授权展,共有5个授权品牌、5个创新品牌,约吸引1800参观人次,共达成约4400万元新台币预估授权金以及5.5亿元预估产值。
该“计划办公室”还积极开展数字典藏增值应用示范性案例辅导,包括数字典藏创意增值公开征选计划辅导、内容数字典藏增值应用辅导、数字典藏产出的移动内容开发应用辅导、数字典藏网络园区厂商媒合辅导及数字典藏厂商辅导咨询等。
如为推动故宫博物院典藏文物数字内容供创意文化产业进行增值运用,曾尝试通过以下各种方式:Y世代设计商品,邀台湾6所大学所组成的学生设计团队设计,共同开发系列“故宫文化设计精品”;新锐设计精品,邀请岛内多位不同风格的设计师为故宫的商品打造新的面貌;与意大利国际知名品牌Alessi合作,以故宫典藏文物发想设计吉祥物新象征图案等相关商品;摩登T恤设计大赛,委托台湾创意设计中心举办“Old is New时尚故宫-摩登T恤设计大赛”;邀请国际知名的台湾设计团队合作研发设计产品。
近年来岛内数字典藏的产业规模已俨然成形,为整合这些厂商的研发能量,使其不断投入与成长,形成产业聚落,共同建立数字典藏产业的市场利基,该计划办公室于2005年规划成立“数字典藏网络园区”,其目标是在网络上建立一个营销推广平台,提供厂商虚拟进驻,给予各项辅导措施,协助厂商发展有效的商业模式,并与历史博物馆合作进行数字典藏增值商品开发,建立数字典藏商品示范,并媒合辅导厂商与典藏部门的合作。到2006年底,数字典藏网络园区共有100家机构进驻(32家典藏部门与68家厂商),并有多家公司进行合作意向书的签署确认;商品上架数已达930件,并促成典藏部门获得授权收益15.8万元新台币,厂商创造约197.5万元的产值。
由于数字典藏的内容已累积一定数量,增值与应用也走向多元发展,交易与授权的议题愈显重要,该计划办公室还邀请产官学研界专家担任产业推动暨知识产权咨询委员,针对数字典藏发展现况及未来趋势给予建议及指导,共同探讨典藏应用在相关产业的可行性、可能的商业模式,辅导厂商规划商业产品,实际取得数字内容授权,协助解决产业链上、中、下游的知识产权问题。如2005年4月举办“迈进国际市场:数字内容授权说明会”;5月举办“数字买卖与数字分享:2005数字典藏授权暨成果展”,参与厂商约100家。
此次活动为台湾岛内首次所谓“国家级”数字素材的授权。此项授权及成果展分两部分进行:一为该计划各机构计划代表与厂商授权签约仪式,并由该计划典藏部门、“文化建设委员会”,及参与创意增值、内容开发公开征选计划的机构等共58个部门展示数字典藏的成果,供厂商寻找签约对象;二为公开征选计划的成果简报,并于9月至11月举办4场数字内容应用产业链系列座谈会,其目的皆在使增值与应用多元蓬勃发展,建立数字交易机制与环境。
在数字内容授权尚未有明确法源情形下,该计划以内部经验分享的方式于2005年8月16日举办“数字典藏授权实例分享-以“中研院”与故宫为例”座谈会,与各典藏部门共同探讨、思索知识产权相关议题;同时也与‘中研院资讯科学研究所合作,引进“创用CC”(Creative Commons)授权概念予各典藏部门参考,希冀突破典藏部门的授权瓶颈。