陈焕芸
(上海图书馆(上海科学技术情报研究所),上海 200031)
智慧图书馆是未来我国图书馆发展的趋势。伴随着大数据、区块链、元宇宙、人工智能等现代科学技术的不断发展,智慧化时代已然到来,2021年3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标规划纲要》提出要提供智慧便捷的公共服务,积极发展“智慧图书馆”,并将这一理念纳入到未来数字社会建设的整体规划中。智慧图书馆广泛利用现代科学技术以实现广阔的互联以及共享,进行智慧化的管理和服务,其主要特性有全媒体、平台化和新业态[1],是未来我国公共图书馆发展建设的重要方向[2]。
为了向读者提供数字化、智慧化和个性化的知识信息服务,智慧图书馆需要获取、存储、分析和利用大量的读者信息,由此产生的个人信息安全问题不容小觑。如何抵御网络攻击,规避读者个人信息被滥用、泄露和侵犯的风险,在确保读者个人信息安全的前提下向读者提供各类智慧增值服务是公共图书馆智慧化发展的重要课题。
参照2021年8月颁布的《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)第4条第1款,可将“读者个人信息”界定为公共图书馆运营过程中,通过电子或与其类似的其他方式记录的能够单独识别读者或结合其他相关信息识别读者个人的,与读者有关的各类信息,但不包含图书馆匿名化处理的读者个人信息[3]。
基于2018年实施的《中华人民共和国公共图书馆法》(以下简称《公共图书馆法》),读者个人信息可分为读者的身份信息、借阅信息和隐私信息。其中,读者身份信息识别的重点在于读者的“身份”,是指能够单独识别读者身份的信息,如姓名、身份证号码等,以及与其他信息结合识别读者身份的各种信息,如年龄、职业等。借阅信息识别的重点在于读者的“阅读特征”,是指与读者利用公共图书馆文献资源有关的各种信息,包括读者的借阅历史、数据库查询浏览记录等信息。隐私信息识别的重点在于读者的“私密”,是指读者在利用公共图书馆的过程中产生的具有高度私密性的信息,即读者“不愿为他人知晓”的隐私信息及如被不当利用将侵扰读者生活安宁的隐私信息,如某些特定阅读信息、移动定位信息、图书馆监控等[4]。
相较于传统图书馆,智慧图书馆读者个人信息的采集对象更加广泛。其采集范围不局限于本馆读者,还包括了各类型图书馆合作或联盟成员馆间通借通还的读者,如上海“一卡通”服务就是由上海市238家一卡通成员馆组成的,不仅通借通还,主分馆的读者还都能够随时随地上云进行智能检索,共享云上的资源和信息。
相较于传统图书馆,智慧图书馆读者个人信息的采集方式更趋向于无感化。在传统图书馆中,读者会参与到读者个人信息的收集过程中,如办理读者证时填写个人信息、借书时刷读者证等。而在智慧图书馆中,在人工智能、大数据、云计算、泛在感知等新技术的加持下,无处不在的数据采集行为往往不为读者所感知,让读者无形中成为“被监控”的对象。
相较于传统图书馆,智慧图书馆读者个人信息的载体更加多元化。除了传统的卡片式读者证外,目前在国内不少公共图书馆内还可使用居民身份证、居民社保卡、电子学生证、二维码读者证、人脸识别、随申码等来代替读者证。
相较于传统图书馆,读者个人信息的内涵更加丰富。除了读者的个人身份信息和传统的借书、还书的信息,在智慧图书馆中,读者的一切与图书馆有关的行为记录都将有迹可循[5],这些痕迹数据包括读者在申请读者证时可能会使用到的个人信用信息(如上海图书馆的免押金信用阅读)、在入馆时留下的个人生物识别信息(如刷脸入馆)、使用增强现实(AR)技术结合导航追踪定位技术获取指示地图的实体活动轨迹、使用座位管理系统时留下的座位使用信息、使用虚拟参考咨询服务时留下的问答记录、参加在线直播论坛等的活动历史数据等。
在大数据时代背景下,个人信息安全已经成为一种社会性问题。读者个人信息中的部分信息属于图书馆特有,通过对这些信息进行分析挖掘,就可以掌握读者的个人基本情况以及阅读习惯、资源需求等,其中蕴含着巨大的管理、研究价值,同时也具备潜在的商业利益,如果对这些信息处理不当,就会让读者的个人隐私权受到损害,甚至伤及生命财产安全[6]。例如,目前物联网技术的应用是传统图书馆向智慧图书馆转型的重要措施[7],无线射频(Radio Frequency Identification, RFID)技术更是被普遍应用于图书馆的智能安全门禁系统、智能借还系统及智慧书架系统等,而当RFID电子标签被不法分子读取时,读者就面临着位置信息泄露被跟踪、研究方向泄露被恶意竞争等的风险[8]。
从智慧图书馆的角度出发,读者个人信息是智慧图书馆提供个性化服务、预测读者需求、更新迭代的基础数据,没有数据,何来“智慧”。智慧图书馆收集的读者个人信息越多、分析得越深入,绘制出的“读者画像”才能更多维化、精确化,提供的服务才会更智能化、个性化,但与此同时,读者个人信息泄露的风险也会更大。
而从读者自身的角度出发,随着隐私保护意识的不断增强,读者对个人信息保护的关注度也会不断上升,在享有智慧图书馆提供的智慧服务的同时,读者也希望尽可能少地提供个人信息以确保个人隐私安全[9],尤其是敏感个人信息(如生物识别信息、医疗健康信息、金融账户、行踪轨迹等)。
因此,智慧图书馆在获取和处理读者个人信息的过程中,需要承担起保护读者个人信息的责任,并根据所能提供的服务去采集对应的信息,寻找读者数据保护和运用之间的平衡。
迄今为止,除条例、指南外,我国关于个人信息保护的法律有4部,即《中华人民共和国网络安全法》(2017年6月1日起施行)、《公共图书馆法》(2018年1月1日起施行)、《中华人民共和国民法典》(2021年1月1日起施行)和《个人信息保护法》(2021年11月1日起施行),这4部法律各有千秋,为读者个人信息的保护提供了基本遵循。
具体到读者个人信息领域,《公共图书馆法》虽首次以法律文件的形式对保护读者个人信息进行了明确,但其内容过于简单,缺乏具体细则,在实际使用中难以对读者个人信息进行有效保护[10],稍显滞后,需要完善。《公共图书馆法》中的读者个人信息、借阅信息和隐私信息都可以划归到不确定法律概念的范围之中,由于其定义不明确,导致在实际使用时需要法官或执法者自由裁量,可能产生过度解读的问题[11]。针对这一问题,可以通过将读者个人信息重新进行分类,使《公共图书馆法》与最新立法相互衔接[12]。然而,结合智慧图书馆时代下读者信息的特点,单纯地对读者信息进行进一步的细致化分类可能会过于烦琐,缺乏实践价值,建议可以仿照《中华人民共和国保守国家秘密法》对读者信息进行分级保护[10],并通过确立读者个人信息保护原则以涵盖可能出现的风险[13]。
为了应对复杂且不断变化的恶意攻击手段,智慧图书馆应结合现有的网络安全技术,针对读者个人信息的收集、存储、使用、传输等不同场景进行分析,积极探索、实践新型的技术保护手段,以期形成一套高效的读者个人信息安全保障技术体系。
在读者个人信息的收集阶段,目前主要使用的隐私保护技术有隐私加密技术和匿名化技术,均存在一定局限性。加密技术就是通过对数据进行加密来防止被入侵者窃取或篡改,有计算开销小、加密速度快的特点,但其不适合分布式网络系统,且不能防止数据外流[14]。匿名化技术则主要是采用删除、加密、泛化等方式对信息进行处理[15],但是存在利用匿名数据集重新识别个体身份的可能性[16]。目前,可以通过与引入随机变量加密[17]、差分隐私技术等来进行技术优化[18]。
在储存、使用、传输读者个人信息时,云计算技术扮演着重要角色。云计算是指在广域网或局域网内统一资源(硬件、软件、网络等),实现数据远程计算、存储、处理和共享的托管技术[19]。云端存储可大大减轻智慧图书馆的数据存储压力,且让数据访问不受到地理位置和时间的限制。而云计算强大的计算能力则能让智慧图书馆的海量数据得以有效衔接,处理分析更加高效[20]。为了提升智慧图书馆云计算环境的安全等级,更好地保护读者个人信息等重要、敏感信息的信息安全,除了选择可靠的云计算服务商、完善法律法规等,技术层面上智慧图书馆可以通过如下方法进行优化:(1)改进身份认证技术。除了传统的密码式认证方法,可引入面部、语音、指纹和虹膜识别技术,将身份认证模式多层次化。如果用户想要访问读者个人信息数据,需要通过系统智能查辨来识别用户的访问权限,再根据权限由智慧图书馆对用户进行授权。(2)强化读者个人信息的安全传输。在传输过程中,SSL/TLS协议可以用于加密读者的个人信息,确保即使数据在传输过程被黑客拦截,其内容也无法解密。此外,目前还有学者基于粒子群算法设计了隐私信息隐藏与安全传输方法[21],用于有效隐藏与安全传输隐私信息。(3)优化读者个人信息的加密存储策略。针对读者个人信息云存储的数据安全问题,参考韩培义等[22]提出的CloudCrypt系统,可将读者个人信息数据加密后再上传至云端,如此,云计算服务商所拥有的只是加密后的信息,智慧图书馆在将信息存储在云端的同时仍保留信息的完全控制权,且可通过集成基于安全网关执行的密文搜索功能(proxy executed searchable encryption,PESE)来最大限度保留云应用原有的搜索功能。
此外,针对目前广泛运用于智慧图书馆的RFID技术对读者个人信息所带来的隐私泄露的风险,技术层面上可以通过采用RFID标签匿名化技术、随机性技术、前向安全性技术、访问控制技术、法拉第罩网技术来实现[23]。
智慧图书馆应明确读者个人信息保护的责任部门、责任人和联系人,制定详细的读者个人信息管理制度和操作规程,具体如下。
读者个人信息的收集应遵循用户同意原则,并且只收集与服务内容有关的数据。智慧图书馆可以学习国外图书馆,在网站主页上设置可见性强的隐私政策链接,公开读者个人信息收集、使用的规则、目的、方式、范围等,同时确保政策内容的全面性和可揭示性,以减轻读者的隐私顾虑[24]。
读者个人信息的存储和传输应设置合理的分类分级制度,以便对不同敏感程度的信息进行不同等级的保护,并设置信息的删除规则。对于敏感程度高的信息,可以加密后存储在智慧图书馆内部存储系统;敏感程度一般的信息则可以加密后上传至云端存储。读者个人信息的删除则主要会涉及以下3种情况:(1)读者主动请求删除。设置读者自身能触达的界面让读者自行删除,或提供邮箱、电话等渠道让读者申请删除。(2)违规账户删除。需要智慧图书馆制定账户监管规则,对有特定违规行为的账户进行主动删除。(3)临时信息的到期自动删除。对于一些临时信息,智慧图书馆应设置存储期限并制定定期清理策略,防止信息堆积,保持信息库整洁和有效,避免资源浪费。
读者个人信息的使用要有评估和记录环节,确保是依法依约的使用,避免乱用、滥用。一方面,馆员在大量导出、分析读者个人信息前,应先通过评估,不得擅自随意使用。另一方面,馆员在使用读者个人信息数据后,应有台账记录信息使用的时间、用途、结果,以便管理。
此外,智慧图书馆应定期开展网络安全与数据合规审计工作,重点审计读者个人信息的长期保存、访问权限、隐私保护等方面,对于未来可能出现的读者个人信息泄露事件,应做出应急预案并定期对其进行演练和完善,并将结果及时报送主管部门。
个人信息安全风险的主要来源之一是信息安全意识薄弱,相较于智能技术的飞速发展,信息安全意识的发展却相形见绌[25]。
没有读者参与的信息安全体系是脆弱的,智慧图书馆应该重视读者在个人信息保护中发挥的主观能动作用。智慧图书馆作为公共文化机构,有义务去引导读者学习相关的法律、了解图书馆的隐私政策、培养自我隐私保护意识和个人责任意识、提高自身隐私保护能力,具体可通过在网站主页设置可见性强的隐私政策链接、在馆内张贴安全公告、设置弹窗提示、配备信息安全教育专员、开展信息安全讲座和知识竞赛等方式来实现,通过多方面的支持去帮助读者在个人信息安全受到威胁时能够进行及时防备和抵抗。
图书馆员在处理读者信息时可能会存在因为意识疏忽而导致读者信息出现泄露的风险[26]。图书馆应在日常培训管理中培养馆员的信息安全意识,组织馆员学习国家及所在单位的网络安全管理规定,并在馆员考核标准中增强信息保护知识和技能的考核,制定规章守则约束馆员的工作行为,如要求馆员在使用工作电脑时不随意点击陌生邮件中的链接或附件、及时更新杀毒软件、不随意放置或者丢弃含有读者个人信息的纸质文件、有效抵御现代社会工程学攻击等。
基于2021年发布的《“十四五”公共文化服务体系建设规划》中提出的“以人为中心”的公共图书馆转型理念,对于未成年人读者和残障读者等特殊群体,智慧图书馆作为未来图书馆的发展方向,也需要根据不同情况制定相应的保护策略以保护其个人信息不受侵犯。比如,哪些个人信息可以向未成年人的父母、残障人士的监护人提供,哪些个人信息仅能提供给读者本人,对于不同年龄段的未成年人、不同情况的残障人士是否需要采用不同的个人信息保护政策等,都需要进行进一步的探索研究。
《图书馆服务宣言》中提到,图书馆的核心目标包括“提供优质、高效、专业的服务”[27]。读者个人信息是智慧图书馆根据读者的需求和喜好进行用户画像,从而提供数字化、智慧化和个性化服务的数据基础,是信息时代图书馆服务创新的重要基石。保护好读者个人信息是智慧图书馆的重要责任,智慧图书馆应砥砺前行,积极探索顺应智慧化时代背景的读者个人信息保护方法,研究解决读者个人信息利用与读者个人信息保护之间的潜在冲突,实现读者个人信息保护和利用之间的平衡。