国内外网络隐私博士学位论文的计量分析

2018-03-14 19:26秦渴袁勤俭
现代情报 2018年2期
关键词:共词分析可视化

秦渴+袁勤俭

〔摘要〕本文以博士学位论文为研究对象,通过共词分析、可视化等方法对国内外网络隐私的发文情况、研究热点与研究主题演化进行了对比分析。结果显示,国内外的发文情况存在较大的差异,国内有必要学习国外博士学位论文的研究角度不断地拓展网络隐私的研究视角;在研究热点与主题演化方面,国内外研究的相同点表现在:对网络隐私保护的技术研究和网络隐私与数据的研究较为重视,都呈现出对新兴技术带来的网络隐私问题较为关注的发展趋势等;相异点表现在:国外对信息分享中的隐私问题一直较为重视,而国内对位置服务中的网络隐私较为关注。

〔关键词〕网络隐私;共词分析;可视化;博士学位论文

DOI:10.3969/j.issn.1008-0821.2018.02.022

〔中图分类号〕G250252〔文献标识码〕A〔文章编号〕1008-0821(2018)02-0138-10

The Quantitative Analysis of Doctoral Dissertations on

Internet Privacy at Home and Abroad

Qin KeYuan Qinjian*

(School of Information Management,Nanjing University,Nanjing 210023,China)

〔Abstract〕This paper took the doctoral dissertations as the research object,and through the methods of co-word analysis and visualization,it made a comparative analysis of the development of network privacy at home and abroad,the research hotspots and the evolution of research topics.Through the summary,it was found that the similarities between domestic and foreign research were as follows:the technical research on network privacy protection was more and more important and showing the development trend of the research on the network privacy problem brought by the emerging technology,etc.The different points were:the problem of privacy had been more important but the domestic privacy of location services was more concerned.

〔Key words〕network privacy;co-word analysis;visualization;doctoral dissertation

隨着互联网的普及,人们已经习惯借助于网络开展各种活动,如浏览新闻、在线购物、在线理财等,这些活动过程使得大量的个人信息被滞留在网络环境中,极易被非法搜集与利用。红极一时的人肉搜索一度成为以普通人隐私为代价的狂欢,在线购物评价在为其他买家提供参考的同时也触发了评论者自身的隐私危机,社交网络用户隐私泄露事件更是层出不穷,网络隐私侵犯案件频繁发生。

在网络隐私问题愈发严重的情况下,对其的研究也逐渐成为国内外学者关注的焦点,涌现出一些有价值的研究成果,有学者就网络隐私研究进展进行了分析。这些成果大体可以分为以下3类:1)基于学者学术经验视角的分析。张玥等以国外期刊发表的信息隐私相关文献为研究对象,从隐私关注和隐私行为两个视角对图书情报领域的信息隐私研究成果进行了述评[1]。蒋骁等则对国内外网络隐私研究的相关文献按研究主题归为网络隐私关注、行为意向以及二者的影响因素3类,然后围绕着这3个方面对研究进展进行总结[2]。凡菊等从隐私问题和隐私保护机制两方面对国内外网络隐私研究的相关内容进行归纳[3]。2)基于文献内容的计量分析。Tse J等以“IEEE Security and Privacy”期刊上2003-2014年的所有论文为研究对象,采用文献计量法对网络隐私研究的论文摘要和标题进行主题和JK双标图分析[4]。Yun H等则以2014年之前的期刊论文、会议论文以及学位论文中实证型的论文为研究对象,然后通过一定条件的筛选最终得到89篇相关文献,并利用Meta分析法研究这些文献中的网络隐私关注[5]。此外,刘子龙等从国外11种信息系统内的重要期刊中选取41篇信息隐私的研究文献作为分析对象,通过构建一个基于理论基础、研究层次、研究方法等分析视角的研究框架对文献内容进行分析[6]。3)基于文献外部特征的计量分析。李雪等以2004-2014年期间SSCI收录的网络隐私问题研究型论文为研究对象,采用文献计量法从文献来源、被引频次、高频关键词等角度分析网络隐私研究现状[7]。

前述这些有关网络隐私研究进展的成果对学界把握网络隐私研究动态具有很大帮助,但是这些成果主要是对期刊论文的分析,仅有一篇论文的分析涉及到10篇学位论文。然而,博士学位论文一般是围绕着各学科专业的研究前沿或重大科学问题,对相关研究进行专门、深入、系统的研究,具有很强的原创性[8],是非常重要的科学研究成果之一,不仅代表各学科领域的发展情况,也是掌握研究动向、了解研究成果最完整的文献资料。为了帮助学界掌握国内外博士学位论文有关网络隐私的研究进展,本文拟以博士学位论文为研究对象,利用共词分析法、社会网络分析法、内容分析法对国内外网络隐私的相关文献进行对比研究,从发文情况、研究热点、主题演化3个角度进行探讨,并借助VosViewer、NetDraw等可视化分析软件进行图谱展示。

1文献筛选与数据处理

文献的筛选与数据处理是文献计量的重要步骤,是进行研究成果可视化的重要前提。为了保证数据的可靠性与规范化,本研究的文献筛选与数据处理分为以下4步:

11确定文献来源

对于国外文献来源,本文选择了PQDT博硕士学位论文数据库,其作为世界著名的学位论文数据库,主要收录了来自欧美国家1 700余所知名大学的优秀博硕士论文,涉及文、理、工、农、医等多个领域,是学术研究中十分重要的信息资源。对于国内文献来源,本文首先在国家图书馆的在线馆藏博士论文资源库中以“隐私”为关键词进行检索,仅检索到45篇相关文献,然后又在各学位论文数据库中进行初步检索。检索结果表明,中国知网优秀博硕士学位论文数据库、万方学位论文全文库以及国家科技图书文献中心学位论文库3个数据库收录的相关学位论文涉及学科较全、数量较多,且包含上述45篇相关文献。因为这3个数据库的初步检索结果存在些许的不同,所以,为了保证数据来源的可靠性,本文将上述3个机构的学位论文库作为国内文献来源。

12检索文献

目前国内外对网络隐私还没有形成一个统一的官方术语和定义,例如国外的网络隐私对应的外文包括“Online Privacy”、“Network Privacy”、“Internet Privacy”等;此外,国内直接研究“网络隐私”的文献相对较少,大部分都是从网络发展中的某一个角度进行研究,比如数据发布中隐私问题、电子商务交易中隐私保护等。针对这些问题以及考虑到博士学位论文并没有像期刊、会议论文的产出量那么高,本文在“关键词”中采用“KY %‘隐私”和“Diskw(Privacy)OR Diskw(Privacies)”作为检索式,在上述的文献来源库对2017年之前的文献进行检索,然后再逐条地对相关文献进行筛选,从而全面地检索出以网络隐私为主要研究内容的文献。

13文献去重

由于3个国内学位论文数据库收录许多相同的文献以及PQDT中导出文献存在重复选择文献的情况,因此将上文检索到的国内外文献分别导入到NoteExpress软件中进行文献的去重处理,以保证后续研究中数据的准确性。

14数据清洗

关键词是每位作者根据论文研究内容选取的,没有一个国际统一的标准词库可供选择,所以存在同一事物词语表达的不同。因此,为了便于统计,本文对相关、相似的关键词进行了合并,排除单复数差异、连字符、同事物术语不一致等现象对关键词分析的影响,如表1所示。

2研究方法与研究工具

本文采用的研究方法和研究工具如下:1)共词分析法。它通过统计一组文献的主题词之间两两在同一篇文献出现的频率,进而形成一个由这些词对关联所组成的共词网络来反应主题内容的亲疏关系[9]。其一般包括高频关键词抽取、构建共词矩阵与数据分析3个步骤[10]。2)VosViewer可视化工具。VosViewer是一款使用较为广泛的、用于分析文献计量学网络的工具,它具有标签、密度、聚类密度以及分散4个视图,其中密度视图以颜色冷暖表示研究的重点与热点。本文将利用VosViewer对关键词共现网络进行可视化展示,以发现网络隐私的研究热点。3)Ucinet可视化工具。Ucinet是一款经常用于处理社会网络数据和其他相似性数据的综合性分析工具,它能够处理的原始数据为矩阵格式,并提供了大量数据管理和转化工具。本文首先构造年份—关键词2—模矩阵,然后通过此工具及其内嵌软件Netdraw来生成“年份—关键词”网络图谱,从而对网络隐私研究主题演化进行可视化分析。

3发文情况分析

31发文量分析

经过文献筛选与数据处理,本研究最终得到439篇国外文献,233篇国内文献,相关文献在时间上的分布如图1所示。从图中可以看出,国内外网络隐私研究的发文量随着时间的推移整体上呈上升趋势。

国内对网络隐私的研究开始于2003年,来自西安交通大学的博士生李乃乾在研究复杂关联规则的数据挖掘算法时将网络隐私问题作为其重要的内容[11]。随后,2005年复旦大学的葛伟平[12]、2006年北京大学的张鹏[13]等博士研究生开始研究数据挖掘中的隐私保护方法。直到2014年,國内对网络隐私的研究一直处于向上发展趋势。此外,对2016年发文量如此低的情况,本文进行了仔细地排查,并没有发现什么误差,所以猜测这可能是因为国内对博士学位论文的收录有一定的滞后性。

国外相关研究起步较早,几乎每年的发文量都要高于国内,并在2013年达到高峰。1998年,来自田纳西大学Sheehan Kim Bartel是最早在博士学位论文中关注网络隐私问题的博士研究生,其主要研究用户的隐私关注与网络行为之间的关系[14]。由此,网络隐私问题开始受到国外博士生及其导师的关注。2000-2008年期间,国外博士学位论文中对网络隐私的关注一直处于逐年增长的发展趋势。2010年以后,网络隐私的研究趋势呈“W”的发展型,但是发文量基本维持在40篇上下,说明国外对网络隐私问题的研究已处于一种平稳发展的趋势。

对比国内外网络隐私发文量趋势图可以发现,国内研究晚于国外,2011年以前,国内研究的发文量都低于国外,但是,近些年来,国内的研究发文量正在与国外持平,尤其在2014年,首次超过国外。这也迫使本文想进一步分析国内外的研究热点与重点,证明是否国内外目前的研究情况存在相似之处,以及未来的发展趋势是否一样。

32发文机构分析

学位授予机构是博士学位论文成果的一个重要影响因素,对网络隐私研究文献的发文机构进行分析,不仅可以了解到网络隐私研究的地区分布,还可以看出哪些学校对网络隐私问题更加关注与重视,为后续的研究者提供相关文献的来源机构,或者为致力于研究网络隐私问题的博士学位申请者提供可以选择的机构。

国内网络隐私的主要研究机构可以分为两类:一是理工科类大学,包括北京邮电大学、西安电子科技大学、哈尔滨工程大学、电子科技大学、华中科技大学、中国科学技术大学;二是综合类大学,包括复旦大学、北京大学、中科院大学以及山东大学,理工科类的大学占绝大多数。值得注意的是,我国信息技术领域三所著名高校,又被称为“两电一邮”的电子科技大学、西安电子科技大学和北京邮电大学分别排名第四、第二和第一,这说明国内对网络隐私問题的研究大多是从信息技术角度展开。发文量最多的机构——北京邮电大学对网络隐私的关注度非常高,尤其是博士学位论文。本研究初步在中国知网中以“网络+隐私”为主题进行检索,共检索到233篇文献,可见此机构对网络隐私问题的研究热度。此外,在本研究检索到的文献中,此机构还涌现出一批优秀的博士生导师:方滨兴、罗守山、吕廷杰等,他们所指导的关于网络隐私的博士学位论文的数量均在2篇及以上。而国外网络隐私研究的主要机构大部分为公立的综合型大学,比如普渡大学、威斯康星大学麦迪逊分校、加州大学尔湾分校等,并没有出现偏向于理工类或者人文类的学校。本文又进一步对检索到的文献进行了内容分析。研究结果发现,国外网络隐私的主要研究领域包括社会科学(Social Sciences)、密码学(Cryptography)、心理学(Psychology)以及传播与艺术(Communication and the Arts)等。这说明国外对网络隐私的研究角度并没有局限于某一学科领域。发文数量最多的普渡大学,是最早开创美国首个高校计算机科学系的大学,并且一直保持着很强的实力,本机构的博士学位论文也更多地从技术的角度探讨网络隐私保护问题,如表2所示。

对比国内外主要的发文机构可以看出,国内的发文机构有着明显的学科倾向,而国外则不明显,说明对网络隐私的问题的研究,国外关注角度范围更广,国内的研究方向较为单一。但是,从国内外较高发文机构的研究方向来看,国内外对从技术角度实现网络隐私保护较为重视。所以,未来国内应该在保持目前研究的方向基础上逐渐地拓宽研究视角。

33博士生导师分析

博士生导师及其硕士、博士研究生所构成的研究团队都会围绕着某一个主题领域进行长期的研究,并撰写有关该主题的研究文献。1位博士生导师所领导的团队在某一个主题领域的研究成果越丰硕,代表着该研究团队在该主题领域的研究实力越强。1位博士生导师指导的博士所撰写的网络隐私博士学位论文数量越多,就表明该研究团队对网络隐私越关注,实力也较强。哈尔滨工程大学杨静是国内指导博士研究生完成网络隐私博士学位论文最多的博士生导师,其团队研究方向有数据挖掘、数据分类以及隐私保护等,承担有国家自然科学基金项目《面向数据流的双重隐私保护技术研究》等。北京邮电大学5位博士生导师指导网络隐私博士学位论文数都入围前12,这足以见北京邮电大学对网络隐私问题十分关注,是国内有关网络隐私整体研究实力最强的机构。加州大学尔湾分校Tsudik Gene是国外指导博士研究生完成网络隐私博士学位论文最多的博士生导师,其团队的研究方向有隐私、计算机和网络安全以及应用密码学等。普渡大学两位博士生导师指导网络隐私博士学位论文数均大于或等于五,分别排名第二、第三,可见普渡大学是国外有关网络隐私整体实力最强的机构,如表3所示。

表3国内外指导3篇以上网络隐私博士学位论文的导师及论文数

数量国内导师来源机构国外导师来源机构

8杨静哈尔滨工程大学

7冯登国中国科学院大学、中国科学技术大学Tsudik GeneUniversity of California,Irvine(加州大学尔湾分校)

6CliftonChristopher W.Purdue University(普渡大学)

4研究热点分析

某一领域的研究热点是指在该领域中受到广泛关注并对该领域的发展起到推动作用的知识。关键词是作者对文献内容和研究价值的精炼,高频关键词可以被视作某一领域内的研究热点,频率越高说明研究的热度越高。本研究将通过对高频关键词的统计与可视化来分析网络隐私的研究热点。

41高频关键词分析

通过对关键词清洗与词频统计分析后,选取频次大于5的高频关键词进行分析与可视化。其中,国内高频关键词有31个,国外高频关键词有51个,如表4和表5所示。图2、图3为VosViewer软件对国内外高频关键词共现网络的可视化,它们是VosViewer的密度视图,以颜色的冷暖来表示研究的热点和重点,颜色越热表示标签的关注度越高,研究热度越高,越受到重视。

国内网络隐私研究最热的为“隐私保护”,频次高达163,其次是“匿名”、“数据挖掘”、“位置服务”等,频次均在17次及以上。与“数据”有关的标签多次出现,其次是“位置”。国外研究中,“Privacy(隐私)”研究最热,其次为“Security(安全)”、“Privacy Preservation(隐私保护)”、“Social Network(社交网络)”等。与“Data(数据)”有关的标签也多次出现,其次是“Information Sharing(信息分享)”。对比国内外共词图谱发现,国外的研究热点多于国内,国内外的网络隐私研究既有共同点,也存在不同点。

42热点聚类分析

为了更加清晰地分析国内外的研究热点,采用VosViewer软件的聚类密度视图辅以分析,如图4、图5所示。聚类密度视图以不同颜色来表示不同类群,国内视图中共出现了7种不同的颜色,而国外视图中则出现了7种以上的颜色,说明国外的研究范围广泛,角度多样,而国内研

究的类群虽然相对较少,但是每个类群的标签则较为丰富,说明某些领域的研究深度较国外要强。然后,本研究通过内容分析法对国内外相关文献进行阅读与分析,最终归纳以下研究热点。

1)网络隐私保护的技术研究

在共词聚类图谱中,“隐私保护(Privacy Preservation)”、“加密技术(Encryption)”、“K-匿名(K-anonymity)”、“安全多方计算(Secure Multi-Party Computation)”等标签体现了网络隐私保护技术的研究主题。加密技术、匿名技术以及聚类方法是进行网络隐私保护的基本技术。全同态加密技术,又称隐私同态[15],其作为一种重要的加密技术,因具有直接操作密文的良好性质,广泛地被应用在云计算、安全多方计算、密文搜索、电子投票。在李晨的博士学位论文中,为了更好地保护智能电网中的隐私,他首先提出一个部分全同态加密方案,逐步改进与优化后,实现完全全同态的加密方案[16]。冯超在博士论文中探讨如何构造高效、具备实用性的全同态加密方案,并提出了一个快速密钥生成算法[17]。在匿名技术中,被探讨最多的为K-匿名技术[18-19],它是网络隐私保护的重要技术之一,由Samarati P和Sweeney L[20]提出,它通过匿名化(如泛化和隐匿)原始数据集中的某些属性值形成满足一定匿名要求的匿名数据集并可用于数据发布。聚类分析方法可以提高数据发布时的效应,减少隐私泄露风险,比如基于划分的k-means聚类算法。杨高明提出一种消除离群点干扰的K-匿名算法,这种方法通过密度聚类把数据集分成簇,在划分数据集的同时排除离群点干扰,不仅实现隐私保护的目的,而且降低信息损失和增加数据效应[21]。

2)网络隐私与数据的研究

在共词聚类图谱中,“数据挖掘(Data Mining)”、“数据发布(Data Publishing)”、“数据安全(Data Security)”、“K-匿名(K-anonymity)”类团,与“数据库(Database)”、“数据(Data)”、“加密技术(Encryption)”类团等组成数据中网络隐私问题的研究主题。随着计算机技术和网络技术的发展,生活中的各类信息都被0或1组成的一组数据表示而在网络中被传输,越来越多的事物被数字化,“数据”这个词被广泛提及。网络中每天都有大量的数据被发布,这些数据被频繁地访问,不少研究者出于不同的目的对其进行挖掘与分析。然而,这些数据中往往包含着许多用户隐私,上述过程极易造成这些隐私的泄露与非法利用。2001年来自麻省理工学院的Sweeney Latanya Arvette[22]、2002年来自卡佩拉大学的Cadogan Rochelle Ann[23]是较早在其博士论文中重点研究数据隐私问题的博士生。2003年,西安交通大学的博士生李乃乾在研究复杂关联规则的数据挖掘算法时将网络隐私问题作为其重要的内容[11]。直到现在,数据中网络隐私问题仍被国内外研究。2014年,北京大学的喻梁文探讨了社会网络数据发布中的若干隐私保护问题[24];2015年,北卡罗来纳州立大学的Jorgensen Zachary研究利用差分隐私技术来实现数据分析中的网络隐私保护[25]。由此可见,数据挖掘、数据分析、数据发布等过程中的网络隐私问题一直是国内外研究的共同点。

422国内外相异的研究热点

1)国内对位置服务中的网络隐私问题关注度较高

国内研究中“位置服务”、“位置隐私保护”、“移动互联网”等高频关键词都直接或间接涉及到“位置”,可见国内对于位置服务中的隐私问题研究热度要高于国外。目前,国内基于“位置”的各项服务应用普遍,如个性化推荐、路线导航、紧急救援等,由此引发一系列与位置隐私问题相关的研究。位置K-匿名技术、位置模糊技术、假位置技术以及私有信息检索技术是目前位置隐私问题研究的主要技术。周长利在其博士学位论文中基于一种假位置技术,即锚点技术中存在的问题,提出3个方面的位置隐私保护方法:基于敏感多样的锚点、基于连续锚点以及路网环境中基于锚点的位置隐私保护方法[26]。杨松涛针对传统主流技术中存在的不足提出一种基于中心服务器结构的隐私保护模型和伪随机置换方案,从而满足完美匿名、位置盲查询和按需查询的要求,实现对位置隐私的保护[27]。

2)国外对信息分享中的网络隐私问题关注度较高

国外研究中,“Information Sharing(信息分享)”、“Social Network(社交网络)”、“Facebook(脸书)”等高频关键词的出现表明信息分享研究的热度。社交网站的出现,如Facebook,给人们创造了一个自由交流的空间,用户可以在社交网站上发表自己的意见、分享自己的快乐、共享自己的知识,还可以和志趣相投的人进行交流、认识新的朋友等。然而,为了获得更好地服务与体验,社交网站中的用户往往会进行个人信息的自我披露,以及许多社交网站服务商为了自身利益与发展而对用户隐私问题不够重视,导致网络隐私问题不断增加。Banks Lerone D通过调查分析社交网络中的用户共享偏好以及共享心理,从而有针对性的进行用户隐私保护[28]。Waldman Ari Ezra将Facebook作为其研究的一个案例来研究是什么原因促使用户共享个人信息的行为以及激发共享的社会信任标记[29]。

5研究主题演化分析

网络隐私研究的主题演化主要是基于纵向时间维度来展开。本研究构造了年份—关键词2—模矩阵,并借助于NetDraw软件绘制2—模网络图,如图6和图7所示,进而可以直观地分析网络隐私研究主题的演化路径[30]。图6和图7中,圆圈代表年份,菱形代表關键词,二者之间的连线表明某年份出现了某研究主题;连线越密集,说明某年份出现的研究主题越多,网络隐私研究越活跃。为了更加清晰地分析研究主题演化,本研究对图谱进行了标注,标注规则如下:Y代表年份,K代表研究主题域,符号后的数字代表不同时间段,其中K1-2表示时间段1和2共同的研究主题域。本研究结合内容分析以及各年份网络隐私研究的活跃度,分别将国内外划分为3个时间段,下文将进一步对国内外研究主题演化进行分析。

51国内研究主题演化分析

Y1时间域的起止时间为2003-2005年,这一时间域主要特点是网络连线稀疏,研究主题较少、相关研究活跃度低,甚至都没有出现此时间域相对应的研究主题域。此时间域主要的研究主题集中在K1-2-3主题域中,出现了“隐私保护”、“数据挖掘”、“数据安全”等主题标签词。这一时间段是国内博士学位论文中网络隐私研究的初始阶段,它以数据挖掘中隐私保护为出发点,开启博士学位论文中对网络隐私问题的研究大门,并且这一研究问题一直贯穿整个时间域。

Y2时间域的起止时间为2006-2010年,这一时间域内网络连线开始密集,研究主题逐渐增加,集中于K2、K1-2-3主题域,出现了“可信计算”、“普适计算”、“聚类”等主题标签词,如陈小峰对可信计算平台模块中的隐私性保护机制进行详细的分析后提出一系列网络隐私保护方案[31]。由此说明这一时期网络隐私的研究开始转向一些新兴的计算技术和方法上。同时,这一时期电子商务的逐步发展也开始引起学者对网络隐私问题的关注,出现了“电子商务”、“数据”、“数据库”等主题标签词。

Y3时间域的起止时间为2011-2016年,这一时期网络连线十分密集,研究主题丰富,集中于K3、K1-2-3,相关研究十分活跃,是网络隐私研究的快速发展阶段。这一时期网络隐私的研究呈现以下特点:1)隐私问题研究的网络环境不断细化,如“物联网”、“社会网络”、“车载自组织网络”等;2)对位置服务中的网络隐私问题更加关注,除了第二阶段出现的“位置服务”,又新增加了“移动互联网”、“位置隐私保护”、“无线传感网络”等主题标签。

52国外研究主題演化分析

Y1时间域的起止时间为1998-2005年,此阶段为网络隐私研究的初步发展阶段,网络连线比较稀疏,研究主题较少,主题域集中于K1-2、K1-2-3。这一阶段出现了“Consumer Privacy(用户隐私)”、“Online Privacy(网络隐私)”、“E-commerce(电子商务)”等主题标签,说明国外在初始阶段主要是针对电子商务中在线消费所引发的网络隐私问题的研究,如来自印第安纳大学的Lee Ya-Ching剖析电子商务中网络隐私侵犯的问题并提出了保护网络隐私的措施以及怎样提高用户的隐私防范意识[32]。

Y2时间域的起止时间为2006-2010年,此阶段为网络隐私研究的发展阶段。网络连线较密集,研究主题较丰富,主题域集中于K1-2、K1-2-3。这一阶段研究呈现以下特点:1)新兴的计算技术和方法应用中的网络隐私问题开始引起关注,如“Ubiquitous Computing(普适计算)“、“Secure Multi-party Computation(安全多方计算)”等主题标签词的出现,来自普渡大学博士生Jiang Wei基于安全多方计算模型的不足,提出了一个负责任的计算框架,进而保证安全多方计算模型中的网络隐私保护[33]。2)信息分享中网络隐私问题逐渐引起重视,出现了“Information Sharing(信息分享)”、“Social Network(社交网络)”、“Trust(信任)”等主题标签词。

Y3时间域起止时间为2011-2016年,此阶段为网络隐私研究的快速发展阶段。网络连线十分紧密,研究主题丰富多样,主题域集中于K3、K1-2-3。随着网络技术和信息技术的发展,网络隐私的研究重点由普适计算、安全多方计算等计算方法转向大数据、云计算、机器学习等新发展的技术和方法上,出现了“Big Data(大数据)”、“Cloud Computing(云计算)”、“Machine Learning(机器学习)”等主题标签词,如针对医疗云计算中患者个人健康信息的隐私问题,Kocabas Ovunc提出基于完全同态加密(FHE)来对加密的个人健康信息数据进行计算以保证隐私的不被泄露[34]。信息分享中的网络隐私问题一直是研究的热点,本阶段又出现了“Facebook(脸书)”等主题标签词。

图7国外网络隐私研究的主题演进

通过上文的分析可以看出,国内外的相同点表现在:1)都呈现三阶段的发展特点,对网络隐私的研究关注度都是逐步增长,并没有出现研究的忽热忽冷现象,可见国内外对网络隐私问题一直都较为重视。2)新兴网络技术和信息技术的发展过程中所产生的网络隐私问题一直是国内外研究的焦点。国内外的不同点表现在:1)初始阶段中,国内外对网络隐私的关注度不同,国内开始于数据挖掘中网络隐私问题,而国外则开始于电子商务。2)在第三阶段中,国内较关注隐私问题的网络环境,而国外对大数据、移动计算等新技术所引发的网络隐私问题较为关注。因此,未来的研究中,国内应该加强对大数据技术、云计算技术等应用过程中网络隐私的关注,虽然国内也开始关注此问题,如来自北京邮电大学的张莹光对云计算环境下的图状数据处理中隐私问题进行探讨,并提出隐私保护方案和策略[35]。但是,由于这些新兴技术在国内的应用还处于初步阶段,其研究的深度和广度远不及国外,仅出现“云计算”一个主题标签词。此外,随着社交软件的普及,如微博、微信,信息分享已经成为一种常见的行为,网络隐私问题日益突出。然而,国内对这个问题的重视度远没有国外高,未来的研究应该加强这一方面的关注和进一步研究。

6总结与展望

本研究通过文献计量与可视化等方法对国内外有关网络隐私的博士学位论文比较分析后发现:1)在发文情况方面,国外发文量呈现逐步增长的趋势,主要的研究机构有普渡大学、卡佩拉大学等,主要的研究团队带头人有Tsudik Gene、Clifton Christopher W等;而国内发文量虽呈现逐步增长的趋势,但是整体趋势线要低于国外,主要的发文机构有北京邮电大学、西安电子科技大学等,主要的研究团队带头人有杨静、冯登国等。2)在研究热点方面,国内外都较为重视网络隐私保护的技术研究和网络隐私与数据的研究。3)在研究主题演进方面,国内外都呈现三阶段发展模式,都对每个阶段的新兴网络技术与信息技术所带来的网络隐私问题较为重视。

本研究还发现:1)对位置服务中的网络隐私问题,国内的重视度比国外高,出现多个与“位置服务”有关的高频关键词,而国外仅出现“位置隐私”一个。众所周知,位置服务的广泛应用致使用户的实时位置隐私通过网络被频繁窥探与非法利用,隐私问题不容忽视,如谷歌地图的街景功能。因此,国外应重视位置服务中网络隐私的相关研究。2)对信息分享中网络隐私问题与用户网络隐私关注度的影响因素,国内的重视度明显比国外低,高频关键词中甚至没有出现相关的词语。这主要是由于国内偏重从信息技术的角度研究网络隐私,忽略其他视角下的隐私问题,导致研究领域单一。因此,国内应该学习国外博士学位论文的研究角度与研究思路,逐步地拓宽网络隐私的研究视角和研究领域。

当然,本研究为学界提供了国内外博士学位论文中有关网络隐私的研究进展,如若全面地掌握网络隐私的研究现状,还需结合期刊论文、会议论文等文献载体中有关网络隐私的研究情况。未来的研究也可以基于多种文献载体对国内外有关网络隐私的研究成果进行计量分析。

参考文献

[1]张玥,朱庆华.国外信息隐私研究述评[J].图书情报工作,2014,(13):140-148.

[2]蒋骁,仲秋雁,季绍波.网络隐私的概念、研究进展及趋势[J].情报科学,2010,(2):305-310.

[3]凡菊,姜元春,张结魁.网络隐私问题研究综述[J].情报理论与实践,2008,(1):153-157.

[4]Tse J,Schrader D E,Ghosh D,et al.A Bibliometric Analysis of Privacy and Ethics in IEEE Security and Privacy[J].Ethics and Information Technology,2015,2(17):153-163.

[5]Yun H,Lee G,Kim D J.A Meta-Analytic Review of Empirical Research on Online Information Privacy Concerns:Antecedents,Outcomes,and Moderators[A].Proceeding of the 35th International Conference on Information Systems:Building a Better World Through Information Systems,the University of Auckland Business School Auckland,New Zealand,December 14-17,2014[C].Atlanta:AIS,2014.

[6]刘子龙,黄京华.信息隐私研究与发展综述[J].情报科学,2012,(8):1258-1262.

[7]李雪,许晓东.网络隐私问题的国际研究分析[J].现代情报,2015,(6):166-171.

[8]李干,袁勤俭.基于国外博士学位论文的知识管理研究热点及趋势[J].现代情报,2014,(6):41-47.

[9]钟伟金,李佳,杨兴菊.共词分析法研究(三)——共词聚类分析法的原理与特点[J].情报杂志,2008,(7):118-120.

[10]包金龙,袁勤俭.国际电子服务质量研究热点与趋势分析[J].情报杂志,2017,(2):146-151,145.

[11]李乃乾.复杂关联规则挖掘模型及算法研究[D].西安:西安交通大学,2003.

[12]葛伟平.隐私保护的数据挖掘[D].上海:复旦大学,2005.

[13]张鹏.数据挖掘中的隐私保护方法研究[D].北京:北京大学,2006.

[14]Sheehan K B.Antecedents and Effects of Privacy Concern Among On-line Consumers[D].Tennessee:The University of Tennessee,1998.

[15]Rivest R,Shamir A,Dertouzos M.On Data Banks and Privacy Homomorphisms[J].Foundations of Secure Computation,1978,7(1):169-177.

[16]李晨.全同態加密方案的研究[D].西安:西安电子科技大学,2015.

[17]冯超.全同态加密的相关算法研究[D].济南:山东大学,2015.

[18]何贤芒.隐私保护中K-匿名算法和匿名技术研究[D].上海:复旦大学,2011.

[19]任向民.基于K-匿名的隐私保护方法研究[D].哈尔滨:哈尔滨工程大学,2012.

[20]Samarati P,Sweeney L.Generalizing Data to Provide Anonymity When Disclosing Information:Proceedings of the Seventeenth ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems,PODS,Seattle,Washington,USA,June 1-4,1998[C].New York:ACM,1998.

[21]杨高明.基于聚类的隐私保护数据发布关键技术研究[D].哈尔滨:哈尔滨工程大学,2012.

[22]Sweeney L A.Computational Disclosure Control:A Primer on Data Privacy Protection[D].Massachusetts:Massachusetts Institute of Technology,2001.

[23]Cadogan R A.The Ethics of Data Privacy in an Electronic Marketplace:A Multiple Case Study of the Privacy Policy Notice and the Incorporation of Fair Information Practice Principles[D].Minnesota:Capella University,2002.

[24]喻梁文.社会网络数据发布中的若干隐私保护问题研究[D].北京:北京大学,2014.

[25]Jorgensen Z Y.Practical Private Data Analysis With Differential Privacy[D].North Carolina:North Carolina State University,2015.

[26]周长利.基于锚点的位置隐私保护方法研究[D].哈尔滨:哈尔滨工程大学,2015.

[27]杨松涛.基于位置服务中的隐私保护技术研究[D].哈尔滨:哈尔滨工程大学,2015.

[28]Banks L D.Searching for Privacy in an Increasingly Public World:Exploits,Experience,and Errors Toward New Models for Access Control in Online Environments[D].California:University of California,Davis,2011.

[29]Waldman A E.Privacy as Trust:sharing Personal Information in a Networked World[D].New York:Columbia University,2015.

[30]宗乾進,袁勤俭,沈洪洲,等.2001-2010年国内情报学研究回顾与展望——基于知识图谱当代学科发展动向研究[J].情报资料工作,2012,(1):10-15.

[31]陈小峰.可信平台模块分析与测试技术研究[D].北京:中国科学院软件研究所,2009.

[32]Lee Y.Internet Privacy and Electronic Commerce:Meeting the Challenge of Self-Regulation in a Digital Environment[D].Indiana:Indiana University,2002.

[33]Jiang W.Incentive-Driven and Privacy-Preserving Collaborative Computing[D].Indiana:Purdue University,2008.

[34]Kocabas O.Design and Analysis of Privacy-Preserving Medical Cloud Computing Systems[D].New York:University of Rochester,2016.

[35]张莹光.云计算环境下保护隐私的图状数据处理技术研究[D].北京:北京邮电大学,2014.

(责任编辑:郭沫含)

猜你喜欢
共词分析可视化
自然资源可视化决策系统
基于Power BI的油田注水运行动态分析与可视化展示
自然资源可视化决策系统
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新