电子商务中消费者隐私保护问题研究

2016-03-08 09:22赵俊杰
电脑与电信 2016年5期
关键词:隐私权数据挖掘电子商务

赵俊杰

(安徽财经大学工商管理学院,安徽 蚌埠 233030)

电子商务中消费者隐私保护问题研究

赵俊杰

(安徽财经大学工商管理学院,安徽 蚌埠 233030)

随着精准化营销和个性化服务的广泛使用,一些市场主体越来越注重对消费者的了解,他们在利益驱使下,在网上消费者不知情或不情愿的情况下采取各种技术手段获得和利用其信息,侵犯了消费者的隐私权。尽管消费者可以因此享受到更加便利和个性化的产品与服务,但是他们对个人隐私的保护问题也日益关注。本文对电子商务中消费者的隐私权进行概述,并总结了电子商务中消费者信息收集的常见途径,最后对基于隐私保护的数据挖掘技术与常见算法进行综述。

电子商务;消费者;隐私保护;数据挖掘;信息收集

1 引言

随着一切活动渐趋信息化,人们越来越依赖电脑、手机和网络,为了申请邮箱、注册个人用户、进行网上交易或是网上购物,我们必须提供姓名、联系地址等个人资料,有时甚至涉及出生年月、月收入等各种各样的私人信息。在使用这些网络新技术、享受网络带来的快乐和便利时,我们却不得不付出信息被记录下来的代价,平时不愿吐露、不能展现的隐私也可能因此而暴露在公众面前。据普华永道公司的调查,有81%的网络用户和79%的网上消费者对他们的个人隐私受到威胁感到担忧。更有说服力的是,有6%的网络用户和9%的网上消费者声称他们曾经成为过侵犯隐私的受害者。在网上从事直邮广告业务的智能邮递公司的一次调查表明,有75%的本来打算购物的消费者在被要求提供个人信息和信用卡信息时改变了主意[1]。

数据挖掘技术在电子商务中已经广泛使用,对个人隐私的保护带来了更加严峻的挑战。主要体现在两个方面:一方面,供各种挖掘方法使用的数据库中存储了大量的敏感信息,其中有些信息是在个人无意识甚至是不知情的情况下被收集的,而网络及其他媒体对信息的无限制暴露,已经开始对个人隐私构成严重威胁;另一方面,各种数据挖掘方法与工具的不断完善,也为一些普通用户通过不正当手段获取他人隐私信息提供了可能。如何对数据进行有效地挖掘,并同时保证个人的相关隐私不被泄漏,成为近年来数据挖掘领域的一个研究热点。

2 电子商务中消费者隐私权

个人隐私权是指个人对个人资料拥有民法所规定的权利,这些权利大致包括:控制权、收回权、知悉权、修改权和请求司法救济权。电子商务中个人隐私权是指网络与电子商务中所涉及到对个人数据的收集、传递、存储和加工利用等各个环节中网络用户的个人和生活不被干扰的权利与个人资料的支配控制的权利。其中个人数据主要指自然人的姓名、性别、出生年月、身份证号、特征、指纹、婚姻、家庭、教育、职业、健康、病历、财务情况、社会活动、E-mail信息、IP地址、Username与password等资料。隐私权保护主要涉及三方面问题:个人数据过度收集;个人数据二次开发利用和个人数据交易。

电子商务中个人隐私权从不同的角度来划分,可以有多种分类方法。首先,从权利形态来分有隐私不被窥视的权利、不被侵入的权利、不被干扰的权利、不被非法收集利用的权利。其中,隐私不被窥视、侵入的权利主要体现在用户的个人信箱、网上账户、信用记录的安全保密性上;隐私不被干扰的权利主要体现在用户使用信箱、交流信息及从事交易活动的安全保密性上;不被非法收集利用的权利主要体现在用户的个人特质、个人资料等不得在非经许可的状态下被利用上。其次,从权利的内容分可以有个人特质的隐私权、个人资料的隐私权、个人行为的隐私权、通讯内容的隐私权和匿名的隐私权等。

3 电子商务中消费者信息收集途径

电子商务企业通常会利用各种途径对消费者的资料进行收集,包括购物习惯、消费喜好、经济状况等,通过加工整理,获得具有商业价值的资料,形成比较优势。但这种行为可能会对消费者的个人隐私构成极大的威胁,因为有些收集行为是通过正当途径且告知消费者的,而有些收集行为是利用不正当的手段,是在消费者不知情的情况下进行的。电子商务企业对消费者信息收集途径主要有以下几种:

(1)网上直接调查法。网上直接调查法根据采用调查方法不同,可分为网上问卷调查法、网上实验法和网上观察法,常用的是网上问卷调查法。利用网上调查有很多优点,例如提高调研效率、调查数据处理便捷、降低调查成本、不受地理区域限制等,其具体形式主要包括:网上搜索法、网站跟踪法、电子邮件法、在线调查问卷、邮件列表法、对网站访问者的抽样调查和固定样本调查等。

(2)利用在线注册收集消费者信息。网上消费者为了进行电子商务交易,一般要求首先进行在线注册,成为电子商务网站的会员。电子商务网站为了个性化营销,有时要求消费者填写较为详细的个人信息。例如年龄、性别、出生年月、收入、住址、职业、个人兴趣和爱好,有的甚至包括身高、体重等项目。

(3)利用Cookies文件收集用户的隐私信息。Cookies最初的应用是判定注册用户是否已经登录网站,在征得用户许可下网站保留用户信息以便简化登录手续;另一个重要应用场合是“购物车”之类处理。现在的许多网站在每个访客进入网站时将cookie放入访客电脑,不仅能知道用户在网站上买了些什么,还能掌握该用户在网站上看过哪些内容,总共逗留了多长时间等,以便了解网站的流量和页面浏览数量。

(4)利用间谍软件窃取隐私信息。间谍软件是在未经用户许可的情况下搜集用户个人信息的计算机程序。间谍软件在用户不知情或未经用户准许的情况下收集用户的个人数据。它可以在用户使用计算机时通过截屏抓取到敏感文档,登录信息数据库,或者在用户输入信息的时候捕获敏感的文档。它所收集的数据范围可以很广阔,从该用户平日浏览的网站,到诸如用户名称、密码等个人数据。

(5)利用木马病毒收集消费者信息。木马程序是目前比较流行的病毒文件,它与一般的病毒不同,不会自我繁殖,也并不刻意地去感染其它文件,它通过将自身伪装吸引用户下载执行,向施种木马者提供打开被种主机的门户,使施种者可以任意毁坏、窃取被种者的文件,甚至远程操控被种主机。一些黑客或商家利用木马病毒来收集消费者信息。

(6)利用网络入侵收集消费者信息。网络入侵是指网络攻击者通过非法的手段(如破译口令、电子欺骗等)获得非法的权限,并通过使用这些非法的权限使网络攻击者能对被攻击的主机进行非授权的操作。网络入侵的主要途径有:破译口令、IP欺骗和DNS欺骗。由于互联网的弱安全性和用户防护意识薄弱,很容易导致入侵者利用这些弱点入侵他人的计算机而窃取隐私信息。

(7)利用钓鱼网站收集消费者信息。钓鱼网站通过提供错误的网页来模仿正规社交网站、游戏网站、购物网站或网银页面等方式,骗取消费者在网页上输入账号、密码、验证码等各类个人信息。输入后,密码就会被控制钓鱼网站的黑客所窃取。另外,也可以获取用户访问了哪个网页、在网页表格中输入了哪些数据等隐私信息。

(8)非法转让隐私信息。在互联网免费商业模式下,网站利用免费服务吸引用户注册,以组建庞大的用户群体,形成大数据信息。随着开放平台这种新型网络服务模式的不断发展,拥有庞大用户基数的网站通过开放平台为第三方网站提供我们的个人数据以获取利益。有数据显示,开放平台以用户资源进行商业运作的模式,已经成为主要网络经营模式。大多数用户在不知情的情况下,自己的信息就被第三方合作伙伴拿走了。

4 基于隐私保护的数据挖掘技术与算法

现有的一些隐私保护技术大体上可基于下面因素对它们分类:数据分布、隐私保护技术、数据或规则更改方法、数据挖掘算法。不同的分类标准所对应的隐私保护的数据挖掘技术也存在较大差异,以基本策略为依据,可将基于隐私的数据挖掘技术分为:(1)数据扰乱法。通过在研究过程中对数据进行随机变换,或对数据进行离散与添加噪声,以达到对原始数据进行干扰的目的,其代表算法为MASK法;(2)查询限制法。通过对数据进行隐藏、抽样和划分,以达到尽量避免数据挖掘者拥有完整原始数据的目的,在此基础上,借助分布式计算或是概率统计,获得所需的数据挖掘结果。但在利用查询限制法进行隐私保护时,经常存在一个问题,即所提供的数据全部为真实的原始数据,虽然不完整,但也会降低对隐私的保护效果。以隐私保护的结果为依据,又可将相关的数据挖掘技术分为:(1)启发式技术。又称为扫描技术,通过将数据挖掘的经验和相关知识移植到检查病毒的软件当中,进而查找出可能存在侵犯用户隐私的恶意程序或代码;(2)密码技术。密码技术是研究如何较为隐蔽地传递信息的一门技术,通过应用分组密码和流密码等相关技术,从而对陌生的数据访问请求进行拦截,以达到保护隐私的作用;(3)重构技术。通过利用数据重构技术,通过结果转换以及格式变换和类型替换等方式对数据空间的结构和格式做出调整,在实现异构数据与多源数据有效融合的基础上,降低隐私数据被篡改或盗用的可能[2]。

目前,常见的基于隐私保护的数据挖掘算法主要有三类:数据预处理算法、基于关联规则的算法和基于分类的算法。数据预处理算法是在数据预处理阶段删除数据中最敏感的某些字段,如姓名和证件号码等,或在数据集中随机添加、修改和转换某些字段的数据,这些数据能起到干扰作用,从而避免隐私泄露。基于关联规则的算法首先在数据集中挖掘关联规则,然后通过预先设定的学习方法或人工方法区分敏感规则和非敏感规则,根据敏感规则可以删除其中的部分敏感项或给予较低的权重。基于分类的算法是建立一个没有隐私泄露的分类规则,用于区分包含隐私的信息和不包含隐私的信息。对于每条数据,该方法都使用一些字段代替敏感字段,再进一步计算这种替换对于数据集本身的影响,从而找出一种尽量少泄露隐私又不破坏数据集完整性的方案。具体算法如文献[3]提出一个多参数随机扰动算法,文献[4]提出了安全多方计算技术的方法,文献[5]把密码学中的同态加密和数字信封技术应用其中,成功挖掘出可用的共享规则,且很好地保护了参与方的隐私。此外,匿名隐私保护也是一种常见的隐私保护方法,它是通过泛化数据标识符来防止隐私数据泄露[6]。

5 结语

面临个人隐私受到严重威胁的现状,使得电子商务中个人隐私成为人们越来越关心的问题之一,同时也使个人隐私安全成为电子商务面临的最大挑战之一。许多消费者不愿意参与电子商务交易的一个重要原因,就是出于对自己个人隐私安全的担忧,从而丧失了对电子商务的信心。因为个人隐私安全的原因使大批消费者和网络用户远离电子商务,严重影响了电子商务的顺利发展。所以,保证用户在电子商务活动中的个人隐私安全不仅能够留住一大批的电子商务潜在消费者和客户,更重要的是,能够在消费者心中建立起对电子商务的信心,为电子商务的长远发展奠定坚实基石。除了要进行立法保护、消费者自我保护意识培养,以及采用各种技术手段之外,企业在收集消费者个人信息时,也应该做到:一是要告知消费者,获得消费者同意;二是根据信息适量原则进行收集;三是保护收集消费者个人信息不被泄露。

[1]周水庚,李丰.面向数据库应用的隐私保护研究综述[[J].计算机学报,2009,32(5):847-861.

[2]宋金玲,刘国华,黄立明,等.k-匿名隐私保护模型中k值的优化选择算法[J].小型微型计算机系统,2011,32(10):1987-1993.

[3]王锐,刘杰.隐私保护关联规则挖掘算法的研究[[J].计算机工程与应用,2009,45(26):126-130.

[4]周志纯.隐私保护数据挖掘研究[D].合肥合肥工业大学,2008.

[5]Cliffton C,Kantarcioglu M,Vaidya J,et a1.Tools for Privacy Preserving Distributed Data Mining.ACM SIGKDD Explorations Newsletter,2004,4(2):28-34.

[6]金华,张志祥,刘善成,等.基于敏感性分级的(α,k)-匿名隐私保护[J].计算机工程,2011,37(14):12-17.

Research on the Protection of Consumers'Privacy in Electronic Commerce

Zhao Junjie
(Anhui University of Finance,Bengbu 233030,Anhui)

With the wide use of precision marketing and personalized services,some of the market main body pays more and more attention to understand the consumers,they are motivated by profit to obtain and make use of its information of online consumers without knowledge or willingness.It violates the privacy of consumers.Although consumers can enjoy more convenient and personalized products and services,they also pay attention to the privacy of personal information protection increasingly.This paper summarizes the consumer privacy in e-commerce,and sums up the common way of consumer information collection in electronic commerce.Finally,the data mining technology and common algorithm based on privacy protection are summarized.

electronic commerce;consumer;privacy protection;data mining;information collection

D923

A

1008-6609(2016)05-0033-03

赵俊杰,男,安徽宿州人,硕士,讲师,研究方向:电子商务与数据挖掘。

安徽财经大学校级科研项目《电子商务中消费者隐私保护问题研究》,项目编号:ACKY1430。

猜你喜欢
隐私权数据挖掘电子商务
2025年我国农村电子商务交易额达到2.8万亿元
纳税人隐私权的确立、限制与保护
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
妈妈,请把隐私权还给我
谷歌尊重雕像“隐私权”的启示
《电子商务法》如何助力直销
“人肉搜索”侵害隐私权的法律解析
跨境电子商务中的跨文化思考
一种基于Hadoop的大数据挖掘云服务及应用