复杂数据探勘的道德风险与规训机制

2017-04-17 23:49蒋洁
图书与情报 2016年6期
关键词:道德风险大数据

蒋洁

摘 要:立足广域共享信息资源池和聚汇机器学习算法的实时且廉价的可视化数据探勘在充分展现出深度发掘数据资产价值剩余、创新优化公共服务能力、有序增进社交福祉等强劲实力的同时,逐渐暴露出直观探勘干扰自由表达、智数决策破坏平等格局、数据鸿沟扰乱竞争秩序等严重背离基本人权与经济目标的道德风险。亟待在弘扬超越异质群体不同诉求的共在、共生、共享、共荣之共同道德精神的基础上,全面执行安全、自主、适应性和利益协调等具体道德规训。

关键词:大数据;复杂数据探勘;道德风险;共同道德精神;道德规训

中图分类号: G203 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016114

Abstract When the real-time, low-priced, and visual data are discovered through sharing information resource pool over the wide area, converging machine learning algorithms efficiently reveals powerful strengths like deep mining of the surplus value of data assets, and innovation and improvement of public service capacity makes ordered enhancement of social well-being possible, moral hazards which seriously deviate basic human rights and economic goals are gradually exposed, for instance, intuitive mining interferes free expression, intellectual data decision-making breaks equal structure, and digital divide disturbs competition orders. The solutions to these burning problems lies in the promotion of common moral spirits which is symbiotic, co-existing, shared and co-prosperous to advance the different demand of heterogeneous group. Specific moral disciplines like safety, independence, adaptation, coordination of interests ought to be fully implemented, in order to help the leap development of singularity era.

Key words big data; multiple data discovery; moral hazards; common moral spirits; moral disciplines

1 引言

IT4.0时代,海量数据与创新技术逐渐构成人类生存的整体环境背景,同时,随著具有语义特征的智数基础设施、并发采集工具、分布式存储集群及计算能力的指数级攀升,旨在促使数据清洗、数据整合、数据选择、数据流转、数据挖掘、型式评价等流程日渐澄明,而及时且直观的复杂数据探勘通过深入揭露事物本质特征和内在规律,改善人类族群的思维逻辑与行为模式,助力数据引领的爆发式经济增长迅速走出混沌无序的状态,驱动着整个社会的多栖化自由发展。复杂数据探勘不仅可以筑造出可供任意需求者(如政府部门、企事业单位、其他组织和强势个人)自主挖掘海量数据的简便通路,亦在一定程度上加深了这些探勘主体与原初数据权利人之间资源占有和技术认知的巨大鸿沟。面对数字经济的历史性机遇,缺乏法律规制、政策调控、舆论干预与信念影响的恶意探勘者通过输入巨量冗余数据、搭建错漏频现的集成模型、超界域深度挖掘敏感关联、悄然独占数据资产价值增幅以及篡改探勘结果等牟取短线暴利,频频引发了评估失真与预测偏差,甚至动摇了多元利益群体之间脆弱的动态平衡。

人类活动的价值基础和生命意义的判断标尺是道德良善。以道德败坏为代价的技术胜利只能使得个人愈益成为别人的奴隶或自身卑劣行为的奴隶[1]。充分发挥复杂数据探勘推动不同产业融合创新、助力供给侧结构性改革等正向效应亟待建立以公正、平等、效率、互利等为核心的道德规训机制,全局闭环导控直观可视的海量数据存储、流转与分析过程,有序平衡政治、社会和精神力量,联动增进全人类福祉。

2 复杂数据探勘概述及分析

复杂数据探勘(Multiple Data Discovery)特指大数据时代基于人工智能技术开发的创新型数据处理平台中技术实力薄弱的泛在探勘主体自助采集、传输与分析海量数据的直观流程,具有廉价、简单(无需编码)、实时(数分钟内完成建模并随数据更新自动运转)、直观(可视化透明处理)等特征[2]。如多摩平台(Domo)从广大探勘主体正在使用的多元数据资源池中直接调用零散信息并以可视化方式实时展现浓缩和提炼的挖掘结果[3]。

复杂数据探勘大幅降低深度挖掘的准入门槛,有力提升以中小企业为代表的弱势探勘需求群体的社会竞争力。近年来,巨量数据资产满溢的潜在价值促使众多逐利主体通过积极挖掘以前因为科技所限而忽略的资料,构筑崭新的数据引导决策的高效运营模式。如亚马逊公司(Amazon)通过集中分析140万台服务器上10亿GB数据优化供应链和动态价格,以提供卓越的个性化购物体验,促进总销量和平均盈利增长[4];又如,领英网(LinkedIn)基于高量级、高速率与高辨识度的数据挖掘形成推荐列表,提升了职业双选满意度[5];再如,捷孚凯市场研究集团(GFK)通过挖掘海量高附加值调查数据及其关联资讯,较为精准及时地披露受试者的掩饰倾向[6]。然而,这些传统的深度挖掘模型较高的物理设施要求与高新技术障碍等迫使探勘需求者投入大量成本购置基础设备并培育和雇佣众多数据专家。复杂数据探勘虽然“没有完美无缺的内部架构,却具备简明、便捷和廉价的优势”[7],确保任一需求者均有能力自主参与多元共治的数据资源流转,通过实时关联决策从消费源头重识产品价值、从个人终端完善知识共享[8],推动去中心化的泛化社交平台逐步替代传统交互场域[9],引领所有社会领域的革命。如“点对点”的全景亿图系统(Panorama Necto)通过“比Excel更直观的界面、比Tableau更强的分析能力、比SaS更简单的操作”[10],为广大探勘需求者提供动态自主完成数据存储、挖掘并生成分析报告的“所见即所得”的自助平台,促进整个市场的公平竞争与有序发展。

同时,复杂数据探勘避免了委付数据引发的诸多风险。高度专业化的旧式数据挖掘迫使无力自建平台的探勘需求者(如中小企业)冒着泄露、损毁商业机密或客户数据的巨大风险委托第三方进行深度挖掘。受托者却不可能完全了解委托人的运营细节和具体市场状况,常常在算法选择与模型建构上出现错漏偏失,导致挖掘结果失真无效,甚至产生较为恶劣的负面影响。如基于Facebook巨量运作数据挖掘的精准广告投放不断暴露的实效偏差迫使全球最大的广告主宝洁公司(Procter & Gamble)大比例削减精投费用,迅速回转传统营销平台[11]。复杂数据探勘为广大弱势需求者提供了安全低耗、直观廉价地自主点亮暗数据(Dark Data)的最优选择,正在改变包括天睿(Teradata)、维提卡(Vertica)、哈道普(Hadoop)等在内的晦涩深奥的二进制运作机体垄断挖掘市场的局面。

3 复杂数据探勘的道德风险

复杂数据探勘技术与平台的出现,一方面是以梅尔数据(Datameer)[12]为代表的“傻瓜式”复杂数据探勘系统广泛应用于政府部门、企事业单位乃至个人用户的靶向研发、精益生产、精准营销、个性教学以及普惠金融等,在一定程度上突破了探勘需求者的技术局限,填补了专业数据处理机构、数据工程师与探勘需求者之间的实力差距,减轻近乎固化的“自然的或生理上的不平等”以及“精神上的或政治上的不平等”[13],迅速获得大众信赖和推崇;另一方面是“基于信息技术无限扩容的数据蓝海”[14]的复杂数据探勘私密化的可视化运作方式无形之中加深了熟悉对象数据内涵与关联价值的广大探勘需求者与原初数据权利人之间的能力鸿沟。道德规则认知有限或自信有能力规避的需求者为了“多快好省”地“追求眼前短暂的利益”[15],通过违反了自主、公平、不伤害等基本道德要求的自主探勘侵害合法的数据权益,导致原初数据权利人长期处于边缘化的社会失语状态[16]。缺乏道德规制的直观探勘情境正在转变为事物判定的唯一标识,日渐引发不确定、不可靠且有失公允的唯数主义和数据独裁,有可能逐步将整个社会推向失控和崩溃的异化边缘。如应用复杂数据探勘的医药企业和保健机构可以通过直观的动态图表实时地自如掌控和自主分析成分混杂的多元数据资源池集聚信息,导致相关违法违规事件的曝光、取证、追责和救济难度几何乘数增加[17]。

3.1 直观探勘干扰自由表达

数据渗透到当今每一个行业和业务职能领域,我们每个人随时都在成为大数据源端[18],广大掌握海量原初数据的政府机关、企事业单位和强势个人通过融会贯通新一代信息技术的复杂数据探勘廉价、直观且实时地自主使用元数据负载设备、聚合集成控制平台、动态分割管理布局以及广域挖掘架构等,在未获原初数据权利人明示同意的情况下肆意采集、阐释与识别颗粒数据变化趋势。如用于健康医疗的全景亿图系统助力医疗机构通过低成本地自行悄然广域挖掘病案地理位置信息和关联内容分享信息,具体识别特定的医生、护士、患者及其家属等相关主体并评估预测其行为模式与趋势,进而成为确定本单位资源补给、价格定位、服务标准与技术投入的核心依据[19]。此类探勘需求者通过廉价、便捷、直观且實时的复杂数据探勘系统,搭建最优化控制成本与提升质量的预测预警模型,严重侵害了原初数据合法持有者的知情权与自主选择权,违背了遵循诚信与尊重自由等道德要求。

3.2 智数决策破坏平等格局

场景时代作为现状评估与趋势预测新标尺的易操作的复杂数据探勘为每一个需要数据处理的社会主体提供了独立、低价、便捷且私密地完成海量数据存储、流转与分析的全新途径,逐步扩展应用于劝服、调整与控制决策领域,切实提升众多探勘需求者的洞察力与战略远见,推动产业转型升级和经济快速发展。如众多科研院所和医药企业通过共链生物银行(Colink Biotics)进行基因数据自主探勘,较为准确地实时预测客户巨量基因数据中隐藏的绝症发病率[20],相应的精准用药自动化探勘机制更是将文明社会的医疗水平提升到崭新的高度[21]。包括梅尔数据、全景亿图等在内的可视化复杂数据探勘平台使得掌握定量数据的机构和个人有能力自行完成数据处理并持续推送精准量化分析结果,在一定程度上导致全社会范围内的个人奋斗、企业选择、社会服务和政府管理等异化为固态计算程式。相关价值博弈带来的负面效应和恶劣后果则进一步加剧人性蜕化和创新危机,破坏整个社会的平等格局。如不同规模的企业只要耗费少量成本就可以在“正确”时间以“正确”形式即时地可视化私密探勘“正确”数据引领的长期决策往往侵害平等用工权或公平交易权等[22]。又如,掌握大量适龄男女等信息的婚介公司通过操作简单的可视化复杂数据探勘勾勒的看似理性的配对决策模型试图将人类情感作为技术干预的工具和对象,可能造成严重的心理失衡和人格障碍[23]。将之拓展为全方位优婚、优育、优养的精密探勘计划更是肆意侵害了独立个体的尊严和权利,违背“己所不欲,勿施于人”的道德准则,破坏现代社会引以为傲的平等人际关系,背离了实现“兼收并蓄、取长补短、相互容忍、和平共存的人类共同文明”[24]之道德初衷。

3.3 数据鸿沟扰乱竞争秩序

复杂数据探勘可视化集聚了广域深层离散数据,在一定程度上消减了数据资源共享中的信息孤岛现象,逐渐展现出“让一切改头换面”[25]的颠覆性价值。庞大的政府部门、企事业单位和个人用户群通过独立自主地开展复杂数据探勘,积极掌握数据处理主动权并占据发展制高点[26]。复杂数据探勘助力构建“跨行业、跨部门、跨区域”的电子政务智慧管理体系[27];高效且代价合理地优化个性化动态竞争情报生态链,颠覆地区封锁和行业垄断[28];真正实现社会零库存,改善综合实力薄弱中小企业的前途和命运[29]。然而,极简探勘模式大幅降低了数据存储、流转与分析成本,使得众多探勘需求者之间的竞争演变为彻底的原初数据量额和质比纷争。探勘主体出于短期利益需求与长远发展考虑,在数据采集、存储和综合挖掘中设置长效割裂原初数据横向转移与纵向传承的诸多障碍,通过廉价抛售交叉聚探的数据变量交互关系释放盈利潜能,动态阻挡创新力量参与行业竞争[30]。物理世界与数字世界汇聚进程中日渐扩大的数据鸿沟导致部分新生业态陷入难以洞悉周边态势的信息失衡困境,打破有序竞争的良好愿景,严重违背不伤害的基本道德准则。

猜你喜欢
道德风险大数据
基于道德风险控制的互助担保价值评估模型
生命伦理视域下人类辅助生殖技术临床管理问题探析
中国僵尸企业现象的经济学分析
股票市场对上市公司道德风险的反应研究
我国医疗保险中的医疗道德风险问题研究
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索