陈曦
【摘要】以大数据和人工智能为代表的智能化逐渐进入各行各业,一方面,这极大地提高了社会生产力;另一方面,智能化时代的技术创新为各行各业带来了革命性改变。但当前智能化时代的数据和算法并不能将现实世界“剧本化”,高度智能化的市场具有“戏剧性”,甚至这些智能技术还会带来风险。因此,管理者需提升自身数据素养和智能素养,转变管理方式;企业需建立健全行业技术标准,建立技术安全防控体系和中断机制;政府需加快法律法规设立进程,制定政策对冲风险。只有管理者、企业和政府多方配合,才能建立完善的治理体系,才能更好地利用技术防控风险。
【关键词】智能化 技术创新 风险挑战 规范管理
【中图分类号】TP18 【文献标识码】A
【DOI】10.16619/j.cnki.rmltxsqy.2019.21.001
引言
随着大数据、云计算、物联网和人工智能等技术的发展,人类社会从信息化时代进入到智能化时代。科技创新和科技革命是社会发展的强大推动力,有学者认为,信息、数据、可再生能源等核心科技催生了新一轮的科技革命浪潮,促使人类进入工业智能化时代,成为第三次工业革命的显著标志,并且与前两次工业革命不同的是,前两者是资本对体力劳动的替代,而后者从机器替代体力劳动到人工智能替代脑力劳动,这是一次质的飞跃(贾根良,2016)。智能化广泛应用到各行各业,使得经济结构发生了深刻变化,同时人类社会逐步由体能经济过渡到智能经济,即是指以智能为基础并依靠智能产生经济效益的经济。区别于体能经济主要依靠体力创造的劳动密集型模式,智能经济借助算法、数据和人工智能等设备把体力和智力充分融合,生产出高知识附加值的产品和服务(穆良平和姬振天,2017)。“智能化时代”是与“智能经济”“第三次工业革命”“人工智能大数据时代”“智能社会”等概念交叉或重叠的术语,都从人工智能发展的视角出发,强调人才智能和设备智能的统一、工业社会和信息社会的融合(陈振明,2015)。
技术创新和发展是智能化时代的基石,而大数据和人工智能作为该时代最重要的两项技术,为各行各业智能化的全面变革提供了强有力的技术保障。数据的大规模可用和人工智能算法的快速进步,正在不断改变着人们的生活方式。例如,在医学领域,机器学习技术正致力于解决复杂的诊断难题,使用大量患者数据训练计算机自主学习,从而为疾病诊断作出预测(Challen et al., 2019);在商业领域,大数据、算法和自动化决策交织在一起,通过收集大量消费者行为数据,企业可以构建自身的营销模型,从大数据分析中挖掘企业获取竞争优势的独特资源(Erevelles, Fukawa, & Swayne, 2016)。如同技术进步一样,智能化也是一把双刃剑,虽然智能化的便利性无处不在,但同时也应当关注与其一同产生的风险和挑战,如算法的日益普及带来了一系列的基本问题,涉及数据治理、信息隐私、自动化决策的法律和伦理框架,算法和自动化决策带来的偏见、不公和透明性问题(Olhede & Wolfe, 2018),人工智能算法可能带来的不确定问题等(张成岗,2018)。本文从智能化时代技术创新与发展出发,以数据技术和人工智能技术为例,论述智能化给各行各业带来的革命性改变,同时指出了可能产生的市场风险和挑战,在此基础上提出了智能化时代新的规范和管理策略。
智能化时代的技术创新与发展
技术创新作为智能化时代的基石,一直是学界和业界关注的焦点。有学者认为,大数据和人工智能是智能化时代最主要的技术支撑,对社会生产方式、生活方式,甚至娱乐方式都产生了深远而巨大的影响(孙伟平,2017)。近年来,我们从各种传感器设备或应用程序中收集数据的能力有了显著提高,而算法为进一步理解数据提供了支持,算法的理论和实践催生了现代的数据科学学科,它是统计学、计算机科学和数学的混合体(Olhede & Wolfe, 2018)。将从数据科学与大数据技术、算法与人工智能两个方面来分析智能时代的技术创新和进步。
数据科学与大数据技术。数据科学的研究范畴是信息技术和数据技术的集合,社交网络数据挖掘、云计算、数据可视化技术等相关技术和工具构成了数据科学研究的重要内容。Baumer认为数据科学是一个跨学科的领域,它利用数学、统计学、计算机科学的知识从日益复杂的大规模数据中通过多种设定模型抽取到有用信息(Baumer, 2015),也有学者提出数据科学包括信号处理、数学、概率模型、机器学习、计算机编程、统计、数据工程、模式识别和学习、数据可视化和不确定性建模等技术元素(de Moraes & Martinez, 2015)。数据科学的快速发展和广泛应用,不断赋予我们新的想象力和探索能力。谷歌开发的AlphaGO利用海量数据进行训练,成为围棋冠军就是一个很好的例子,AlphaGo采用的算法固然重要,但如果没有大量数据作为训练和学习的材料,再好的算法也是无米之炊,数据如同水、电、网一样已经成为智能化时代不可或缺的基础物资。
大数据技术有一项核心功能就是预测,大数据预测在新闻传播、影视娱乐、金融投资、农情监测等方面得到了快速的推广与应用。美国学者通过“搜集1990年到2013年间166个国家的报纸文章,形成大数据后进行,来分析预测是否会发生战争”(Chadefaux, 2014);在大数据文本分析和挖掘方面,有学者在用户生成内容挖掘的基础上提出了一个产品缺陷发现的综合文本分析框架,并在汽车和电子消费领域展示了此框架的有用性(Abrahams, Fan, Wang, Zhang, & Jiao, 2015);另外,在网络信息空间的内容分析方面,2011年美国和英国的三位学者合作通过近1000万条推文作为样本展开网民情感研究,预测股市涨跌(Bollen, Mao, & Zeng, 2011);亞马逊构建了一个智能化的图书销售系统,不断收录海量用户的搜索数据,该系统可以精准地为读者推荐可能感兴趣的图书;沃尔玛通过分析销售数据,了解顾客购物习惯,得出适合搭配一起销售的商品,同时可以从用户的购买行为中对顾客进行市场细分,为其提供个性化的服务,这种分析方法和营销手段已经被各类电子商务平台广泛采用。
经济学视角下,大数据及数据科学的快速发展和广泛应用,扩展了人的理性,降低了交易成本,减少了机会主义行为,极大地促进了市场经济的进步和发展(程承坪和邓国清,2018);管理学视角下,数据挖掘及大数据预测为商业智能化提供了技术支持和辅助决策,在一定程度上也使得组织更加扁平化和去中心化(Jarrahi, 2018);统计学视角下,数据科学和数据技术影响着统计方法发生了改变,包括以下七个方面:新信息源的涌现、高维可视化、多个测试问题、异质性分析、自动模型选择、稀疏模型的估计方法、用统计模型合并网络信息(Galeano & Pena, 2019)。
算法与人工智能。和数据一样,算法也是人工智能的核心,在智能化时代算法的功能不仅仅是在于对数据进行处理并按照处理的结果进行决策,而是进一步利用数据进行机器学习,经过自我训练和深度学习的算法得到了迭代和发展。例如,有学者将人工智能算法应用到图像识别领域,运用机器学习的方式对蚁群算法进行训练,结果表明优化后的蚁群算法对图像分割的效果更佳(Xin & Wang, 2019)。在商业领域中,算法交易在市场中的影响也越来越大,有学者通过构建“社会嵌入式多主体仿真模型”,进行仿真研究,结果表明算法交易确实在市场交易中节约了交易成本,同时也控制了交易风险,降低了市场波动和带来更好的流动性(王宇超等,2014)。有学者以淘宝网为例,研究了电子商务中服务推荐的协同过滤算法,研究表明基于用户频率相似度的推荐方法非常适合在线服装推荐,共现矩阵约简方法是提高推荐性能的有效方法(Hu, Li, Wei, & Zhou, 2019)。事实上,作为人工智能最重要的两项技术,算法和大数据的融合,进一步促进了人工智能的发展。
如今,人工智能在物流行业、云会计、互联网金融、媒体行业、医疗行业、军工企业等均有广泛应用。譬如,淘宝的核心引擎就是人工智能的运用,它将多种复杂的算法融合在一起,每天进行海量数据自动处理,人工智能同样广泛运用于菜鸟驿站的物流系统中;谷歌翻译运用机器智能的方法代替人的翻译。有学者还进一步研究了人工智能在公共管理中的应用,研究表明,人工智能的使用扩展了公共数据的处理和分析能力,扩大了公众影响力(Wirtz & Muller, 2019);在医疗领域,有学者对人工智能驱动的医疗初创企业进行了及时而关键的分析,将人工智能解决方案引入市场,从而提出了一种为人工智能医疗初创企业设计商业模式的方法(Garbuio & Lin, 2019)。
上文主要从技术创新和发展的角度讨论了数据科学、大数据、算法和人工智能给各行各业带来的福祉和便利,这些技术的发展极大地促进了人类和社会的进步,但这意味着智能时代一切都可以被量化和预测吗?商业社会中的不确定性和风险都可以被模型和算法预测、降低,甚至规避吗?再也不会出现“戏剧性”了吗?事实上,智能化时代这些革命性的创新在一定程度上确实降低了信息不对称,节约了交易费用,甚至能够预测和规避风险。然而,数据、算法、机器学习和人工智能等技术在逻辑基础和实际应用中均存在着巨大的不确定性,且当前的智能化还无法将错综复杂的现实世界完全“剧本化”。或者说,现实世界并不一定会按照数据和算法计算出的既定程序运行,市场和技术共同参与了“戏剧性”的制作。因此,充分利用技术解放生产力的同时,也不能忽视智能化時代的风险和挑战,如数据隐私的泄露、算法偏见、社会不公等。
智能化时代的风险和挑战
根据国际数据公司(IDC)最新的支出指南,2019年全球人工智能(AI)系统支出预计将达到358亿美元,比2018年增长44.0%。全球大数据和商业分析(BDA)解决方案的收入预计今年将达到1891亿美元,比2018年增长12.0%。智能化时代创造的社会效益得到了广泛认可,同时这场技术变革带来的社会风险也引起了学术界和IT界的关注和讨论,数据风险、算法风险、可能引起的失业等问题亟待解决,下面从技术、社会和管理三个角度对智能化时代所面临的风险和挑战进行讨论,从而进一步为降低风险和应对挑战寻找可能的解决方案。
技术视角。数据技术和算法技术在推动智能化快速发展的同时,也带来了新的问题和挑战。第一,数据风险。随着智能化的不断深入,数据已经成为一项必不可少的基础设施,但海量产生的数据一定能够客观描述这个世界的真相吗?
在数据生产环节:一是数据收集可能会产生以偏概全的风险。虽然大数据技术、数据采集技术在不断发展,但由于平台垄断、商业利益等因素的影响,收集到全样本的数据仍然很困难。同样,在行业数据中,一方面,很多行业缺乏完整的数据积累;另一方面,出于商业保护也不愿公开(彭兰,2018)。而传统小样本调研的代表性和数据质量历来受到学术界和业界的质疑。数据采集是数据生命周期的第一环节,而样本的以偏概全必然对数据分析结果产生影响。二是数据噪音带来的污染。数据收集的过程中除了样本偏差带来的问题,多种渠道收集来的数据质量也参差不齐,这些数据存在着严重的噪音问题,虽然数据在处理前会进行数据清洗,各种数据清洗算法也层出不穷(W. B. Li, Li, Li, & Cui, 2019),但这些工作并不能完全消除噪音的污染。
在数据分析环节:一是数据挖掘技术的进步难以匹配日益增长的数据量。当前各种智能设备生成的数据量都在不断增加,数据挖掘、可视化、统计分析和机器学习等技术的重要性不言而喻,但由于数据的复杂性和底层算法的可扩展性,数据分析面对海量的数据仍旧是一个挑战(Labrinidis & Jagadish, 2012)。二是数据分析的结果有可能被操作。数据分析一项重要的功能就是帮助人们客观描述事物,但由于多方利益分配问题,数据分析的结果存在被干预的风险,Facebook在美国大选中操作舆论风向就是一个典型的例子(彭兰,2018)。
在数据保护环节:一是用户隐私泄露风险。美国学者收集了5.8万名志愿者在Facebook上的点赞、人口基本信息等资料,通过数学模型对这些数据进行处理。研究结果显示该模型正确区分了88%的同性恋和异性恋男性,95%的非洲裔美国人和高加索美国人,85%的民主党和共和党人(Kosinski, Stillwell, & Graepel, 2013)。智能化时代用户在各种智能终端上留下大量个人信息,这些信息一旦被泄露和滥用将产生不可估量的后果。二是被遗忘权的缺失。由于数据挖掘技术和存储技术的快速发展,用户个人数据被搜索和挖掘的成本变得越来越低。大量用户数据分散在互联网的各个角落,但目前我国还没有相关法律支持用户行使数据被遗忘权,用户面临着数据被滥用和隐私泄露的风险。
第二,算法风险。算法是人工智能技术的核心,层出不穷的算法促进了人工智能的快速发展,包括算法自动化决策在内的技术被广泛应用到各个领域,整体上提高了社会运行的效率,但同时带来的社会风险也引发全行业的关注。
一是不确定性风险。算法的普遍应用在一定程度上降低了市场风险和不可预测性,自动化决策技术往往是根据模型和算法对事物的发展趋势作出预测,进而寻找最优的解决方案,但高度依赖算法的智能化技术就一定能够精准计算和预测这个动态的复杂世界吗?事实上,模型和算法能够解决的不确定问题是极其有限的。首先,客观现实抽象成计算模型必然会损失原始的全息数据(殷杰和边旭兴,2014),整个过程包括数据采集、输入、建模和输出都存在着巨大的不确定性,这使得抽象出来的模型必然具有边界效应。其次,这是因为人工智能算法的逻辑基础具有不确定性,人工智能算法先输入从现实世界中收集的数据,经过处理和学习,总结出一个最优模型或结论,然后再利用该模型或结论对更多的现象进行演绎或预测。算法底层的逻辑是利用了相关关系而不是因果关系,而相关性较之于因果性而言具有一定程度的不确定性。由此观之,一方面,算法无处不在的智能化时代降低了市场风险和不可预测性,为人类社会带来便利和福祉;另一方面,却因为其本身所具有的不确定性,而把人类社会带入了更大的不确定风险中,一种全新的不确定性世界观正在形成。
二是信息茧房的危险。个性化信息服务的出现催生了许多新媒体产品,如今日头条、抖音等APP,这些新媒体的崛起为大众提供了丰富多彩的娱乐享受,但同时也带来了“精神麻醉”的负面作用(Fang, Wang, & Hao, 2019),在自动化决策算法提供的个性化信息中,用户只选择使自己愉悦的讯息,这种“选择性心理”被称为“信息茧房”。一旦“信息茧房”效应出现,表面上这些产品在算法自动化决策的助推下满足和迎合用户需求,得到了用户的青睐,获得了商业上的成功,但实际上也使用户陷入了“井蛙”困境中,难以“兼听则明”。
三是偏见和歧视的风险。算法自动化决策技术的普及引发了人们的深切担忧:这种自动化的选择可能会产生歧视性的结果(Lambrecht & Tucker, 2019)。例如,算法可以记录用户的浏览和消费记录,进而通过模型计算用户的消费能力,在此基础上为消费者推送不同类型的产品,甚至对不同用户进行不同的定价,最大程度上收割消费者剩余。这种策略在保险业也常常出现,保险公司通过算法估算不同用户可能发生的风险而为其收取不同的保费。这种算法偏见和歧视在一定程度上损害了个人公平,还容易造成整个社会的“马太效应”,进而损害群体公平。由于算法偏见造成的危害经常在事后才能被发现(Crawford & Schultz, 2014),因此,识别关于算法带来的偏见和歧视风险就显得十分重要。
社会视角。智能化时代,社会视角下的风险和挑战概括为就业、社会公平和规制问题。第一,就业结构重构的挑战。虽然人工智能和自动化可以提高工人的生产率,但同时也可以取代他人的工作。麦肯锡2017年发布的研究报告显示,60%的职业存在被技术替代的可能性,人工智能和自动化技术的快速发展将对劳动力市场的供需平衡产生干扰。在经济不平等日益加剧的时期,自动化水平不断提高,引发了人们对大规模技术失业的担忧,各方力量呼吁政府采取政策努力,解决技术变革带来的负面影响(Frank et al., 2019)。由于技术对劳动力的影响存在不确定性,因此,很难构建具有弹性的劳动力市场。例如,设计可行的工人再培训计划需要对当地劳动力有详细的了解,熟练掌握当前技术,并了解不同地区劳动力市场之间的复杂依賴关系(Walter, 2017)。智能化时代的快速发展必然会对传统的就业结构产生影响和冲击,如何协调和处理技术变革和就业结构之间的关系逐渐成为新时代的挑战。
第二,社会不公平的风险。随着人工智能和算法的快速发展,整个经济呈现出以资本替代劳动的趋势。智能化时代最大受益者是智力和资本的提供者,如创新者、投资者和股东等,这使得劳动力提供者和资本提供者之间的贫富差距不断扩大。智能化时代加速了平台经济发展,平台效应下少数的大型平台占据了市场主导地位。这些少数的大型平台在市场上逐渐驱逐大部分的小型玩家,最终形成强者愈强、弱者愈弱的“马太效应”(唐钧,2019)。为了防止价值和权力的过度集中导致的社会不公平问题,必须找到平衡数字平台利益和风险的方法,确保开放和合作创新的机会(G. Li, Hou, & Wu, 2017)。
第三,规制风险。人工智能技术的实现主要是通过代码和算法来完成的,程序员代码编写、模型构建和测试均是不透明的,同时由于商业利益的保护,鲜有企业愿意公开源码和数据,这就形成了人工智能的“研发黑箱”。同时由于人工智能本身的技术门槛较高,通常只有专业领域的人员才能理解人工智能编程和算法,即使政府要求企业披露计算机源码以增强算法研发程序的透明性,非专业的监管人员也很难对其形成准确的认知,这给监管工作带来大量的成本。目前我国尚未对人工智能算法研发和应用可能带来的风险进行立法,如何监管人工智能研发过程、平衡商业利益和规制风险,是智能化时代需要应对的挑战和亟待解决的难题。
(本文系国家自然科学基金项目“基于agent与众包数据获取服务的企业决策支持关键方法研究”和教育部人文社科基金項目“基于数据情境感知的互联网医疗服务采纳及应用模式研究”的阶段性研究成果,项目编号分别为:71771118、18YJCZH146)
参考文献
Abrahams, A. S., Fan, W. G., Wang, G. A., Zhang, Z. J., & Jiao, J., 2015, "An Integrated Text Analytic Framework for Product Defect Discovery", Production and Operations Management, 24(6).
Baumer, B., 2015, "A Data Science Course for Undergraduates: Thinking With Data", American Statistician, 69(4).
Bollen, J., Mao, H. N., & Zeng, X. J., 2011, "Twitter mood predicts the stock market", Journal of Computational Science, 2(1).
Chadefaux, T. 2014, "Early warning signals for war in the news", Journal of Peace Research, 51(1).
Challen, R., Denny, J., Pitt, M., Gompels, L., Edwards, T., & Tsaneva-Atanasova, K., 2019, "Artificial intelligence, bias and clinical safety", Bmj Quality & Safety, 28(3).
Crawford, K., & Schultz, J., 2014, "Big data and due process: Toward a framework to redress predictive privacy harms", Boston College Law Review, 55(1).
de Moraes, R. M., & Martinez, L. , 2015, "Computational Intelligence Applications for Data Science", Knowledge-Based Systems, 87.
Erevelles, S., Fukawa, N., & Swayne, L., 2016, "Big Data consumer analytics and the transformation of marketing", Journal of Business Research, 69(2).
Fang, J., Wang, Z. Y., & Hao, B., 2019, "Analysis of 'Anesthesia' Mechanism in Mobile Short Video Applications Take 'Tik Tok' APP as an example", Proceedings of the First International Symposium on Management and Social Sciences.
Morgan R. Frank, David Autor, James E. Bessen, Erik Brynjolfsson, Manuel Cebrian, David J. Deming, Maryann Feldman, Matthew Groh, José Lobo, Esteban Moro, Dashun Wang, Hyejin Youn, and Iyad Rahwan, 2019, "Toward understanding the impact of artificial intelligence on labor", Proceedings of the National Academy of Sciences of the United States of America, 116(14).
Galeano, P., & Pena, D., 2019, "Data science, big data and statistics", Test, 28(2).
Garbuio, M., & Lin, N., 2019, "Artificial Intelligence as a Growth Engine for Health Care Startups: Emerging Business Models", California Management Review, 61(2).
Hu, Z. H., Li, X., Wei, C., & Zhou, H. L., 2019, "Examining collaborative filtering algorithms for clothing recommendation in e-commerce", Textile Research Journal, 89(14).
Jarrahi, M. H., 2018, "Artificial intelligence and the future of work: Human-Al symbiosis in organizational decision making", Business Horizons, 61(4).
Kosinski, M., Stillwell, D., & Graepel, T., 2013, "Private traits and attributes are predictable from digital records of human behavior", Proceedings of the National Academy of Sciences, 110(15).
Labrinidis, A., & Jagadish, H. V. , 2012, "Challenges and opportunities with big data", Proceedings of the VLDB Endowment, 5(12).
Lambrecht, A., & Tucker, C., 2019, "Algorithmic Bias? An Empirical Study of Apparent Gender-Based Discrimination in the Display of STEM Career Ads", Management Science.
Li, G., Hou, Y., & Wu, A., 2017, "Fourth Industrial Revolution: Technological Drivers, Impacts and Coping Methods", Chinese Geographical Science, 27(4).
Li, W. B., Li, L., Li, Z. H., & Cui, M. T., 2019, "Statistical relational learning based automatic data cleaning", Frontiers of Computer Science, 13(1).
Olhede, S. C., & Wolfe, P. J., 2018, "The growing ubiquity of algorithms in society: implications, impacts and innovations", Philosophical Transactions of the Royal Society a-Mathematical Physical and Engineering Sciences, 376(2128).
Ramio Matas, C., 2018, "Artificial Intelligence, Robotics and Public Administration Models", Revista Del Clad Reforma Y Democracia, (72).
Walter, S., 2017, "Globalization and the demand-side of politics: How globalization shapes labor market risk perceptions and policy preferences", Political Science Research and Methods, 5(1).
Wirtz, B. W., & Muller, W. M., 2019, "An integrated artificial intelligence framework for public management", Public Management Review, 21(7).
Xin, Z., & Wang, D. H., 2019, "Application of Artificial Intelligence Algorithms in Image Processing", Journal of Visual Communication and Image Representation, 61.
陳振明,2015,《政府治理变革的技术基础——大数据与智能化时代的政府改革述评》,《行政论坛》,第6期。
程承坪、邓国清,2018,《大数据与社会主义市场经济体制——兼与马云先生和张旭昆教授商榷》,《探索与争鸣》,第4期。
高山行、刘嘉慧,2018,《人工智能对企业管理理论的冲击及应对》,《科学学研究》, 第11期。
贾根良,2016,《第三次工业革命与工业智能化》,《中国社会科学》,第6期。
李鸿磊、黄速建,2017,《智能化时代的商业模式特征及创新路径》,《经济与管理研究》,第6期。
穆良平、姬振天, 2017,《中国抢占智能经济发展先机的战略要素及重点领域》,《理论探讨》,第4期。
彭兰,2018,《假象、算法囚徒与权利让渡:数据与算法时代的新风险》,《西北师大学报(社会科学版)》,第5期。
孙伟平,2017,《关于人工智能的价值反思》,《哲学研究》,第10期。
唐钧,2019,《人工智能的社会风险应对研究》,《教学与研究》,第4期。
王宇超、李心丹、刘海飞,2014,《算法交易的市场影响研究》,《管理科学学报》,第1期。
殷杰、边旭兴,2014,《不确定性与计算机模型思维变革》,《自然辩证法研究》,第4期。
张成岗,2018,《人工智能时代:技术发展、风险挑战与秩序重构》,《南京社会科学》,第5期。
责 编/肖晗题