姜智彬 马 欣
技术作为影响广告运作变迁的重要因素,在“加速回报定律”的作用下,正在彰显“以指数级速度增长”的力量[1]。人工智能是模拟人类智能,实现机器智能的颠覆性技术,2017年《政府工作报告》和党的十九大报告都提出要加快人工智能的技术研发和产业应用。广告行业应用人工智能的技术探索始于2012年,2016年开始尝试商业化运用。2017年“双十一”期间阿里智能实验室研发的“鲁班”系统制作并投放4亿张千人千面的海报,标志着人工智能已经开始重构广告运作的部分,并实现商业化运作。
人工智能在广告行业的应用最初表现为程序化购买、实时竞价和数据分析管理;随后广泛应用在消费者数据收集、消费者洞察[2]和广告策略、广告创作、广告推荐、广告反馈等广告运作领域[3]。在消费者洞察的研究方面,使用大规模机器学习系统开发的“高维数据校准-堆叠新校准”两阶段算法模型可对在线消费者进行转移学习识别[4];最大熵算法可以对消费者进行智能分类[5];使用布尔模型、空间向量模型、概率模型以及潜在语义索引模型等智能算法可以分析消费者偏好[6]。在消费者应对方面,使用偏粒子群和模拟退火的混合算法,对广告投放和口碑监测进行建模,可收集反馈数据进而开展消费者个性化应对[7]。消费者洞察和应对需要收集和使用消费者数据。在保护消费者数据隐私的基础上有效利用数据,既是伦理问题也是法律问题[8]。人工智能可以提高消费者洞察的精确度与完整性,现有研究从算法和理论两个方面展开,可在数据来源整合、算法提炼等方面开展后续研究。在广告创作方面,宾夕法尼亚大学沃顿未来广告实验室对智能广告创作的技术和方法进行了初步探索。阿里巴巴、华扬联众、利欧股份、宏盟集团、电通中国、筷子科技等公司在实践中探索把人工智能技术应用于广告策略、广告创意、广告制作的局部环节[9]。在广告投放方面,人工智能结合模糊语言决策模型与遗传算法搜索模型,在满足预期的广告目标和预算限制的条件下可进行最佳媒体组合投放[10]。面向数据矩阵的分层凝聚类算法,可自动响应网络消费者,识别消费者场景意义并推荐合适的广告[11]。《华盛顿邮报》开发了原生广告发布平台OWN,可根据消费者历史阅读或观看行为的大数据生成个性化广告并进行定向投放[12]。
智能广告是以数据驱动为基础,利用人工智能技术实现广告内容的耦合生产、精准投放与互动反馈,从而个性化满足消费者生活信息需求的品牌传播活动。人工智能驱动的广告创作和智能投放是近几年出现的新的广告运作方式,智能技术解决了海量广告创作的人力成本和时效问题,也为广告智能投放提供了技术支撑。人工智能重构广告运作是现实也是趋势,这种重构将深入到消费者洞察、广告内容创作、广告投放与消费者应对等环节并深刻地改写其运作逻辑。随着智能技术的日益成熟和加快应用,亟须探讨人工智能在广告运作中的具体应用领域,及其存在的主要问题和解决方法。
传统的广告运作,一般表现为广告调查、广告市场分析、广告策略、广告创意制作、广告媒体组合、广告媒体投放、广告效果分析和广告反馈应对等环节。人工智能技术的运用,改变了传统广告的运作:社会网络技术将广告调查和广告市场调查重构成消费者智能洞察,自然语言处理技术将广告策略和广告表现重构成广告智能创作,深度学习技术将广告媒体和广告发布重构成广告智能投放,机器学习技术将广告效果和广告反馈重构成广告智能应对。
人工智能对广告运作的重构,形式上是系统性重构,内涵上是颠覆性重构。人工智能从形式上解构了传统广告运作,形成消费者智能洞察、广告智能创作、广告智能投放和消费者智能应对的新型运作方式;内涵上,人工智能构建了基于消费者全景画像的大规模个性化广告创作、全覆盖精准化广告投放、主动型策略化消费者应对的新型算法模型。
消费者智能洞察,指的是利用社会网络分析技术,挖掘多端异构的消费者市场大数据,建构数字化的消费者生活方式衡量体系进行消费者数字画像,从而智能化地分析预测消费者真实准确的消费需求。
人工智能技术有助于深入挖掘消费者的网络生活方式、行为轨迹、个性特征等信息,廓清多源海量数据环境中消费者行为分析的脉络,分析消费者对不同数字触点的标签价值,构建多端数据来源环境下消费者的社会网络,采用社会网络深度分析技术构建基于多端数据挖掘的消费者洞察方法,建立广告目标、广告产品和消费者数据的匹配模型,清晰锁定个体目标消费者。
广告智能创作,指的是针对精准的消费者画像,通过自然语言处理和深度学习等技术,根据用户需求对文字、图形等创意元素进行智能创意组合,制作千人千面乃至一人千面的个性化广告。
人工智能技术通过目标语义提取和关联分析、基于内容的跨媒体分析和检索、观点和情感挖掘等关键技术提炼广告内容智能创作的算法逻辑。结合产品情况和消费者洞察结果,采用自然语言分析技术比较不同广告策略的效果,进而提炼出有效的广告策略;探索语义深度理解和消费者实时互动情景下广告创意的能力扩散效应,根据广告创意和用户互动触点匹配模型进行广告创意;凝练归纳个性化广告内容智能创作算法,制作可供分类使用的大规模广告内容。
广告智能投放,指的是对照数字化的消费者生活方式衡量体系,准确识别消费者的生活场景,运用程序化投放工具优化广告投放媒体组合,将个性化广告内容进行直达用户的广告投放。
人工智能技术可以整合消费者的购买行为、网络足迹、APP数据、地理信息等大数据,采用神经网络和深度学习方法,研发消费者行为渠道指标系统。通过跟踪消费者主动行为模式的智能推理运算,测量媒介投放效果。通过研究内容语义型媒介、消费者使用型媒介和购买转化型媒介的不同组合,对广告投放触点进行算法模拟,依据实时动态调整的消费者反馈数据,更新并重构广告投放媒介的关键指标体系,生成新的消费者参与互动、千人千面的广告智能投放策略。
广告智能应对,指的是通过广告投放实时监测相应的广告效果数据,获得准确和及时的广告反馈,并借助机器学习技术,根据不同的反馈主动做出相应的实时应对,及时优化广告效果。
人工智能技术可以根据多源(PC端、移动端、OTT端等不同来源)异构(图像、声音、文字、数字等不同表达形式)的消费者实时反馈数据,采用机器学习方法(层次聚类、神经网络、主成分分析等方法)抽取并融合数据特征;结合行业经验和相关文献分析,采取综合指标体系测评广告投放效果,并精炼消费者个性化应对策略的规则表达;最后,采用强化学习和知识图谱方法,根据抽取的消费者反馈的数据特征,智能选择消费者个性化主动应对策略。
人工智能重构的广告运作中,消费者智能洞察在消费者轨迹卷宗的基础上进行萃取、分析;广告智能创作抓取消费者近三个月的热点话题、句式进行分析进而智能生成广告内容;广告智能投放根据消费者行为、生活方式特征与媒介使用习惯进行个性化投放;智能应对建立在消费者广告反馈数据的基础上。因此,数据是人工智能重构广告运作所面临的关键问题,笔者在下文对此展开专门探讨。
大数据是指基于海量、多样化的数据集合,通过云计算的数据处理与应用模式,经快速获取、处理、分析等手段形成的智力资源和知识服务能力[13]。智能广告依赖大数据来定位和分析受众,针对不同用户的不同需求进行“千人千面”的广告投放,从而达到精准化数字营销的目的。大数据的使用改变了传统的流水线营销模式,并新增了反馈环节,根据反馈数据,优化新一轮广告投放,提升投放效率。对数据的大量使用和不断积累,形成了智能广告业的大数据流。人工智能时代,用户大数据资源的多少和优劣成为决定智能广告公司核心竞争力的关键性因素[14]。目前,制约智能广告业发展的主要数据问题,首先表现在多样性的缺乏以及严重的数据孤岛现象。
智能广告业目前使用的大数据以用户的行为痕迹数据为主。所谓行为痕迹数据,是指在网络与信息技术时代,用户在搜索、浏览、订阅、评论等线上行为中留下的痕迹,以数据的形式存放于服务器中。Facebook收集13亿用户对名人、企业以及政客发布的内容进行的点赞行为,将这一类数据与用户对社会或商品的意见相关联,并将由此产生的用户档案出售给相应的广告市场,以实现广告商在Facebook平台上的精准投放。Google Gmail同样依据用户的搜索历史关联广告商,而Amazon则按照用户在站内的搜索和购物历史建立档案。尽管互联网的普及降低了获取用户行为痕迹数据的难度,但用户行为痕迹数据对于精准营销依然有重要价值。然而,此类数据的局限性也非常明显,它仅记录了用户的线上生活。生活在真实世界的人,其线下行为更加真实和完整,因而消费者线下数据往往更有厚度。现有的大数据集,量性数据占据主导,质性数据不是缺位就是被生硬粗糙地转化为数字。仅仅通过量化数据关联分析,由于抹杀了历史、理论和主体性,对用户的画像仍旧可能失准,大数据难见成效也在意料之内[15]。
智能广告业的发展除了受到大数据本身的广度和深度的约束以外,数据孤岛对企业营销的影响也是巨大的。一方面,BAT巨头牢牢垄断着头部流量。自程序化购买进入广告业以来,各种数据平台相继组建起来,然而终究只是小流量主面对强权压迫下的联合,并未能彻底打破垄断局面。另一方面,大量企业仍然采用零散化的方式管理数据,缺乏集中式的数据管理策略。企业中每个部门产生的数据被各自存储,由于各部门的职责不同,对数据的定义与使用以及对信息系统建设的标准也不同,从而导致了数据间缺乏关联性,数据库之间往往无法兼容。数据孤岛的存在阻碍了大数据的流动,封闭的数据资源影响大数据分析的精确性与广告投放的精准性[14]。不论是智能广告还是大数据营销,只有在获取了多元场景的行为大数据之后进行的数据交叉分析才能立体化、多角度解读消费者的行为和态度[16]。
数字化人格,是指根据数字化信息建立起来的人格[17]。智能广告正是基于这种数字化人格,建立消费者档案,实现对目标受众的数字画像。大数据时代,数字化信息的获取,除了直接对用户互联网行为数据的搜集之外,更大一部分数据来自通过云计算的方式进行的“预测性分析”。这种通过大数据手段,从表层行为痕迹窥探和揣测用户的兴趣爱好、勾画用户行为踪迹的数据获取方式,得到的是个人不曾公开的、甚至是不愿意被其他主体知晓的信息[18]。在这个过程中,信息非个人主动提供,信息被使用时用户也完全不知情,遑论用户是否同意该信息被使用。我国尚未有明确的法律法规对此进行监督和管控,目前全世界仅有2018年5月开始实施的欧盟《通用数据保护条例》做了一定的约束。
在欧盟《通用数据保护条例》正式实施前,2018年春天发生的Facebook事件就已经将大数据时代数据收集和存储的安全性问题带到了大众面前。事件中,剑桥分析公司在未经用户同意的情况下,通过关联Facebook账号的小程序读取并收集用户本人及用户好友的信息,通过“预测性分析”,在美国大选期间有针对性地推送信息和竞选广告。Facebook事件,已经证明了大数据分析拥有超过人们预期的超强能力,也对数据获取的合法性和数据存储的安全性发出了警告。剑桥公司正是钻了法律和监管的漏洞,完成了这次美国大选的精准营销。
由于大数据开放共享的生态环境尚未形成,智能广告除了依赖各种数据平台之外,购买数据也是广告和营销公司获取数据的途径之一。大数据交易的目的是促进数据的流动和价值体现,通过不同行业间的数据碰撞带来更丰富的价值。促进高价值数据汇聚对接,在一定程度上弥补了目前半开放数据格局下数据市场的多样化需求,有助于实现数据价值最大化,提升广告营销精准度。然而,随着数据交易类型的日益丰富,交易规模的不断扩大,在完备的数据法律体系构建之前,数据交易的权属不明、隐私安全、监管缺失等问题短时间内无法得到有效解决。目前,加强对数据获取合法性的监管和对数据存储安全性的保障,已经到了刻不容缓的地步。
互联网的发展产生了大量的数字信息,同时也加快了数字信息的传播速度,这也使得数据隐私问题日益严重。随着社交媒体的发展,人们在数字生活空间留下的数据足迹越来越多,大数据云计算正是根据这些数据的累积性和关联性进行预测性分析。用户在单个触点留下的信息也许不会暴露用户的隐私,但是当这些数据足迹串联起来,将某一用户的多个行为从不同的独立地点聚集在一起时,隐私数据就有很大可能暴露出来。
隐私数据,即敏感数据,最常见的包括姓名、身份证号码、位置、电话、在线身份等与个人生活、工作密切相关的信息。敏感数据从其产生、存储到应用、交换,这中间的每一个环节都有被泄露或窃取的可能。为了保护敏感数据,目前大多数企业都加强了数据安保工作。当前,对数据安全的防护手段主要包括对称/非对称加密、同态加密、访问控制、安全审计和备份恢复等[19],从对数据本身的严加防守、对数据受到外来威胁时的抵御和当数据发生问题时的解决对策三个环节进行数据安全和用户隐私保护。现有的数据安全防护体系,已经可以非常全面地保障一般数据的安全性,但是对于敏感数据来说仍有欠缺。
智能广告无法摆脱对于大数据的依赖,然而对于数据尤其是敏感数据的严密防护,也会影响到已有的数据处理及分析过程,从而阻碍智能广告行业的发展。Informatica公司大中国区首席产品顾问但彬曾分析说:“至关重要的是,企业既要保护数以百计的应用程序和数据库免受业务用户、生产支持团队、DBA、开发人员以及离岸和外包团队的不利影响,同时又要让他们完成他们的工作”[20],这直接指出了当下大数据营销的最大矛盾,即如何在保护隐私安全的同时不影响正常的大数据使用。
数据的便捷使用与数据安全及消费者隐私保护之间存着零和博弈,如何在这两者之间权衡与取舍是当下亟待解决的问题,除了呼吁快速建立数据使用的国家标准与行业标准外,研究者提出从数据多元、数据监管和数据脱敏三个方面开展相关对策研究。
为了弥补行为痕迹数据的单一性和片面性,将用户线下行为转化为相应的数据,并与用户线上行为数据相匹配,就显得十分重要。而物联网的普及恰好可以解决现有的数据单一化的困境。随着物联网的接入,传感器作为“触角”延伸到社会的各个角落,将其广泛应用于智能基础设施建设的各个方面,对于将用户线下行为转化为数字信息有着积极作用。2015年麦肯锡发布的报告中指出,全球物联网有望渗透的下游应用市场规模将在2025年之前成长达到3.9万亿—11.1万亿美元,达到约11%的全球经济占有率,并与城市管理、生产制造、家庭事务、汽车驾驶、能源环保、物流运输、工作办公、消费结算、个人健康等重要领域结合形成9个千亿级规模以上的细分市场[21]。届时,信息的来源将会覆盖用户生活的绝大多数线下场景,大数据将会达到空前的多元化,基于大数据的广告营销将会实现更大程度的精准化和高效化。
数据的多元化也要求数据与数据之间以及数据拥有者之间打破壁垒,构建大数据开放共享的生态格局。首先应对企业各部门的主要业务流程进行整合,把不同的业务系统串接起来,从而加强数据间的紧密性,减少重复数据和无效数据,提升数据质量。同时推进政府、企业和行业信息系统的统一化管理,制定信息管理的相关标准,减少不同行业之间由于行业门槛造成物理性的数据孤岛现象。近年来程序化购买中出现的DMP、DSP、SSP等数据平台的建立正是一种积极的尝试。这种数据共享方式通过碎片资源、独立微小个体的联合,在一个共同遵守的业务规则下,依托一个共有平台有效提升竞争力,既保证了独自发展模式的自由度最大化,同时也能有效整合各自资源[22]。当然,在今后的智能广告和大数据营销行业发展过程中,不仅要对这类数据平台进行集中优化建设,同时也要尝试打破几大头部流量公司的云数据之间的壁垒,这样才能逐渐构建良性的大数据生态。
在政策上,为了推动建设大数据的开放共享,我国业已发布了一些管理条例和办法,如针对自然科学和工程技术科学相关数据的《科学数据管理办法》,但是现有的相关措施还仅限于少数行业和领域,在广告营销方面暂时尚无系统的措施来推进。随着大数据产业今后的发展,从政策上推动大数据共享生态的建设必将是大势所趋。
关于大数据和大数据活动的监管法案,目前已经正式施行的欧盟《通用数据保护条例》是唯一系统化针对性的法律条例。它适用的范围包括能够被欧盟境内的个人访问和使用、产品或服务使用英语或特定欧盟成员国语言、产品标识的价格为欧元的任何网站和APP[23]。即只要涉及向欧盟境内提供服务并处理个人数据,都适用于该条例。该条例看似仅对欧洲国家进行了监管,但在全球化的时代,它还是影响了全球大部分的大数据业务。
《通用数据保护条例》对于大数据营销也作了要求和管束。条例中明确规定了“数字画像”的定义:“是指为评估与自然人相关的某些个人情况,对个人数据进行自动化处理、利用的方式,特别是针对与自然人的工作表现、经济状况、健康状况、个人偏好、兴趣、信度、习性、位置或行踪相关的分析和预测。”数字画像是智能广告和大数据营销的基础,欧盟此次对这一概念的扩大化和具体化,为今后对数字画像过程中的数据使用制定了标准,也方便在今后加强对这一行为的监管。欧盟在明确“数字画像”概念的同时,也对数据控制者提出了要求。条例的第13条的第一项规定了控制者在获取个人信息时,应该向数据主体提供包括控制者身份和详细联系方式、个人信息处理的目的以及处理的法律基础等在内的各类信息,个别情况下,甚至需要向用户说明控制者或第三方追求的利益。此外,还对用户在接受数字画像过程中的知情权、拒绝权和个人决策权等作了明确的规定。
随着欧盟这一条例的正式生效,数据安全将极大程度地得到保障,数据交易中的种种乱象也将得到规制,但与此同时,大数据营销活动也势必要受到影响。监管的加强意味着数据获取难度的同步增加,对于数据活动的限制也在增加,这对于智能广告业来说是极大的挑战。尽管目前我国尚未出台相关数据法律法规,但是考虑到数据监管的重要性和必然性,只有建立起良性的大数据开放共享生态,才能在接受监管时保持开放与约束之间的平衡,才能最大限度地减少数据环境变化给企业业务带来的影响。
欧盟《通用数据保护条例》的施行,在保护用户隐私方面也迈出了一大步。条例首次提出了数据主体拥有数据可携带权(即数据主体可以无障碍地将个人数据从一个信息服务提供者处转移至另一个信息服务提供者的权利)、数据被遗忘权(即数据主体在其个人数据信息不再有合法之需时要求将其删除或不再使用的权利)等概念,赋予了数据主体保护个人隐私安全的主动性,增强了数据主体的隐私保护意识。
针对已经获得的敏感数据,运用什么样的处理方式才能在尽可能少损失数据信息的情况下最大化地隐藏用户隐私,这一直以来都是国内外学者研究大数据的焦点话题。学者们也提出了一些可行的建议,如保护隐私的数据挖掘(privacy preserving data mining)法[24]、差分隐私(differential privacy)法[25],但是这些方法距离实际应用还有一定的距离。
《通用数据保护条例》中提出了数据的假名化和匿名化的概念。所谓假名数据,是指对个人数据处理后,在没有特定信息参考(该特定信息被安全地单独保存)的情况下,不能指向特定人的数据[26],假名数据仍然属于个人数据。而匿名化则是一种使个人数据在任何情况下均不能指向特定数据主体的数据处理方式。从普通的敏感数据,到假名数据,再到匿名数据的过程,就要求数据拥有者完成数据脱敏的处理。智能广告和大数据营销作为涉及敏感信息的行业之一,对于数据脱敏的需求是巨大的。根据不同的数据使用需求,使用不同的脱敏策略,对数据进行不同程度不同类别的脱敏处理是在不影响营销效果的前提下,最有效地保护用户隐私安全的途径。此外,引入隐私风险评估机制,鼓励根据个案实施数据匿名化的风险评估,并基于评估结果,适时调整匿名化策略也是优化数据脱敏效果、保护用户敏感信息的重要举措之一。随着区块链技术的发展,未来如果将其全面运用到智能广告体系中来,也将会是一种保障数据安全和用户隐私的有力手段。
当前,大数据为广告行业的智能化带来了新的机遇,人工智能已经基本完成了在广告行业的布局[27]。人工智能技术在广告中应用的方式、形态随着数据、算法和算力的发展处于不断地推进与变化中。人工智能重构的广告运作对不断变化中的广告智能化发展具有重要的理论意义与实用价值。数据的规范、使用边界与数据伦理等问题能否解决是广告智能化能否健康发展的关键。不论是打破数据孤岛、追求用数据的多元矫正数据的偏差,还是加强对数据收集、数据处理的监管,在保护用户隐私安全的情况下实现大数据营销效果的最大化,这些都是人工智能给广告业带来的新挑战,也是广告业涅槃的新机遇。