隋林华
1980年,著名未来学家阿尔文·托夫勒在《第三次浪潮》一书中,将大数据赞颂为“第三次浪潮的华彩乐章”,到2009年,“大数据”成为互联网信息技术行业的流行词汇,2012年,“大数据”逐步影响了众多行业,大数据时代真正来临。大数据是什么?
最早提出“大数据”时代已经到来的机构是全球知名咨询公司麦肯锡,麦肯锡认为,数据已经逐渐渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素。“大数据”的概念首先是指数据体量大,其次是指数据类别大,种类格式丰富,再次是指数据处理速度快,最后是指数据真实性高。它的特点被概括为4V,即:Volume、Velocity、Variety、Veracity。当然“大数据”绝不仅仅限于这4V,它涵盖了人们在大规模数据上可以去做的很多事情,而这些事情是只有在大数据基础上才可以进行的,这是大数据的“唯一性”大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见,最终形成变革之力。对于大数据,可以进行分析的五个方面,包含了:可视化分析、数据挖掘算法、预测性分析能力、语义引擎、数据质量和数据管理。
2012年12月,英国人维克托·达尔-舍恩伯格所著的《大数据时代》在中国翻译出版,2015年,他在中国的一次演讲上说:“过去我们是希望利用数据来回答问题,首先假设问题,然后收集数据,最后进行分析。现在随着数据收集的成本越来越低,越来越方便,我们可以先从数据收集着手,然后分析数据,通过分析提出一些非常棒的问题。这更有助于企业为用户提供个性化的服务。”他还举了一个生动的例子,比如说大家最喜欢的口味的派是什么,是苹果还是桃味的?最后我们拿到了问题的答案,可能就是苹果派,最后我们就觉得苹果派是最受欢迎的,但是反而我们得到了这个问题的答案是错误的。那么现在我们其实可以做一些改变,改变一下我们的方式,我们不是从问题开始着手,因为有可能我们的问题本身就是错误的。我们先从数据着手,然后从开始搜集数据,进行分析。然后通过分析,我们可以提出一些非常棒的问题。比如说这个派的尺寸,最合适的尺寸是什么,这是正确的问题。根据这个分析,我们可以获得这样的一个假设。最后我们可以得到问题的答案,就是我们需要一个尺寸合适大小合适的派。
大数据给艺术市场带来了什么?
大数据给各行各业带来了全新的机遇,那么对于艺术品市场而言,它带来的又是什么?
传统意义上,艺术品投资者对于艺术品数据的关注并不多,他们更在意艺术品的历史背景以及背后所蕴含的深层意义。艺术品具体的品类及这些品类的涨跌幅度,更能引起他们的注意。但其实在艺术品交易的链条中,每一个环节都隐藏着大量的数据,无论是数据的采集、存储还是数据的管理与应用,都交杂其中。艺术品行业高速发展的这几年,为了能够更精确地把握艺术品的具体成交量和价值的增长点,人们逐渐意识到艺术品收藏投资需要数据思维的加入。如何刺激与延续市场的繁荣,初级投资者与资深人士如何选择适合他们的投资品类,数据都能给到很好的参考作用。这期间所产生的数据无疑让我们对艺术品市场的火热程度的衡量与如何带动艺术投资产生了巨大的推动作用。
艺术品行业的大数据主要包括3个方面:用户大数据、内容大数据和渠道大数据。在大数据时代下,用户即数据,数据即价值,想要挖掘大数据的价值,必须要拥有数据,拥有数据之后才能拥有用户,拥有用户之后,才能获得价值。在艺术品行业,根据已有平台积累的“巨量”用户信息,通过分析大量用户的消费行为信息,挖掘出用户群体感兴趣的产品需求,在此大数据分析的基础上,进行调整。内容大数据的整合,渠道大数据的分析与开拓,同时将艺术品市场推向了一个崭新的领域。
2013年,雅昌艺术市场监测中心与中国人民大学艺术品金融研究所达成合作意向,双方共同研发符合中国艺术品市场特征的艺术品指数体系,开始打造艺术品行业的“大数据”。2015年3月18日,胡润艺术榜在北京发布,胡润艺术榜根据100位中国在世艺术家过去一年在公开拍卖市场上的作品总成交额进行排名,用大数据来衡量市场,本身是一件极具客观性的衡量方式,但榜单公布后却引起很多人对于榜单的质疑,以及对于新鲜事物“大数据”的质疑。
对于艺术市场大数据的态度形成了两方态度鲜明的阵营。一方认为,中国需要艺术品数据作为观察市场的工具,艺术品大数据可以把艺术家作为金融市场的“个股”来进行分析,从这个角度观察艺术品和艺术家成长的轨迹,也可以借助这些数据去分析艺术品的走向,为这个市场提供研究方法,使艺术品市场成为更透明、更有效的艺术市场。而且大数据能够自动辨别数据的真假,因此最后的分析结果不存在造假问题。
我们先了解一下,大数据和以前的数据分析3个明显的区别:一是原来的数据分析针对部分样本,大数据是所有的数据都要参与计算;二是大数据中,相关关系重于因果关系;三是大数据允许混杂数据甚至错误数据。大数据允许混杂数据甚至错误数据这是因为,大数据能够通过造假数据的特征将其辨识出来。造假的数据和平常的数据不一样,可以通过环比、同比、类比,发现数据中的异动,判断是否存在数据造假行为。
另一方的态度则趋向于中国艺术大数据可信度不高。数据时代已经来临,但大数据并非无所不能。它蕴含的是计算和思维方式的转变,过于乐观和简单的理解,都可能在使用时适得其反。此方态度的支撑点还在于现阶段国内艺术品数据存在的诸多问题,首先,国内的艺术品交易并没有规定具体特定的地点,艺术家交易途径较多,很多交易数据是无从考究的,因此这方面的数据的真实性有待考证。其次,作为二级市场的拍卖行虽然在每次成交时会有据可循,但拍卖行业由于假拍、赝品等问题使得数据的质量非常混杂,要获取精确、具有市场代表性的数据分析,研究者往往要进行大量的数据整理清洗、剔除工作,然而在这个过程中一旦存在任何采样偏差,分析结果就会相去甚远,而且小数据的样本分析往往只能对预设的问题做出判断,而不具有延展性,恰好,这些问题又是拍卖行业数据的复杂性所不能规避的。第三,艺术品不同于其他的产品,没有标准化的衡量标准,因此交易也难以进行标准化的衡量,在进行数据分析时就存在着很大的难度。另外,数据编制机构本身的商业性质也从一定程度上影响着数据的客观性、公正性和专业性,这也是在艺术大数据中不可回避的问题。
对于大数据能否造假,很多学者也持怀疑态度。他们认为,首先,数据一旦涉及到利益,就有极大的造假可能性。数据背后的细节,数据来源的真实性、处理过程中的全面性及科学性,是大数据走向权威和可信的重要保障,这些也是影响到大数据真实性的重要因素,差之毫厘谬以千里。
另外大数据在进行计算时,很容易忽略数据之间真实的关联性。如数据统计证实了网页数和网络形象存在一般的正相关,但忽略了负面事件带来的网页量爆发等,结论也就存在着误差。这种相关性体现的渠道必须是数据之间、数据与真实事件映射的现象之间、真实事件的客观联系上。该如何看待中国艺术品数据
根据以上所述,艺术品大数据存在着诸多的不确定性和可变性,但对于这种不确定性,我们应持理性的态度,通过这些有争议的数据,我们依然可以去研究出某一时段市场交易的概况,以及某一位艺术家在现阶段的行情,某一幅作品的当今市场价值……事实上,在当下这样一个共识性引导市场的时代背景下,即便是数据存在不真实性,只要能够保证数据体量的足够庞大,以量补质,再用足够科学的测算方法辅助,我们依然能够捕捉到市场中的“共识性”。然后根据这种“共识性”,做出正确的投资决策。诚然,精确度高、真实性更强的客观数据,对于大数据而言,最后得出的结果将更准确更优质。
对于艺术品大数据如何走向规范化,减少误差率,实现真正的大数据功能,更好地为市场服务,很多专家认为,首先要从艺术市场本身人手。一级市场、二级市场的弊病存在已久,市场泡沫化去除也在进行中,这些问题对于大数据的影响显而易见,如果不从根本祛除“病根”,大数据自身很难去摈弃这些负面干扰。另外,对于艺术行业而言,如果想准确地预测到下一步,须从整个行业发展状况、国家相关政策、消费人群的关注方向、艺术家从业分布、行业收藏热度分布、各大拍卖行春秋拍概况、一级市场销售情况、市场容量等很多角度去研究分析,且需要专业人士来配合才能保证采集数据的客观性和准确性。
虽然路漫漫,但在大数据不断前行的今天,某一天,也许我们就会通过大数据的显示,很清晰明了地知道,当代市场情况如何,未来几年艺术品收藏投资热门是哪些品类,哪位艺术家的作品更具升值潜力……