网上拍卖品的价格层级与类别对买方出价行为的影响
——基于函数性数据聚类方法的分析

2015-01-26 06:02严明义程诗有
当代经济科学 2015年1期
关键词:买方层级物品

严明义,程诗有

一、引 言

网上拍卖是将传统拍卖与网络相结合的一种新的商务模式,是对资源进行有效配置的一种市场机制,它利用网络及其技术平台将所售物品或服务的相关信息以网页的形式加以呈现,并通过竞争性投标过程将物品或服务出售给出价高的买方。推动网上拍卖市场发展的主要动力是迅猛发展的电子商务网站,如 eBay、Amazon Marketplace、Yahoo Auction、Bidz等,中国的淘宝网、易趣网、拍拍网等。

在网上拍卖问题的研究中,有关买方出价行为的研究一直是研究中的一个热点论题,它对研究网上拍卖市场中的供求关系、拍卖价格特征[1]、拍卖价格的实时预测[2],以及出价时间与拍卖网站服务绩效的关系等具有重要的作用[3]。在网上拍卖买方出价行为的实证研究文献中,一些学者发现网上拍卖中买者的出价来到过程呈现两个特征,即出价来到过程呈现阶段性及出价时间分布具有自相似性。另一些学者还发现在网上拍卖中存在最终期限效应和早期效应,如 Bajari和 Hortacsu[4]、Borle,Boatwright和 Kandance[5]、Roth和 Ockenfels[6]、Wilcox[7]等均发现有部分出价发生在拍卖的最后时刻。这些文献对买方出价行为的研究是从出价来到时间的角度进行分析的,所使用的分析方法也多是传统的统计分析方法。

由于网上拍卖中买方出价数据具有不等间隔分布[8],从而使传统统计分析方法在分析买方出价行为,特别是分析买方出价水平时稍显无力。尽管国际上有学者考虑了买方出价数据的具体特征,并利用函数性数据分析方法从买方出价水平的角度对买方的出价行为进行了分析,但其研究是针对买方出价水平的一、二阶导函数进行分析,而不是对买方的出价水平进行分析。另外,文献中往往针对收集到的少数几类拍卖数据进行分析。这样的分析存在两个缺陷,一个缺陷是分析的对象不是买方的原始出价水平,导致对买方出价行为的解释不够直接;另一个缺陷是文中分析的样本拍卖种类过少,因此所得结论是否反映了网上拍卖买方出价行为的一般特征值得商榷。

由于现有研究文献分析的拍卖品种类过少,所以基于买方出价水平数据对其出价行为进行的研究不够深入,有关拍卖品的价格层级、类别等对买方出价行为的影响尚未考虑。鉴于此,本文利用函数性数据聚类分析方法,通过基于MatLab编写的分析程序,对从eBay网站收集到的26类7天期物品拍卖中买方的出价数据进行分析,探讨拍卖品的价格层级、类别等对买方出价行为的影响,并就其在不同网站物品拍卖中的表现进行比较。

二、样本选择与数据的收集整理

为了使分析中涉及的样本拍卖类能够反映网上拍卖市场的整体结构,从而对网上拍卖中买方的出价行为做出客观、可信的分析,本文就样本选择说明如下:

第一,拍卖种类的选择。根据拍卖网站存储的已结束拍卖的实际情况尽可能地多选,其目的是最大限度地体现当时网上拍卖物品的种类结构。

第二,拍卖的期限。由于eBay网上拍卖中的拍卖期限(即拍卖持续的时间)一般有1天、3天、5天、7天、10天、14天等之分,但多数物品的拍卖期限是7天,其历史资料较之其它拍卖期限的历史资料易于获取,因此本文选择的拍卖均是7天期拍卖。

第三,拍卖的起拍价。由于起拍价对买方出价水平的动态性会产生影响[9],因此不同起拍价物品拍卖中买方呈现的出价行为差异有可能与起拍价的高低有关,又网上拍卖中卖方为吸引买方竞标,往往为拍卖设定较低的起拍价。为剔除起拍价的影响,本文考虑的拍卖其起拍价均小于$10。

第四,拍卖物品的种类差异。网上拍卖网站对拍卖物品按大类分类,每一大类中又包含若干子类,一般来说,分类越粗拍卖品的种类差异越大。因此,在选择拍卖物品时,既要考虑拍卖物品的种类,还要考虑同一类物品的同质程度。

基于以上考虑,本文从eBay上收集了具有代表性的26类7天期拍卖的真实历史资料。网站上拍卖品的历史资料以网页的形式呈现,因此数据的获取需要经过网页采集、信息抽取及出价时间换算(换算为以天为单位的数据)三步。从eBay网站收集到的拍卖共2319个,总计出价50964次,具体情况见表1。在表1中,后三行所列的6类拍卖物品(纯手机、照相机镜片、男装、雕刻、儿童书籍、勋章)为同质程度较高的物品拍卖种类。

与国外拍卖网站相比,中国拍卖网站起步较晚,在经验积累、刊登的拍卖品数量、买方参与性等方面存在着较大差距。中国互联网络信息中心(CNNIC)2013年4月发布的市场研究报告[10]显示,在各类购物网站中,淘宝网的用户规模高居首位,用户渗透率达到88.5%;CNNIC2014年4月发布的市场研究报告[11]还显示,淘宝网对不同年龄代网购用户的吸引力最大,其对60后、70后、80后和90后的吸引力分别为 60.6%、62.1%、63.8%和 69.7%。因此,本文选择淘宝网作为中国C2C拍卖网站的代表,并从该网站收集到了珠宝类7天期拍卖491个,总计出价10602次。

三、出价数据的函数性特征与函数性数据聚类方法选择

(一)买方出价数据的函数性特征

网上拍卖中,买方在拍卖期限内的任何时刻都有可能出价,其出价过程可以看作是一个连续的过程,即买方出价水平数据的内在产生过程是一个连续过程,具体的一件物品拍卖中买方的出价记录可看作是这个过程的一次实现。如果将每一个拍卖中买方的出价金额看作其出价时刻的函数,则每一个拍卖对应着一条曲线(出价水平函数的图像曲线)。因此,买方出价水平数据具有函数性特征,即其为函数性数据[12]。

对于一个具体的拍卖,买方的出价数据往往是离散的且只有有限多个,而在一般的函数形式中,函数在其自变量(如时间)的取值范围(定义域)内却包含无穷多个值。因此,在对买方出价数据进行分析时,首要的工作是将观测到的离散出价数据转化为一个匀滑的(smoothing)函数,即利用拍卖的原始出价数据获得相应的出价水平函数χ(t)(0≤t≤7),它在拍卖期间[0,7]内所有时刻t处的值都被估算了出来。

表1 26类7天期拍卖的样本选择情况

设有n个拍卖,每一个拍卖中买方出价ni次(1≤i≤n),买方在第i个拍卖中til时刻的出价金额记为 yil(0≤til≤7,1≤l≤ni),则 n个拍卖中买方的出价数据可记为yiL:1≤l≤ni,1≤i≤n。若记第i个拍卖中买方出价数据的真实产生过程(即买方出价水平函数)为χi(t)(0≤t≤7,1≤i≤n),则yil(1≤ l≤ni,1≤i≤n)是χi(t)(0≤t≤7,1≤i≤n)在t=til处的观测值。于是

其中εil为随机误差。

模型(1)中,观测时点til及其个数一般依拍卖品的不同而变化,因此买方出价水平数据不同于通常的多元数据和面板数据。

(二)函数性数据的聚类方法及本文选择

函数性数据不同于有限维数据,它具有无穷维特征,因此聚类一般对样品(项目)进行,而要使用已有的聚类算法(如系统聚类法、k-means法等)进行聚类,首要的工作是对函数性数据之间的相异性程度进行度量。目前文献中度量函数性数据相异性的主要方法大致可以归结为三类,即直接距离法、降维法和曲线极值点法。在实际应用中,目前还没有哪种方法整体上优于其它方法,不同的相异性度量方式在应用中既有优越的一面,同时也存在某些缺陷,研究者在实际应用中要结合数据的具体结构特征灵活选择,同时还应与具体的聚类算法及函数性数据的修匀方法相结合。

基于直接距离的函数性数据(样品)相异性的度量方法,特别是距离,在实际中应用最为广泛[13],其优点是易于与分析多元数据的系统聚类法、kmeans等常用算法衔接,但实际计算距离时须使用定积分的数值算法。网上拍卖买方出价数据由于具有不等间隔分布特征,因此利用数值算法计算距离未充分考虑出价水平函数的具体特征,从而影响聚类结果。另外,聚类结果会受数据是否修匀及修匀程度的影响。

基于函数曲线极值点的方法充分考虑了样本曲线变动的极值特征,对函数曲线或数据产生过程的时间轨迹变化剧烈、多样的函数性数据非常有用。但是,网上C2C拍卖多采用增价拍卖(英式拍卖,English Auction),且网站对买方出价设置有加价规则并提供自动代理出价系统,从而导致买方的代理出价金额随拍卖的进行单调递增。因此,采用函数曲线极值点的方法对不同拍卖中买方出价水平的函数曲线之间的相异性进行度量显然不合理。

通过降维对函数性数据相异性进行度量有两种方法,一种是基于具体模型的方法(如ARMA模型或ARIMA模型等),另一种是基于主成分的方法。这两种方法虽然可以将无穷维空间的问题转化到有限维空间来解决,能够简化计算,但前者在应用中假定数据拟合特定的数学模型,只有数据的生成过程服从某种具体的数学模型,方可基于该模型参数的估计对样品的相异性进行刻画。基于主成分的方法是采用主成分对原始数据进行综合,因此对原始数据信息的提取存在误差。

在网上拍卖中,买方各次出价对应的时点在拍卖期间中不等间隔分布,故不能使用传统统计分析中的常见模型对出价水平数据的产生机制进行刻画。在这种情况下,可以考虑运用基于基函数展开的方法。一般来说,如果观测到的函数性数据具有周期性特征,则可以使用傅里叶(Fourier)基函数,对于非周期性数据可应用B-样条(B-Spline)基函数或者多项式基函数等(Ramsay和Silverman,2006,第三章,37-58)。由于买方出价数据并不呈现周期特征,所以本文采用B-样条基函数对出价水平函数χi(t)进行展开,换言之,利用 B-样条基函数{φk(t),k=1,…,Ki}的线性组合表示 χi(t),即:

式中:

φik—对应第i个拍卖的基函数,k=1,…,Ki;

cik— 基函数 φik(t)前的系数。

确定基展开式(2)中系数cik(1≤i≤n,k=1,…,Ki)的方法是带惩罚的最小二乘估计准则(Ramsay和 Silverman,2006,81-109),即:

其中,参数λ是修匀参数,用来控制函数的匀滑程度;D2表示出价水平函数χi(t)的二阶导数。

由于各拍卖中买方出价到来的时点不一致,且其出价次数ni一般随拍卖的不同而变化,所以利用式(3)得到的对应诸χi(t)的cik个数Ki一般也是变化的,即各拍卖对应的系数向量(ci1,…,ciK)的维数一般不相同。鉴于此,在聚类分析前,需要对每个拍卖中买方的原始出价数据进行线性插值,以求出所有拍卖在共同时间节点t1,t2,…,tm处的值。对第i个拍卖,记时刻tj处得到的出价金额的插值为y(i)j=y(i)j(tj),其中1≤i≤n,1≤j≤m。于是式(3)简化为:

其中K=样条函数的阶数+时间节点的个数-2。

利用上式可得到第i个拍卖中买方出价水平函数 χi(t)对应的系数向量(ci1,…,ciK)。于是,n个拍卖分别对应着n条光滑的函数曲线,同时也对应着n个K维的系数向量(ci1,…,ciK),从而对买方出价水平数据的聚类就转化为对n个K维的系数向量(ci1,…,ciK)的聚类。

但是,由于买方出价数据的容量大,如淘宝网珠宝类7天期拍卖有491个,总计出价10602次,又加之基函数个数的影响,如果对n个K维数据(ci1,…,ciK)(1≤i≤n)使用系统聚类法进行聚类,则计算速度会很慢。因此,本文采用计算速度更快的kmeans算法对B-样条基函数的n个K维系数向量(ci1,…,ciK)进行聚类,为叙述方便,称这种函数性数据聚类方法为B-样条k-means方法。

四、基于函数性数据聚类方法的买方出价行为分析

为了探讨拍卖物品的价格层级和类别对买方出价行为的影响,以及对其在中外不同拍卖网站的表现进行比较,本文利用B-样条k-means方法对买方出价水平数据进行聚类分析。分析的技术线路是:首先对eBay 26类7天期拍卖中的出价水平数据逐类进行聚类分析,其次对26类拍卖中各类拍卖的买方平均出价水平数据进行分析,最后对淘宝网7天期珠宝拍卖的出价数据进行聚类分析,并通过类中心曲线的几何特征对买方出价行为进行剖析。在具体分析中,为清晰地展示出价水平随时间变化的特征,本文进行聚类时使用的数据是出价金额的对数数据;对数据进行修匀时使用的是6阶B-样条基,选择的节点是{0,1,2,3,4,5,6,6.25,6.5,6.75,6.8125,6.875,6.9375,7},共 14个,这样的节点选取方式充分考虑了网上拍卖买方出价来到过程的时间特征。另外,在对买方出价水平数据进行函数性聚类分析时涉及大量的计算,为此本文基于MatLab编写了计算程序。

(一)拍卖物品的价格层级对买方出价行为的影响

一般情况下,买方对一件拍卖品出价的高低受拍卖物品真实市场价格的影响很大,一件拍卖品的市场价格越高,其最终拍卖价格也越高,相应的出价水平也居于高位。为了分析拍卖品的价格层级对买方出价行为的影响,本文将拍卖品按其最终拍卖价格分为四个层级,分别称其为高价级、中高价级、中低价级、低价级拍卖品。

进一步,本文使用B-样条k-means方法对26类7天期拍卖中的每一类拍卖对应的买方出价水平数据进行聚类分析,并绘制聚为4类的类中心曲线图(共26个)。图1是健康与美容类拍卖中买方出价水平被聚为4类的类中心曲线图,图中的4条曲线从上到下依次表示聚成的4个类中各类所含物品拍卖中买方出价水平的平均水平,其分别对应着高价级、中高价级、中低价级、低价级拍卖品。处于最高位的曲线反映了高价级物品拍卖中买方的出价行为,其它曲线可类此解释。

通过对26个类中心曲线图的分析发现,在同类的物品拍卖中,26个拍卖类中有9个拍卖类,其买方出价水平曲线的类中心曲线在2天后有3条近似平行,有13个拍卖类在3天后有3条近乎平行,即84.6%的样本类在3天后有3条近似平行;26个拍卖类中有18个拍卖类(占样本类的69.2%)其低价级拍卖品对应的买方出价水平曲线的类中心曲线有一个共同特征,即买方出价增加的速度较高价级拍卖品中买方出价水平的类中心曲线增加的速度快;对于高价级拍卖品,其共同的特征是买方的前期出价水平增加的速度较快,而随后时段出价水平增加缓慢,表现为类中心曲线较为平缓,出现这种情况的拍卖类占样本类的88.5%。另外一个普遍现象是处于中间位置的两条曲线除在拍卖的前2-3天存在差异外,在拍卖以后的时段呈现出更为近似的几何结构。

图1 健康与美容类拍卖的类中心曲线图

这种情况说明:(1)在网上拍卖中,拍卖品的价格层级易于在出价过程的前期(前2-3天)对买方的出价行为产生影响,在拍卖的以后时段除出价高低有差异外,买方在不同价格层级物品拍卖中呈现较相似的出价行为,即拍卖物品的价格层级对买方出价行为的影响较小,尤其是中高价级和中低价级,其对买方出价行为的影响更小;(2)在高价级物品拍卖中,买方相对易于在拍卖前期出价,促使出价水平迅速攀高,但其后时段出价动力相对不足;在低价级物品拍卖中,买方在拍卖期内的出价基本一直处于增长态势,且类间差异大。由此可以看出,拍卖品的类型一般会对买方的出价行为产生较大的影响

(二)拍卖品类别对买方出价行为的影响

为分析买方出价行为在不同类别物品拍卖中的具体表现,本文进一步使用B-样条k-means方法对26个拍卖类的平均出价水平数据进行聚类,其目的是探讨拍卖品类别对买方出价行为的影响。经过使用MatLab编程和计算,聚为4个种类的具体结果如下:

种类一:{艺术,园艺},共含2个拍卖品类;

种类二:{瓷器与玻璃器皿,乐器,收藏品,珠宝,硬币,邮票,手表,相片,照相机镜片},共含9个拍卖品类;

种类三:{工艺品,古董,纸币,儿童用品,服装与鞋,家私,健康与美容,手机与PDA,纯手机,运动品},共含10个拍卖品类;

种类四:{雕刻,勋章,男装,书籍,儿童书籍},共含5个拍卖品类。

上述4个种类的类中心曲线图见图2,图中的4条曲线从上到下依次表示种类一、种类二、种类三、种类四对应的类中心曲线。从图2可以看出,4个种类的类中心曲线在拍卖的前2天存在明显的差异,在拍卖进行到2天后却呈现相似的几何结构,其增长速度基本相同。这说明拍卖品的类别在拍卖前2天对买方出价行为的影响程度大,2天后其对买方出价行为的影响甚微;拍卖品的价格层级越高,买方越易在拍卖前期受其诱导出价。

图2 26类拍卖的类中心曲线图

另外,在上面聚成的4个种类中,种类二的相片类与照相机镜片类拍卖,种类三的手机类与纯手机类拍卖,种类四的书籍类与儿童书籍类拍卖,分别同属一个大类,但所含拍卖品的同质程度不同。从聚类结果来看,它们分别被聚为同一类,这说明拍卖品的同质性对聚类结果没有影响,换言之,拍卖品的同质程度对买方的出价行为没有产生影响。

(三)淘宝网站买方出价行为分析

图3是淘宝网站珠宝类7天期拍卖中买方出价水平被聚为4类的类中心曲线图。观察图3发现,图3与图1呈现的eBay网站中买方出价水平的代表性特征存在显著差异,其类中心曲线缺乏相似的几何结构,不同价格层级物品拍卖中买方的出价行为不同。这种情况说明,拍卖品的价格层级对买方出价行为的影响在中外网站呈现显著不同的特征。

图3 淘宝珠宝类拍卖的类中心曲线图

五、结 论

本文利用函数性数据的聚类分析方法(B-样条k-means方法),通过基于MatLab编写计算程序,首先对eBay 26类7天期拍卖中的出价水平数据逐类进行了聚类分析,其次对26类各类拍卖的平均出价水平数据和淘宝网7天期珠宝拍卖中的出价数据进行了聚类分析,得到了以下结论:

第一,拍卖品的价格层级易于在出价过程的前期(前2-3天)对买方的出价行为产生影响,其在拍卖的以后时段对买方出价行为的影响较小,对中高价级、中低价级拍卖中买方出价行为的影响更小;价格层级对买方出价行为的影响在中外网站呈现显著不同的特征。

在高价级物品拍卖中,买方相对易于在拍卖前期出价,但其后时段出价动力相对不足;在低价级物品拍卖中,买方在拍卖期内的出价基本一直保持增长态势,存在较大的类间差异,即拍卖品的类型对买方的出价行为一般影响较大。

第二,拍卖品的类别在拍卖前2天对买方出价行为的影响程度大,其在2天后对买方出价行为的影响甚微;拍卖品的价格层级越高,买方越易在拍卖前期受其诱导出价。

第三,在同质物品的拍卖中,本文未发现拍卖品的类别对买方出价行为产生影响的证据。

[1] Jank W,Shmueli G.Profiling price dynamics in online auctions using curve clustering[EB/OL].http://ssrn.com/abstract=902893,2005.

[2] Wang SS,Jank W,Shmueli G.Explaining and forecasting online auction prices and their dynamics using functional data analysis[J].Journal of Business and Economic Statistics,2008,26(2):144-160.

[3] Menasce D A,Akula V.Improving the performance of online auction site through closing time rescheduling[A].The First International Conference on Quantitative Evaluation of Systems[C].QEST'04,2004.186-194.

[4] Bajari P,Hortacsu A.Winner's curse,reserve prices and endogenous entry:Empirical insights from eBay auctions[J].Rand Journal of Economics,2003,2(2),329-355.

[5] Borle S,Boatwright P,Kadance J B.The timing of bid placement and extent of multiple bidding:An empirical investigation using ebay online auctions[J].Statistical Science,2006,21(2):193-207.

[6] Roth A E,Ockenfels A.Last-minute bidding and the rules for ending second-price auctions:Theory and evidence from natural experiment on the internet[J].American Economic Review,2002,78(4):806-823.

[7] Wilcox R T.Experts,amateurs:The role of experience in internet auctions[J].Marketing Letters,2000,11(4):363-374.

[8] 严明义.网上拍卖中竞买者出价数据的特征及分析方法研究[J].统计与信息论坛,2008,23(9):17-22.

[9] 严明义.网上拍卖竞买者出价水平的动态演变模式研究[J].统计研究,2010,27(3):59-65.

[10] 中国互联网络信息中心(CNNIC).2012年中国网络购物市场研究报告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/dzswbg/201304/P020130417 543965742695.pdf,2013-04-17.

[11] 中国互联网络信息中心(CNNIC).2013年中国网络购物市场研究报告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/dzswbg/201404/P0201404213 60912597676.pdf[EB/OL],2014-04-21.

[12] Ramsay J O,Silverman B W.Functional data analysis(second edition)[M].北京:中国科学出版社,2006.

[13] Ferreira L,Hithcock D B.A comparison of hierarchical methods for clustering functional data[J].Communications in Statistics:Simulation and Computation,2009,38(9):1925-1949.

猜你喜欢
买方层级物品
称物品
“双十一”,你抢到了想要的物品吗?
军工企业不同层级知识管理研究实践
基于军事力量层级划分的军力对比评估
信用证交单不符时买方拒付货款权利证成
买方常见违约问题分析、应对及预防
谁动了凡·高的物品
今年房企并购已达467宗
任务期内多层级不完全修复件的可用度评估
找物品