魏自儒,李子奈
(清华大学 经济管理学院,北京100084)
在欧美和日本经济持续低迷、国际需求疲软的大环境下,我国出口增长正面临着严峻挑战。在这一背景下,中国共产党的十八大报告中强调指出要完善互利共赢、多元平衡、安全高效的开放型经济体系。其中“多元平衡”思想再次将“出口多元化”提上日程,体现了我国现阶段经济增长的重点和迫切需要。
细观我国出口结构,产品种类和目的地都非常丰富,然而出口过多集中在发展水平较高的地区。根据我们的计算,2006年我国共出口7171种产品(由8字节海关编码定义),多于同等收入的其他发展中国家;贸易伙伴的数目也高达231个,几乎覆盖了全球所有的国家和地区。然而,这些产品在不同地区之间的分布并不平衡,如表1所示,北美、欧、亚三地的国家数目不足南美、非洲和前苏联国家总数的2/3,但我国对前者的出口额却占当年出口总额的91%,后者仅占9%。如果对比我国对各国出口产品的种类,则前者平均从中国进口3670种产品(中位数),后者只进口1976种。以上结构不利于我国在世界经济下行时规避外部风险,还会引起我国与发达国家的外交、政治争端。从微观角度看,还容易造成企业之间过度竞争,压缩其利润空间。因此,我国有必要进一步为出口产品开拓新市场,加大出口多元化力度,以保证经济平稳增长。
表1 我国出口结构的地区对比(2006年)
我国成功开拓新出口市场的本质是企业对其稳定而持续的出口。由于市场对中国是全新的,具有一定的风险,最值得关注的是首个进入的企业,本文称其为“先锋企业”。相应地,随后进入的称为“跟随企业”。从严格意义上讲,只有先锋企业面对的是全新的市场,跟随企业则可以从先锋企业那里获取新市场的相关信息,消除风险和不确定性。也就是说,作为中国第一个“吃螃蟹的人”,先锋企业承担了最大的风险,并对其他企业产生正外部性。但同时,先锋企业在初期面临的竞争压力比较小,更有机会培养消费者偏好,建立自己的品牌,从而在新市场中存活得更久。在市场营销领域,这被称为“先行者优势”。那么,随之而来的问题便是,在这两种力量的作用下,先锋企业的存活率比跟随企业更高还是更低呢?
研究进入顺序对企业存活时间的影响具有重要的政策含义。如果先锋企业在新市场中存活时间更长,那么即使需要承担额外风险并惠及竞争对手,也会有企业愿意承担先锋企业的角色,为中国开拓新市场。这表明现有的市场机制可以自我驱动完成市场多元化进程,而不需要政府干预。然而,如果先锋企业的存活情况不如跟随企业,或者二者无差异,则说明先锋企业并没有从市场开拓行为中获利,它们只是单纯的“信息提供者”。此时,企业往往缺乏动力开拓新市场,导致现实经济中的市场开拓行为低于最优水平,这就需要政府进行必要的补贴以促进出口多元化进程。
本文与国际贸易领域两类较新的文献密切相关:一是新市场开拓过程中先锋企业的外部性及其政策含义,二是贸易持续时间的影响因素分析。
Hausman和Rodrik(2003)为第一类研究提供了一个雏形。他们认为,一国不知道自己适合生产什么产品(不确定性),需要经历一个自我发现的过程,找寻比较优势所在。在此过程中,先锋企业要支付发现成本,以消除不确定性。由于信息的非排他性,其他企业都将从先锋企业的行为中获利,了解到新市场的完全信息。一旦确认生产新产品有利可图,跟随企业会大量进入,直至市场饱和,所有企业利润降为零。Hausman和Rodrik(2003)假设企业是同质的,在开拓新市场之前没有任何差别,只是事后有的企业“碰巧”成为了先锋企业。外部性使得先锋企业的私人回报低于社会回报,在自由市场下没有企业愿意做先锋企业。因此,需要政府发挥一定的调控作用。作者由此建议,政府应该为先锋企业设定保护期,在此期间其他企业不许进入,保证先锋企业可以独享垄断利润。
Artopoulos等(2011)是另一篇突出先锋企业外部性的文献。作者通过一个动态概念框架分析了发展中国家为差异化产品开拓新市场的过程。由于信息的非排他性,先锋企业的商业模式会在行业内传播,引得跟随企业模仿并加入到出口行列。同时,先锋企业也有机会从创新行为中获利,具体有如下几个来源:(1)消费者往往对进口产品的原产地具有一定忠诚度,跟随企业的进入可以帮助先锋企业共同建立一国的品牌效应;(2)跟随企业的加入可以增加新产品的国际需求,从而促进生产的专业化分工;(3)不同企业的合作有利于利用国际间交易的规模效应。
关于贸易持续时间的影响因素,现有文献可以分为两类:国家与国家之间贸易关系的持续时间以及企业和国家之间贸易关系的持续时间。前者的典型研究包括:Besedes和Prusa(2006a,2006b)对美国进口关系持续时间的分析、Hess和Persson(2010)关于欧盟进口关系持续时间的分析等。由于国家层面的分析不是本文重点,这里不赘述。有关企业与国家间贸易持续时间的研究,受到数据可得性的限制,现有文献鲜有涉及。特别是针对中国企业贸易关系可持续性的研究,目前只有陈勇兵等(2012)对其影响因素进行了比较全面的分析,这也是本文着重参考的一篇文献。
陈勇兵等(2012)采用生存分析的方法,综合分析了企业与我国贸易伙伴出口持续时间的影响因素。他们定义企业从进入一个国外市场到退出(中间无间隔)的时间为贸易关系持续时间,并将其影响因素划分为目的地国家特征和企业特征两大类。在计量方法上,作者总结了被广泛采用的Cox比例风险模型存在的几大缺陷,并采用离散时间模型进行了分析。基于中国海关和工业企业数据库的匹配企业样本,我们发现:(1)我国企业出口持续时间的均值不到2年;(2)企业贸易关系存在明显的负时间依存性,即随着贸易关系持续时间的增长,贸易关系失败的可能性会降低;(3)传统引力模型变量对贸易关系可持续性的影响与对流量的影响类似。
与陈勇兵等(2012)的研究相比,本文具有如下三个特点。首先,本文属于出口的扩延边际(新出口市场)范畴,而陈勇兵等(2002)更多关注出口的集约边际。其次,在研究对象上,虽然同为企业层面的分析,但本文对贸易关系的划分更为细致。具体来讲,本文考察企业对新增“产品—国家”组合的出口持续时间,而陈勇兵等(2002)着眼于企业与国家间的出口持续时间,没有对产品进行区分。最后,也是最重要的,由于本文将视角锁定在新出口市场,可以对企业的进入顺序进行辨识,从而在控制其他影响因素的基础上独立分析进入顺序对出口持续时间的影响。这使本文具有一定的政策含义。
本文使用的数据主要来源于中国海关总署2000-2006年的贸易记录。它提供了中国所有有进出口经营权的企业月度进出口详情,包括企业名称、交易产品、目的地、交易额、交易时间、企业所有权类型等信息。其中,产品由8字节海关编码定义。新出口市场的具体定义如下:对于任一“8位产品代码”和“目的地国家”的组合,如果中国在当年对其有正出口,而在此前的两整年内均为零出口,则称该“产品—国家组合”为当年出现的“新市场”。相应地,首个进入新市场、为中国进行市场开拓的企业称为“先锋企业”。晚于先锋企业进入新市场的称为“跟随企业”。
本文选择2002年出现的新市场及其参与企业作为分析对象,这保证了尽可能长的后续观测时间以对企业的出口持续时间进行分析。考虑到2002年国家通用的6位海关代码发生过变更,中国海关也经常对后两位代码进行调整,我们对新市场进行了过滤,最终得到近3.2万个制造业新市场样本。其中,99.5%以上都属于旧产品出口到新的贸易伙伴国,新增产品的比例不足0.5%。
受信息不确定性和国外竞争冲击的影响,开拓新市场是有风险的,并不一定能够存活并获得稳定增长。在我国2002年开拓的新市场中,只有28%连续出口至2006年,即2002-2006年每年都在出口。有29%虽然存活到2006年,但2002-2005年出口并不连续。剩余的新市场中,27%在两年内(即2003年底之前)就停止出口了,另有16%属于其他情况。为了使分析具有代表性,本文集中研究连续出口到2006年的8817个新市场,可以认为中国在这些市场上是具有比较优势的,对于其他市场则不予考虑。
本文使用的数据在产品和时间频率方面高度细分,这有助于对先锋企业的准确识别。在上述稳定出口的8817个新市场中,95%都只有一个先锋企业。先锋企业的数目少,从侧面表明该样本的可靠性。在跟随企业方面,截至2006年底:1%的新市场没有出现跟随企业,这类先锋企业是非常成功的,它们不仅成功开拓了新市场,也没有遇到来自中国的其他竞争对手,可以独享全部市场份额。在剩下99%的新市场中,26%有5个以下的跟随企业,32%有6-10个跟随企业,27%有11-20个跟随企业,剩余的15%有20个以上的跟随企业。
在建立正式的计量模型之前,先通过生存曲线来直观考察企业进入顺序与出口持续时间的关系。本文对企业出口持续时间的定义为:从企业进入新市场到退出该市场的时间,以月为计量单位。所谓“退出”,是指企业超过1年(12个月)对新市场没有出口。除了彻底退出的情况,如果企业对同一个市场两次出口的间隔超过12个月,也认为是退出以后的再进入(占样本的15%)。这种情况被称为贸易的多个持续阶段(multiple spells)问题,陈勇兵等(2012)将其视为相互独立的时段进行处理。考虑到本文关注企业进入顺序,只取第一个持续时间段进行分析,这保证了每个企业有唯一的进入时间。Besedes和Prusa(2006b)的研究表明,这两种处理方法得到的企业存活时间分布基本相同。
生存分析的重要特点是,由于样本观测期间有限,企业存活时间可能是删失数据。由于本文以新市场为研究对象,可以明确识别企业首次进入时间,不存在数据左删失的问题,但右删失显然是存在的。具体来说,到2006年底,如果企业已经彻底退出新市场,可以准确计算其出口持续时间。然而,对于2006年依然出口的企业,则不知道出口最终会持续多久,只知道“至少”持续了多久。这类企业的出口持续时间便是删失数据,需要用生存分析的方法进行处理。基于上述定义,为了准确判断企业是否退出(即数据是否删失),我们只选择在2005年12月之前进入新市场的企业进行分析,这保证了所有企业都有至少1年的观测时间。表2汇总了先锋企业和跟随企业的删失比例。可见,绝大多数企业在2006年12月份之前已经退出了新市场,这表明它们的存活时间是准确数据(非删失的)。
表2 企业与新市场贸易关系的删失情况
下面通过Kaplan-Meier方法来描述企业的生存曲线,它可以有效处理数据删失问题。记企业生存函数,即企业对某市场出口持续时间超过t的概率为S(t),Kaplan-Meier方法对S(t)进行如下非参数估计:
其中,nk表示在k期处于危险状态(即在期初存活)的“企业—市场”个数,dk表示在k期内死亡的“企业—市场”个数。
基于全样本的生存函数估计结果如图1所示。横坐标代表时间t,单位是月,纵坐标代表企业到t月继续存活的概率。两条曲线中的虚线(较细)代表跟随企业,实线(较粗)代表先锋企业。结果显示,两类企业在刚刚进入新市场时,即进入的第一个月存活率下降最快,超过65%的企业退出;随后的生存曲线相对平滑,死亡速度明显减慢。这再次印证了出口持续时间的“负时间依存性”。进一步观察可知,这种负时间依存性在先锋企业和跟随企业之间又表现出不同的特质:先锋企业在进入新市场后立即退出的概率显著低于跟随企业,但在随后的出口中死亡的速度显著快于跟随企业。二者的生存曲线大约在18个月时相交。
图1 新市场企业生存曲线(所有企业)
关于上述现象,笔者有如下两点评述。
(1)图1中两类企业的存活率都远低于陈勇兵等(2012)对“企业—国家”贸易关系持续时间的描述。这是合理的,原因有两点:第一,本文关注的是“企业—产品—国家”间的贸易关系,多了一个维度,贸易关系更难维持。第二,本文集中研究新市场,即中国尚未涉及的“产品—国家”组合,企业面临的不确定性和风险较高,存活的难度也较大。特别是在企业刚刚进入新市场时,买卖双方有一个匹配的过程。如果供求不匹配,企业会马上退出。所以我们观察到企业进入后立刻退出的概率很高。
(2)图1显示先锋企业只在早期具有生存优势,特别是刚刚进入新市场时。对于这种现象,一方面,图1没有控制企业的其他特征,如规模、生产率、出口经验等。一般情况下,具有较高质量的企业更可能成为先锋企业,进入后直接退出的概率也较低。在后面的回归分析中我们将控制企业特征变量,以判断进入顺序对存活时间的净影响。另一方面,在先锋企业进入的初期,新市场中往往没有或只有较少量的跟随企业,先锋企业面临的竞争压力比较小。这意味着需求方一旦放弃与先锋企业匹配,再搜寻另一家供给企业的成本就很高,这也提高了双方匹配成功的可能性。然而,随着时间的推移,进入新市场的跟随企业越来越多,先锋企业的竞争压力也越来越大。特别是,跟随企业经过一段时间的观察对新市场越来越了解,可能会提供更符合市场需求的产品。图2集中描述了存活时间在3个月以上的企业生存曲线,假设它们属于供求匹配成功的情况。可以发现,跟随企业的存活率明显更高,且优势越来越明显。
图2 新市场企业生存曲线(存活3个月以上企业)
本文在衡量企业与新市场贸易关系持续时间时以“月”作为度量单位,并且要求企业两次出口间隔不超过12个月。这使我们观测到的出口时间为1至60之间的连续整数,还避免了通常以“年”度量时所产生的“结点”问题,即无法观测到贸易关系终止的准确时间,只能判断其所在区间,Hess和Persson(2010)指出这会造成估计误差。因此,我们将采用连续时间Cox比例风险模型来进行生存分析。Cox模型的表达式为:
其中,h(t)为风险函数,表示企业存活t期后立即死亡的概率;h0(t)为基准风险函数,即个体不受外生变量影响情况下的风险函数;x为所有外生变量的向量。
Cox比例风险模型的优势在于不需要对h0(t)的分布做任何假设。然而,陈勇兵等(2012)曾提及它存在如下两个缺点:(1)Cox模型难以控制不可观测异质性,导致参数估计有误;(2)Cox模型假定基准风险函数与风险率满足比例关系,即二者之间的关系强度不随时间发生变化。对于这两个问题,本文将采用分层Cox模型来进行解决。我们将根据新市场所在行业(用2位海关编码定义)对样本观测值进行分层,每一层适用一个不同的基准风险函数;同时,假设各层的不可观测异质性为服从Gamma分布的随机效应(Jenkins,2005),在此基础上对参数进行估计。这种方法同时可以判断模型是否存在不可观测异质性,如果存在,便会对其进行控制。
在解释变量的选择上,与现有研究一样,本文从目的地国家、行业和企业三个方面着手。考虑到本文研究的目的是考察企业进入顺序对出口持续时间的影响,而不是广泛检验各解释变量的显著性,我们选择用国家哑变量和行业哑变量来控制所有目的地和行业层面的固定影响。关于企业层面的特征,首先是本文的核心变量——企业进入顺序,用先锋企业哑变量来表示。它取值为1表示先锋企业,取值为0则表示跟随企业。其他控制变量则沿袭陈勇兵等(2012)的模型,包括:企业对新市场的初始出口值、企业出口目的国数目、出口产品种类数目、所有权结构以及企业规模、年龄和生产率。所有控制变量均取初始值,即企业进入新市场前一年的状态值。其中最后三个变量——规模、年龄和生产率在海关数据中不可得,需要将海关数据与工业企业调查数据进行匹配,以计算这三个指标,这将导致一部分样本损失。因此在基本回归结果中,我们暂时省略这三个变量以便基于全样本进行分析。在稳健性检验中,我们将加入这三个变量,基于匹配样本进行回归。
值得一提的是,我们还特别加入了两个新解释变量以控制企业的相关出口经验,分别是企业进入新市场前一年对该产品(新“产品—国家”组合中涉及的产品)的出口额占出口总额的比重和对该国家的出口额占出口总额的比重。这两个变量都来自中国海关数据。Artopoulos等(2011)曾指出,对新市场比较熟悉的企业可以更好地调整自己的商业模式以适应市场需求。可以推测,具有相关出口经验的企业将在新市场中有更好的表现。因此,我们预期这两个变量对出口持续时间的影响为正。
基于上述模型,可以对2005年12月以前进入新市场的所有企业进行生存分析,回归结果见表3。其中,前两个回归使用了标准的Cox比例风险模型,后两个使用了分层Cox比例风险模型以控制不可观测异质性以及强加的比例风险假设。另外,列(1)和列(3)是基于全样本的估计,列(2)和列(4)剔除了存活时间不足3个月的企业,假设它们属于与需求匹配失败的情况。回归系数大于0表示该变量对企业风险率的贡献为正,即具有该特征的企业更容易死亡;系数小于0则反之。
表3显示,使用分层Cox模型得到的结果与标准Cox模型类似。但是经过检验可知,模型确实存在不可观测的异质性(见表3最后一行)。因此,在解释系数含义时以分层Cox模型为准。全样本回归即列(3)结果显示,先锋企业的死亡率整体高于跟随企业,该结果在10%的水平上显著。对回归系数取指数可得二者的风险率之比为e0.020=1.02,即先锋企业的死亡率比跟随企业高2%。其他变量的作用与陈勇兵等(2012)非常类似。具体地,企业初始出口值越高、目的地国家数目越多,企业死亡率越低;出口产品种类越丰富,死亡率越高,这可能是因为企业有较多的其他选择,坚持对新市场出口的机会成本比较大;另外,与私营企业相比,外资企业死亡率更低,而国有企业死亡率更高,合资企业无差异。特别地,我们新添加的两个变量——产品的出口比重和国家的出口比重都可以显著降低企业的死亡率,前者大约降低21%,后者大约降低11%,即产品相关的出口经验作用更为明显。
剔除存活时间在3个月以下的企业后回归结果见列(4)。可见,先锋企业与跟随企业的风险率差距明显增加,显著性水平也大为提高。换言之,一旦跟随企业坚持超过3个月,其存活率将比先锋企业高20%左右。其他变量的回归结果与列(3)非常相近,这里不赘述。
表3 基准回归结果
对于上述基本回归结果,我们将从两个方面进行稳健性检验:(1)剔除中介企业;(2)基于海关数据与统计局规模以上工业企业调查的子样本进行回归。
在我国的对外贸易中,中介性的进出口企业扮演了重要的角色。本文所关注的企业与新市场的贸易关系中也有超过一半是由中介企业完成的。因此,回归中的解释变量描述的是中介企业特征,而非真正的产品生产者。作为第一种稳健性检验,笔者剔除了所有的中介企业,对剩余的生产性企业进行回归。由于表3已经验证了模型存在不可观测的异质性,这里直接采用分层Cox比例风险模型。回归结果见表4的列(1)和列(2)。可见,各解释变量基本保持了原有的作用方向和显著性。稍有差别的是,在所有非中介企业样本中,先锋企业与跟随企业的死亡率没有明显差异,这是因为两者的生存函数有交点,交点前后的作用互相抵消,导致整体差异不明显。在去除存活3个月以下的企业以后,先锋企业的死亡率比跟随企业仍高17%左右。另外,企业进入新市场之前对该国出口所占比重变得不再显著。这也说明,基本回归结果中与国家相关的贸易经验的作用主要是由中介企业来体现,在非中介企业中表现得不明显。
第二种稳健性检验是有关前文提及的企业规模、生产率和年龄三个变量,它们在海关数据中不可得。因此,本文使用海关数据与统计局规模以上工业企业调查的匹配数据来计算上述三个变量。该调查覆盖了所有的国有企业和其他销售额在500万元人民币以上的(生产性)工业企业。我们所用数据的匹配质量是比较高的,匹配企业的数目占所有非中介企业的48%,“企业—市场”贸易关系的匹配数目占非中介企业贸易关系的56%,可以认为具有一定的代表性。基于匹配样本的回归结果见表4列(3)和列(4)所示。其中,企业生产率指的是全要素生产率(TFP),用企业增加值对雇佣人数和资本净存量进行OLS回归求得。考虑到各行业的要素弹性不同,对每个2字节行业(国家统计局标准产业分类)分别进行回归。结果显示,企业进入顺序的作用与列(1)和列(2)相同,其作用非常稳健。此外,所有控制变量的作用都与之前非常类似。
表4 稳健性回归结果,分层Cox模型
基于中国海关企业层面的月度贸易数据,本文对我国2002年出现的新市场及其先锋企业、跟随企业进行了识别与描述。统计显示,在新市场中,企业的存活率整体比较低,接近2/3的企业进入新市场后马上就退出了。此外,在刚刚进入新市场时,先锋企业比跟随企业有着更高的存活率,这得益于它们初入之时竞争对手较少,与新市场的需求匹配成功率较高。随着跟随企业的进入,先锋企业的竞争压力逐渐增大,死亡率的增加速度快于跟随企业。如果将存活时间低于3个月的企业剔除,假设它们与需求不匹配,只是信息不对称下的“尝试者”,则发现跟随企业的存活率更高。随后,本文采用Cox比例风险模型进行了比较严谨的生存分析。结果发现,在控制了目的地国家、产业以及企业层面的特征以后,以上现象依然存在且结果稳健。
本文的分析带给我们如下政策启示:第一,从社会福利角度考虑,应该促进企业间的信息交流,建立新市场开拓的预警机制,减少企业盲目尝试造成的社会资源浪费。第二,从效率角度考虑,应该对先锋企业进行适度补贴,特别是对“自主选择”而不是随机进入“碰巧”成为先锋的企业应重点予以补偿,①在一定时期(保护期)内对先锋企业提供出口退税等优惠。第三,从行业整体竞争力角度考虑,要引导企业在竞争的同时进行合作。市场中的企业数目并非越多越好,如果产品高度同质化,进入的企业越多,彼此间的竞争越激烈,企业利润很可能被压缩。而如果企业进行差异化产品竞争,则不仅可以保留自己的利润空间,还可以与其他参与者形成规模效应,为中国品牌在新市场打响名号。因此,我们呼唤官方或民间的商业组织在一定范围内统筹规划,对企业进行专业化指导,以创建一种有序而共赢的竞争环境。
注释:
①本文所关注的8817个新市场中,约1/4在先锋企业进入3个月以内就出现了跟随企业。我们猜测,这种情况下先锋和跟随决策并非企业的自主选择,而是带有一定随机性:例如,几家企业同时想到要进入某一市场,必有一家“被动”成为先锋企业,其他则被识别为跟随企业,但先锋企业并未对跟随企业造成正外部性。本文真正关心的是“主动型”先锋企业与跟随企业的存活率差异。因此,我们根据先锋企业与首个跟随企业的进入时间间隔对样本进行细分,结果发现:相差3个月以上的子样本回归结果与本文基本结论相同;相差3个月以下的先锋企业则有着明显的生存优势。因此,前一种情况更需要政府进行补贴。受篇幅限制,这里未展示具体回归结果。
[1] 陈勇兵,李燕,周世民.中国企业出口持续时间及其决定因素[J].经济研究,2012,(7):48-61.
[2] 陈勇兵,李燕.贸易关系持续时间的研究进展[J].国际贸易问题,2012,(10):28-42.
[3] Amurgo-Pacheco A,Pierola M D.Patterns of export diversification in developing countries:Intensive and extensive margins[R].Policy Research Working Paper No.4473,the World Bank,2008.
[4] Artopoulos A,Friel D,Hallak J C.Lifting the domestic veil:The challenges of expor-ting differentiated goods across the development divide[R].NBER Working Paper No.16947,2011.
[5] Besedes T ,Prusa T J.Ins,outs,and the duration of trade[J].Canadian Journal of E-conomics,No 2006,39(1):266-295.
[6] Besedes T,Prusa T J.Product differentiation and duration of US import trade[J].Journal of International Economics,2006,70(2):339-358.
[7] Freund C,Pierola M D.Export entrepreneurs:Evidence from peru[R].Policy Research Working Paper No.5407,The World Bank,2010.
[8] Hausman R,Rodrik D.Economic development as self-discovery[J].Journal of Economics Development,2003,72(2):603-633.
[9] Hess W,Persson M.The duration of trade revisited:Continuous-time vs.Discrete-Time Hazards[R].Working Paper,Department of Economics,Lund University,2010.
[10] Jenkins S P.Survival analysis[R].Unpublished Manuscript,Institute for Social and Economic Research,University of Essex,2005.
[11] Segura-Cayuela R,Vilarrubia J M.Uncertainty and entry into export markets[R].Working Paper,International Economics Department,Banco de Espan~a,2007.
[12] Wagner R,Zahler A.New exports from emerging markets:Do followers benefit from pioneers?[R].Working Paper,Harvard University,2011.