郭小弦
(西安交通大学实证社会科学研究所,陕西西安710049)
随着社会网络研究的逐渐深入,求职时使用社会网络能够带来正向回报已经成为研究共识。总体而言,与未使用社会网络的求职者相比,使用了社会网络的求职者能够获得更高的收入、更优的职业地位等。针对中国的研究往往还更加重视不同时期社会网络的使用状况,将社会网络分析与市场改革过程联系在一起。学者们认为,社会网络作为一种非正式的资源配置渠道,与政府、市场等资源配置渠道共同在劳动力市场发挥作用。在规则还不甚明晰、规范性相对较弱的市场改革初期,社会网络作为非正式资源配置渠道的作用会逐渐升高;随着市场化的逐渐深入,市场规则越来越明晰、规范性越来越强,社会网络的作用空间也会随之下降。也就是说,随着市场化的逐渐深入,社会网络的作用空间将呈现出“先上升后下降”的趋势[1-2]。然而,研究发现,求职时使用社会网络的比例并未像预期中那样“先上升后下降”,反而一路增高,在全面市场化时期,该比例已经接近80%[注]JSNET2009、2014调查数据显示,自2002年开始的全面市场化时期,求职时使用网络的比例为78.7%。。这表明,求职时使用社会网络成为越来越常用的手段,可以说已经成为一种普遍现象。而且,这些使用社会网络的求职者不再是一个特殊的小群体,这一群体内部的异质性必然增大。由此面临一个新的议题:在使用社会网络的求职者群体内部,社会网络的回报率是否一致?当研究对象聚焦于那些在求职时使用了社会网络的行动者时,社会网络的回报率是否因人而异呢?
社会网络研究自20世纪70年代兴起以来,吸引了大量研究者对其作用进行探讨。针对社会网络究竟是否发挥作用以及怎样发挥作用等问题,已有研究从关系强度观[3-4]、网络资源观[5]、网络结构观[6]、网络信号观[7]等各种理论视角予以讨论。无论是强弱关系、资源类型,还是网络结构,都是从整体角度论证社会网络的作用。在众多的社会网络研究中,劳动力市场一直是主流的研究领域,而求职过程更是体现社会网络作用的良好载体。当求职过程中的绝大多数求职者都选择求助于自己的社会网络行动时,社会网络的作用是有可能存在差异的。曾有针对农民工的研究指出,由于每个行动者所拥有的网络规模和质量不同,“有的人使用网络可以事半功倍,有的人使用网络却没有作用,甚至有负作用”[8]。周雪光在对比制度学派和网络学派时也曾提到,“制度学派关心趋同性问题,而网络学派强调差异性问题”[9]。在探讨社会网络的作用时,不加区分地考虑社会网络和地位获得之间的关系是有局限性的。当脱离整体性的分析视角,尝试分析社会网络的差异性回报时,则可能存在正向回报和负向回报两种可能的理论假设。
林南[5,10-11]的社会资本理论描述了一个金字塔型的社会结构,每个行动者都处于这个金字塔中的某一位置。社会资源也与这个金字塔型的结构一一对应。在这个结构中所处层次越高,位置与占据者的数量越少。在顶层只有很少的位置与占据者,他们控制着绝对和相对数量最多的有价值的资源。越往塔顶,规模越小,资源越多;而塔底的规模较大,资源较少。与行动者初始位置相关的“地位强度命题”是指行动者初始位置越好,越有可能获得和使用更高的社会资本。
地位强度命题与传统的结构理论完全一致,它反映了行动者的结构优势,并扩展到社会资本中。初始位置指行动者的先赋位置与自致位置,先赋位置是个体继承的来自父母、家庭的位置;自致位置则是通过自我努力获得与占据的社会位置。行动者的初始位置越好,不仅意味着可接触的社会资源更加丰富,也意味着其在人力资本、政治资本、家庭背景等方面同样占据优势。当社会资本与其他优势相结合,便能够发挥出综合优势,起到“1+1>2”的效果。
对于那些初始位置一般甚至较差的行动者,他们在两方面处于劣势:一方面,出于结构的约束,通过社会网络所能动员到的社会资源在数量和质量上都逊于初始位置好的行动者;另一方面,缺少可以与社会资本相结合的其他相应优势,从而发挥出综合优势。当各种资本类型都相对较弱,则可能会出现“1+1=1.1”的效果。综上所述,初始位置越好的行动者越有可能使用社会网络,而越有可能使用网络的行动者,社会网络带来的回报也越大。据此,本文得到社会网络的正向回报假设:使用社会网络的可能性越高的行动者,社会网络的回报率越高;反之,使用社会网络的可能性越低的行动者,社会网络的回报率越低。
布迪厄(Bourdieu)对社会资本概念的阐述是在与经济资本、文化资本的比较中提出来的[12]。社会资本和经济资本、人力资本、文化资本一样,仅仅是众多资本类型中的一类,它对求职者收入的贡献可能会随着资本类型的增多而出现边际递减效应。当行动者拥有可以为其带来回报的若干资本时,社会资本在其中的分量相对较轻;当行动者可以依靠的资本类型较少甚至只有社会资本时,社会资本的分量则势必较大。
在林南描绘的金字塔型社会结构中,那些初始位置好的行动者,社会资本、人力资本、政治资本都相对占优。人力资本、政治资本都已经被证明在中国社会的劳动力市场中发挥正向作用[13-15]。因此,对那些初始位置较好的行动者而言,除了社会资本外,其优秀的人力资本、卓越的政治资本等其他类型的资本都会为其带来相应的回报。社会网络带来的社会资本回报仅仅是众多资本回报中的一项而已,可以发挥“锦上添花”的作用。
相应地,对那些初始位置较差的行动者而言,由于其他各类型资本相对欠缺,社会资本的回报在其整体收入中会占据更大的比重,使用或不使用社会网络,将对其收入造成相对更大、甚至是决定性的影响。对他们而言,社会网络带来的社会资本的回报分量相对更重,可以发挥“雪中送炭”的作用。因此,初始位置越好的行动者越有可能不使用社会网络,但行动者使用网络的可能性越低,社会网络带来的回报越大。据此,本文得到社会网络的负向回报假设:使用社会网络的可能性越低的行动者,社会网络的回报率越高;反之,使用社会网络的可能性越高的行动者,社会网络的回报率越低。
2003年,穆尔(Mouw)基于同质性和内生性原理提出针对社会网络效应的质疑[16-17]。作为回应,社会网络的研究者使用了赫克曼二阶段选择模型、倾向值匹配模型、工具变量法、联立方程组等方法直面内生性的挑战。当我们想精确地估计一项因果关系时,应当考虑因果逻辑链条中完整的内生性。完整的内生性应当包括事前内生偏误(Pretreatment Heterogeneity Bias)和事后内生偏误(Treatment-Effect Heterogeneity Bias)两部分[18-19]。具体而言,一方面,人们并非随机地被进入了实验组(W=1)和控制组(W=0),而是某些特征的人更有可能成为实验组成员;另一方面,具备这些特征的人不仅更有可能进入实验组,他们所获得的收益也有可能不同于他们不具备上述特质的同伴。
内生性问题本是所有社会科学研究都普遍存在的、无法完全避免的问题,但自从穆尔(Mouw)提出内生性的批评以来,社会网络分析领域便成为被内生性问题质疑和挑战的重灾区。这是因为,社会网络的建立,也即行动者的交往过程是有目的、主观意愿很强的行为,这就使得样本很难满足随机分布的要求,导致回归分析的估计产生偏误。结合前文所述的完整内生性含义,将其对应到求职过程中社会网络的研究,如果存在事前的内生偏误,意味着具有某些特征的人更有可能在求职时使用社会网络;如果存在事后的内生偏误,则意味着这些特征的人不仅更有可能使用社会网络,社会网络给他们带来的回报也不同,既可能随着使用可能性的增加而更大,也可能随着使用可能性的增加而减小。本研究将尝试分析讨论这两种内生偏误。已有研究指出,求职时使用关系并非一个随机分布的事件,而是具有共同的行为倾向,即“关系主义倾向”[20]。前期研究在探讨关系主义倾向时,把重点聚焦于行动者平时在关系上的投入,认为在关系上投入成本越大的人,越有可能是一个重视关系、认可关系的人,那么他更有可能在求职时使用关系(社会网络)。除了对关系主义的态度之外,关系主义的行为倾向是否还存在其他的外部特征呢?
更进一步的问题是,既然社会网络的使用并非随机分布事件,那么对于不同人群来说,其社会网络的回报是否一致呢?本文聚焦于求职时使用社会网络的群体,探讨社会网络的效应是否因人而异。针对前文提出的两个竞争性理论假设,即越有可能使用社会网络的人,其社会网络的回报究竟是越高还是越低?本文将使用抽样调查数据进行实证分析来加以验证。
为了检验社会网络的收入回报是否会因求职者在社会网络使用倾向性上的不同而发生变化,本文采用“多层次分层模型”(Stratification-Multilevel Method,简称“SM模型”)[18]建立实证分析模型。该模型与倾向值分层匹配(Propensity Score Subclassification)[21]类似,都是将整个样本划分为若干个“平衡”的子样本,再进行下一步分析。具体的分析思路如下:
首先,预测使用社会网络的概率。建立一个Logit模型,该模型以二分的干预变量(即“是否使用社会网络”)作为因变量,所得到的概率预测值就是求职者使用社会网络的概率,取值越高表明求职者使用社会网络的可能性越大。
其次,根据预测概率进行分层。分层的原则是“组内同质、组间异质”。即对概率预测值进行排序,并以此为基础将整体样本划分为若干个“组间异质但组内同质”的子样本。组内同质,即使用和未使用社会网络的两类求职者在各个子样本中是随机分布的,他们在那些影响“是否使用社会网络”的自变量的分布上并不存在显著差异。组间异质,即不同子样本在社会网络使用的可能性上存在显著差别,子样本分层排序越高,代表该子样本中的群体使用社会网络的可能性越大。
再次,在每一层内分析使用社会网络对收入的影响。由于组内同质的特点,社会网络对收入的效应不再受到所谓内生性问题的困扰,可以直接使用多元线性回归模型估计各个子样本中社会网络对收入的回报,得到各层内部的干预效应。
最后,观察各子样本中社会网络效应与子样本排序之间的关系。如果社会网络的效应在排序高的子样本中更大,则层数是正效应,说明社会网络在劳动力市场中存在正向选择的效应,即越是倾向于使用社会网络的人,社会网络对其收入的回报也越高。反之,如果社会网络的效应在排序高的子样本中更低,则层数是负效应,说明存在着负向选择效应,越是倾向于使用社会网络的人,社会网络对其回报就越低。在具体操作方面,本文以子样本的排序作为自变量,以各个子样本的社会网络效应作为因变量,使用经过方差加权的最小二乘法(Variance Weighted Least Squares Regression,VWLS)对数据进行拟合。由于这一步中的回归模型样本只是子样本的数量,无法直接使用最小二乘法进行估计。VWLS使用标准差进行加权,放松了方差齐性的要求,克服了普通最小二乘法面临的样本过少的问题。
本研究使用的数据来自2014年全国八大城市“社会网络与职业经历”大型社会调查(JSNET2014)。该调查于2014年夏至2015年春在长春、天津、济南、上海、厦门、广州、兰州、西安八大城市进行抽样调查,采用多阶段随机抽样(PPS)的方法,每个城市从行政区、街道、社区三层抽取各层样本,以保证随机性和样本的代表性。进入社区后使用地图法保证流动人口和外来人口能够进入抽样,入户后使用生日法随机抽取一名18—69周岁有过非农工作经历的家庭成员作为被访者。该调查共收集有效问卷5 480份。
本研究关注个体劳动者在劳动力市场的求职过程和改革开放以来劳动力市场的状况,因此删除了调查数据中职业状态为雇主、自雇的群体、在社会网络和职业收入等关键变量上缺失的样本,以及1978年之前的调查样本,最终进入分析的样本约3 930个。
因变量:现职收入。现职收入是劳动者在进入当前工作之初时的职业收入。本研究关注求职者在找工作时使用的社会网络与获得的职业收入之间的关系,为严格满足因果关系的时序性,直接使用了进入工作之初的职业收入。改革开放40年来,经济的快速发展带来了物价的大幅增长,因此本文使用每个城市当年的居民消费价格指数(CPI)来排除通货膨胀带来的影响,使得各年代进入工作的职业收入处于可比的状态。同时,由于收入原始分布的右偏态特征,在消除通货膨胀之后,又对收入进行了对数处理,使得作为因变量的收入更接近正态分布。
自变量:求职时是否使用社会网络。这既是预测收入模型(回归模型)中最主要的自变量,同时也是预测社会网络使用可能性模型(选择模型)中的因变量。
在变量处理中,“使用社会网络”不仅包括那些直接回答使用社会网络的被访者,也包括在后续问题中提到使用了社会网络的人。这是因为,在我国社会生活中,使用社会网络,或者说使用关系,常常被看作是“走后门”或“找关系”,往往具有破坏公平的负面含义,因此部分被访者不愿意直接回答自己使用了关系,但在后续的问题回答中会间接表达曾使用了社会网络。
控制变量:通过被访者对“托关系办事”的接纳程度来测量其对关系文化的态度。这是一个连续型变量,分值越高,代表被访者对“托关系办事”的接纳程度越高,意味着其对关系文化的认可程度就越高。此外,本研究的控制变量还包括人口特征变量、家庭背景变量、结构变量等方面。具体包括性别、年龄、户籍、教育程度、政治面貌、父代教育程度、父代政治面貌、单位性质、是否高收入行业、职业要求、入职时期等。
表1是对样本的描述性统计,并同时对本文关注的使用社会网络和不使用社会网络两类群体进行比较。其中,连续变量(比如“收入对数”)给出均值,类别变量(比如“教育”)给出参照项外所有类别所占的百分比,最后一列是差异检验的结果。显然,使用社会网络的求职者和未使用社会网络的求职者在诸多方面都存在显著性差异。最为明显的是,使用社会网络的求职者比未使用社会网络的求职者拥有更高的入职收入,前者的平均月收入为340元,后者仅为226元[注]本文以1978年为基准,使用物价指数对收入做过调整,因此月收入的绝对数比较低。。但目前尚不能确定这一收入差异是否是求职者使用社会网络的原因所致,因为二元分析显示,求职时是否使用社会网络并非一个随机事件,而是受到人口、社会等众多因素的影响。例如,使用社会网络的求职者平均年龄是29岁,显著高于未使用社会网络的求职者;体制外的求职者也比体制内的求职者更倾向于使用社会网络。除此之外,求职时期、求职时的户口、受教育程度、对关系文化的态度,以及单位对职员的要求等因素,均会对求职过程中是否使用社会网络造成影响。
表1 变量的描述性统计
正如表1所展示的,使用社会网络和未使用社会网络的两类求职者在诸多变量上的分布都不一致。为了得到“社会网络作用”的无偏估计,本文首先观察使用社会网络的选择性,即哪些人更有可能在求职时使用社会网络?同时以“求职时是否使用社会网络”作为因变量构建一个Logit模型,用以预测各个被访者使用社会网络的可能性。作为影响求职时使用社会网络的因素而纳入模型的变量包括性别、年龄、户籍、教育程度、政治面貌、父代教育程度、父代政治面貌、单位性质、是否高收入行业、职业要求和入职时期,结果见表2。
从表2可以看出,求职时是否使用社会网络受到诸多因素的影响,其中既有来自于年龄、教育程度、户籍状态、对关系文化的态度等个人因素的影响,也有来自于单位性质、职业要求、入职时期等结构因素的影响。这一结论再次验证了在求职时是否使用社会网络并非随机分布的,而是具有某些共同的行为特征[20],说明使用社会网络的人往往具备某些共同的特征。Logit模型可以提供使用社会网络的预测概率值,这一数值能够作为下一步倾向值分层中重要的分层依据。
根据表2中Logit模型预测的结果,本文对排序后的预测概率值(即倾向值)进行划分,得到六个组间异质而组内同质的子样本,也即表3中的第一层至第六层。按照由小到大的顺序对样本进行划分,层数越高,表明该子样本中的被访者在求职中使用社会网络的可能性也越大。具体来说,第一层中的被访者在求职过程中使用社会网络的概率最小,均小于0.1,则该子样本中实际使用社会网络的人数及其所占比例也最小,393人中只有84人使用了社会网络。第二层中的被访者使用社会网络的概率略高于第一层中的被访者,介于0.1—0.19之间;实际使用社会网络的求职者人数和比例也都高于第一层的被访者,354人中有124人使用了社会网络。以此类推,第六层中的被访者使用社会网络的概率最高,每个人使用社会网络的概率都超过了85%,实际使用社会网络的人数和所占比例也最高,589人中有437人使用了社会网络。
表2 是否使用社会网络的Logit模型分析结果
注:***、**、*分别表示在1%、5%、10%的水平上显著。
表3的每一列代表了一层,每一行是预测使用社会网络可能性的自变量。最理想的结果是在每层子样本的内部,各个自变量对于因变量(即“是否使用社会网络”)的效应均统计不显著,这意味着“使用社会网络”在该子样本中不受其他任何因素的干扰,可以看作是一个纯粹的外生变量。但实际分析中,往往很难得到如此完美的匹配,会存在个别变量仍然显著的情况,即数据并非完全平衡。譬如第五层中的“父辈党员”这一变量,p值为0.044,说明该层中,父辈的党员身份仍然影响着被访者是否要使用社会网络。根据谢宇等[19]的建议,需要在下一步预测社会网络效应的模型中进一步控制这些仍然显著的变量。
表3 使用社会网络的倾向值分层结果
在得到了比较理想的六个匹配分层后,接下来在每一层中各自计算社会网络的效应,随后采用方差加权最小二乘法(VWLS)拟合层数(也就是使用网络的倾向性)和社会网络效应之间的关系。VWLS同常见的普通最小二乘法(OLS)的区别在于其放松了方差齐性的假设。事实上,不同子样本的方差也的确不尽相同。除此之外,本文还按照常规倾向值分层的方法求得了关系在整体样本中的平均干预效应。最终的分析结果见表4。
表4 社会网络的异质性效应分析结果
注:*表示在10%的显著性水平上显著。
表4首先给出了六个子样本各自内部社会网络效应的大小、标准误和p值。可以看到,随着子样本排序的升高,即层数的增大,社会网络对入职收入的影响逐步变小,甚至出现负面作用。需要注意的是,由于每层的子样本都是分析者自行划分的,因此子样本本身没有代表性,所得到的结果无法向更高层次的群体进行统计推断。事实上,该步骤仅是整个分析中的中间环节,只有在如倾向值分层匹配中加权求和,或像SM模型中使用方差加权的方式进行回归拟合后,结果才有意义。
接下来使用倾向值分层方法计算了社会网络在整体样本中的平均效应:
Z=b/SE(b)
其中,b是社会网络的平均干预效应;k是层数,k=1,2,…,6;bk是每一层中社会网络对收入的系数;nk是每一层的个案数;N是整个样本的个案数;SE(b)是b的标准误;SE(bk)是bk的标准误。可以看到,在整体样本中,使用社会网络求职者的收入显著高于未使用社会网络的求职者,这与以往的研究结论保持一致。
之后使用方差加权最小二乘法得到社会网络效应和社会网络使用倾向之间的关系。结果显示,层数排序和社会网络效应之间存在显著的负向效应(-0.045)。根据这一结果可以拟合出两者之间的关系(如图1),其中,横轴表示根据使用社会网络的倾向性划分的六个子样本排序,纵轴表示社会网络的效应。通过图1能够清楚地看到所拟合出的负向线性关系。
图1 社会网络使用倾向与网络效应之间的关系
劳动者的求职过程实际上是劳动力资源通过劳动力市场进行资源配置的过程。理论上,伴随着市场化程度的逐步深入,市场规则越来越明确,制度刚性越来越强,政府渠道与市场渠道的资源配置作用力应该上升,社会网络渠道的使用应当受到抑制。但现实数据却表明,求职时使用社会网络已经不再是一个特殊的小群体,其内部异质性逐渐增大。本文基于针对社会网络的大型调查数据,聚焦于求职时社会网络的使用及回报,试图回答两步骤的内生性问题:事前内生性,即社会网络的使用是否是随机事件?事后内生性,即社会网络的回报是否因人而异?得到以下主要结论:
第一,求职时是否使用社会网络并非随机分布,不同特征的求职者使用社会网络的倾向性不同。在求职这一工具性行动中,求职者选择使用社会网络或不使用社会网络并非随机事件,而是存在一些共同特征使得一部分人成为了使用社会网络的人,而另一部分人选择不使用社会网络。这些特征既包括个人因素,也包括结构因素。以往关于社会网络效应的研究,大多是基于传统的回归模型分析。回归分析假定所有的研究对象是随机发生的,但社会网络的建立和使用——也即行动者的交往过程,是有目的、主观意愿很强的行为,这就导致其很难满足随机分布的要求。通过分析,本文发现确实存在一些“共性”造成了使用社会网络和不使用社会网络的两类人之间的本质差异。
第二,对于不同倾向性的求职者而言,社会网络的回报也是不同的。这就是说,在劳动力市场求职过程这一经典的社会网络分析场域中,不仅存在事前内生性,即社会网络的使用具有内生偏误;同时还存在事后内生性,即社会网络的效应具有内生偏误。即便是在使用求职网络的群体内部,社会网络的回报也是“因人而异”的。
第三,求职时的网络效应存在负向选择效应。也就是说,社会网络的回报与使用社会网络的倾向性成反比:使用社会网络的倾向性越高的求职者,社会网络的回报越低;反之,使用社会网络的倾向性越低的求职者,社会网络的回报越高。
内生性问题已经是近年来社会网络分析,尤其是劳动力市场中社会网络效应研究面临的主要挑战。学者们已经从社会网络的同质性、社会网络的选择性、社会因果关系的双向性等许多角度尝试回应内生性的挑战和质疑。以往的社会网络效应研究没有发现网络的异质性回报,可能是研究方法上的局限。本研究同时破解了事前内生性和事后内生性,在考虑了完整内生性问题的基础上,估计了社会网络的效应。人们不仅在使用社会网络上有所区别,在社会网络的效应上也存在区别。本研究提供了分析社会网络差异性回报的思路,首先估计了使用社会网络的概率,在此基础上进行样本分层,计算不同层次内部社会网络的效应,然后检验层数和社会网络效应大小之间的关系,结果支持了负向选择效应。
林南曾经回顾了20世纪末的20年间有关社会资本与地位获得之间关系的31项研究,其中的30项都证明了社会资本与地位获得之间的联系[11]。对不同的行动者而言,这些联系是否一致呢?林南的“地位强度命题”指出,行动者初始位置越好,越有可能获得和使用更高的社会资本。本研究在这一命题的基础上,又进一步挖掘了不同倾向性造成的回报差异。结果显示,在金字塔型的社会结构中,不仅资源的分布存在差异,资源的回报也存在差异。
本文探讨了社会网络的差异性回报,未来还可能展开更加深入的研究。首先,本文在探讨社会网络的使用状况时,运用了个体的各种外部特征变量来综合分析使用社会网络的倾向性。在未来的研究中可以引入第三个维度,深入探讨群体特征和使用社会网络倾向性之间的关系及其回报差异。比如社会学研究关注的焦点:阶层的信息。不同阶层使用社会网络的倾向性是否存在差异,又是否存在差异性的回报?这将更加丰富社会网络研究的社会意义。
其次,本研究关注的是求职者在进入职业之初社会网络的回报问题。除了在找工作的过程中帮助求职者找到工作、获取高薪之外,社会网络的作用还可能是长期效应,存在延时回报。在“因岗设薪”的劳动力市场中,求职者使用社会网络获得工作,可能未必在进入工作之初就有所体现。那些通过社会网络获取工作的劳动者,在进入工作岗位之后,是否受到网络的庇护而有长期发展、快速晋升、避免淘汰等特征体现,都是可能的长期效应。追踪数据的收集将有效地帮助我们回答这一问题。
此外,本研究关注的是劳动力市场中社会网络的使用和回报,劳动力市场分割模型是劳动力市场研究中的一个经典理论模型。本文的分析对象是作为整体的劳动力市场中的社会网络,而改革开放40年来,中国社会发展的一个突出特征是不均衡的现象,那么,不同时期、不同地区在社会网络的使用和回报上存在怎样的差异?体制差异、行业差异、岗位级别的差异是否造成了不同角度的劳动力市场分割?这些分割是否导致社会网络的使用和回报上产生差异?在SNS广泛使用的今天,人们的互动和交往已经突破传统的空间限制,社会网络发挥作用的场域也正面临时空转换[22]。新时期基于新型社交网络服务平台的社会网络又将如何发挥作用?这些都将是未来研究中有待深入讨论的议题。