中国科学院西部地区科技工作者的文化类型数据集

2021-04-15 10:35王肖波徐中民赵雪茹
关键词:被试者主义者一致性

王肖波,徐中民,赵雪茹

1.中国科学院西北生态环境资源研究院,所级公共技术服务中心,兰州 730000

2.中国科学院大学,北京 100049

3.中国科学院西北生态环境资源研究院,内陆河流域生态水文重点实验室,兰州 730000

引 言

文化(Culture)曾是人类学家主要领域,但现在也被诸多地理学者、生态学家以及管理决策者等所采用。比如在过去30 年人地关系研究发展中,文化已是地理学科和相关领域视为工作中一个重要变量[1]。其中,从事生态系统服务评估和保护的研究人员,现在已认识到文化价值是保护生态系统最令人信服的理由之一。再如,开展自然地理调查和研究的专家学者也意识到当地居民和他们所掌握的文化知识是生态保护、资源利用和环境治理的关键。在20 世纪末,Costanza 等[2]人将文化(价值)定义为“人地系统审美、艺术、教育、精神和/或科学的价值”。2005 年,千禧年生态系统评估[3]扩大了此定义,将人们通过知识增长、认知发展、精神反思、娱乐和审美体验纳入人地系统的非物质利益之中,使得文化作用涵盖了教育学习机会、社会关系维持及审美价值供应。可见文化因素事实上时刻以世界观、信仰体系和其他多样的方式体现在人类的日常生活和行为决策之中[4]。

虽然文化时空维度,比如国家或地区,特别是领地、习俗或语言方面相当“有形”而可区别,但在意识层面却是无形。这些文化因素在人们日常生活中已经完全内化且习以为常,很难令人有意识地表达文化的属性或特征,也难以为人所辨识。得益于社会文化可行性理论,也即文化理论[5],可以帮助辨析人类日常生活中隐含的文化因素。在文化理论的框架下,文化被定义为证明和稳定一个组织的态度和价值观,并区分了5 种基本的社会文化行为和态度的表现(Performance)[6]。因为第5种类型(Autonomy)是其他4 种类型的综合,是4 种不同文化偏好(Culture Bias)的完美平衡,但这类人非常少[6]。所以根据不同的偏好,一般将人们的生活方式归为4 类,即个人主义(Individualism)、等级主义(Hierarchy)、平等主义(Egalitarianism)及宿命论(Fatalism)。Bruner[7]早前从心理学的角度证明,文化具有经验编辑、实践价值观、为潜在行动提供评估标准以及经验和期望分享的功能。如此,从不同文化类型的角度解析不同区域人们的生活方式,可以为人地关系、人际关系乃至自我管理的解耦提供一种新的视角。为此,本文设计开发《基于社会认知的生活方式调查问卷》,尝试分型同质工作类型人员的不同生活方式,可为往后开展深入的人地关系、人际关系以及决策分析等提供调查方法和统计数据支持。

1 数据采集和处理方法

本数据集的取得由问卷开发、数据采集和数据清洗等3 个步骤组成。

1.1 问卷开发

本调查的问卷分两步开发。

(1)框架设计

正如中国传统文化中“道法自然”的说法,文化理论[5-6]是从人们对自然不同的认知着手,进而反推人类自身不同的行为准则——“道”。鉴于此,文化理论学家归纳了人们4 种通行的自然观念,即有4 类人分别认可自然的宽厚、耐受、脆弱及无常[6],见表1。这种偏好,换言之世界观,包含了自我反省、人际关系处理、社会认知以及自然感知。对于个人而言,也就表现了不同的价值观和信仰[5,6]。据此,文化理论将现实中人们的生活方式区分为4 种类型,分别是个人主义者(Individualist)、等级主义者(Hierarchist)、平等主义者(the Egalitarian)以及宿命论者(Fatalist)[6]。表1 根据理论定义,结合中国传统文化思想简述了4 种不同生活方式的自然认知和逻辑特征。

表1 不同生活方式的自然认知和价值特征[6]

由于明确调查工作在国内展开,在兼顾民族异质性的基础上,在问卷的框架设计中融入了传统中华文化的逻辑思维。具体以“天人合一”为蓝本,如图1 所示,“天”代表蕴含着“道”、“真理”和“法则”的自然和社会,“人”则包含他人与自我,指代具体的人际关系和自我反省。其中,对自然的观念源于人们与自然之间关系的平衡,涉及到感知和利用两个过程。感知的内容包含天候、景观、变迁、灾难和复原(C1-C5),利用则包含资源观、开发、管理、治理及平衡(C6-C10)。对社会的观念从对社会现象的看法和在具体社会参与的过程两个方面,从生产生活生态的角度可以将前者归纳为生产力、生产关系、法律法规、道德纪律、资源资料及地域风俗(C11-C16)等,后者涉及政治、经济、文化、社区公共事务、关系网络维持及风险感知(C17-C22)等。关于人的部分,对自我的认知从性格、兴趣、技能和价值观等4 个方面进行刻画,并为保证判定的准确性,对每个方面选取3 个不同的视角进行表征(C23-C34)。对他人的认知既是社会认知与人际关系判断的基础,也是对自我认知的补充,可从对“温良恭俭让”(C35-C39)及人性(C40)的看法进行综合考量。

图1 调查问卷的框架设计

综上,充分反映被试文化类型(生活方式)的判定题目经多次研讨完善确定为40 个,涉及4个方面。

(2)题目编制

在完成基于文化理论的问卷框架后,根据具体面向对象编制具体的题目。题目编制的基本要素来源于国外相关社会学研究人员[8-9]开发调查问卷的思路和方法。

首先,对以往研究人员用于观点偏好量级的题目转换为本调查研究所需的答案,合并同类后根据本调查的问卷框架进行题目编写。所谓观点,即观察事物时所处的立场或出发点,抑或从一定的立场或角度出发,对事物或问题所持的看法。不同文化类型的人对待事物会有不同的观点,因此对同一个观点,会有不同的偏好量级。本调查研究并不采用这种处理方式,而是将不同观点进行归类。比如,属于等级主义者的观点,即为等级主义者对某事物的看法,进而提炼对待相同事物时,其余文化类型者的观点。

然后,考虑到本次调查研究的被试群体是中国科学院西部地区的科技工作者,包含科研、技术及管理等岗位的工作人员,具备一定的知识水平和开阔的视野,长期从事科研技术管理服务相关工作。为避免调查中可能产生的掩饰和失实,题目整体围绕特定的情景“感知自然”展开,进而结合被试的社会认知和自我反思判定其生活方式,也即初步判定的文化类型。于是,本调查问卷包含开篇问候、主体试题和背景信息3 个部分组成。

开篇问候其实也是问卷说明,既是引起被试者的兴趣和重视,也是为了消除被试者的顾虑和犹疑。因为问卷需自主填写,所以对被试者的要求都简明扼要又不引起反感地表述在开篇第一句之中。

主体试题是问卷的核心部分,包括全部问题和答案,共计40 道题目,160 个选项。本调查问卷采用封闭式提问,即在每个问题后面给出4 个选择答案,被试者只能在其中选一个第一印象认可或自己最能接受的选项。为防止答题出现都选一个选项的情况,所有的答案按一定顺序进行变换。示例见表2,详见数据集。

表2 基于生活认知的科技工作者文化类型问卷题目示例

背景信息包括被试者的性别、年龄和工作岗位,由被试者自行决定是否填写。其中岗位包括科研、技术、管理及辅助4 个类型,辅助岗位指的是从事科技相关工作的长期聘用人员或在读研究生。

(3)判定机制

因为人类思维的复杂性,以往大多问卷的开发都采用既定的工作范式,以量表的形式根据对被试者在某一观点的偏好程度,来刻画其某种文化类型的倾向。这种做法的结果是,在4 种不同类型的观点上面,都将得到一个程度值,然后根据每个类型值的平均值的大小判定被试者的文化类型。事实上,这种方法存在系统误差。以Likert 五级量表为例,比如在等级主义类型范畴内的AB 两个问题上,被试者甲的评级分别为2 和5,而乙是3 和4;两者的平均分都是3.5,>3,理论上表明两者都有该类型的倾向,且具有相同的倾向程度。但实际上评分3 分代表中立,2 分表明不认同。这说明,甲在A 问题上的偏好并非认同等级主义类型;同时从B 问题来看,甲又比乙更加倾向该类型。但这些信息都被平均后的终值抹去。因此,A 问题在作为判定他们文化类型的效用上就会存疑。同理,会有一系列的问题始终围绕问卷产生。

鉴于文化类型的分类本身就是对4 种不同观点的倾向,表明每个自然人都或多或少保有这4 种类型的偏好。因此,选择一件明晰的事物,从4 种类型偏好的视角给予解读,可以形成4 个观点各异的答案。那么,持有不同偏好观点的人自然会根据最符合自身的立场进行选择。于是,以此通过计数的方式刻画其不同类型的倾向性,对被试者回答40 道题目的答案类型进行汇总,分别对应等级主义、平等主义、个人主义及宿命论的编码类别进行计数,以数量超过10 作为具备倾向性的阈值,并以数量最大者作为判定依据,判定被试者的文化类型。若某人4 种类型汇总后的最大数为2 个或3 个相同的数,则根据文化理论定义按照等级主义、个人主义、平等主义的顺序依次优先判定。比如某人答题后等级主义、平等主义、个人主义及宿命论的得分分别为13、19、2 及6,那么该人同时具备等级主义和平等主义倾向,但平等主义更显著,故判定其为平等主义者。又如某人答题后的得分分别是14、14、9 及3,判定其为等级主义者。

问卷初稿完成后,找到10 名自愿参与的被试者进行预调查研究,并邀请了9 名理解文化理论内涵并熟悉被试者的专家进行评审。最终的调查问卷经由这些人员把关后,又进行了调整和完善,以保证内容效度。

1.2 数据采集与清洗

(1)明确调查对象:本调查面向西部地区科技工作者,包括科研人员、技术人员、科技管理人员和科技辅助人员。

(2)问卷发放:本调查依托互联网站“问卷网”,以社交软件“微信”为主要媒介,于2019 年5 月和10 月向中国科学院西部地区的单位进行了“群组式”推送。受委托的4 位调查员按被调查单位的研究单元(10 个部门)划分,分别选择推送对象;由被推送对象自行决定是否填写、提交,以及继续推送给谁;调查直到样本数据超过本调查所需期望样本数为止,期望样本数E 根据研究对象职工人数(总样本规模,N=1000)的简单随机抽样要求进行确定。本调查期望样本数为88。

(3)问卷回收:回收机制设置了必须完成全部40 道题的前置要求。调查前期,因为涉及伦理学与道德规范,予以可选的匿名提交选项(此致后期数据出现人口学变量未知的情况,后期调查获依托单位批准后则对人口学信息进行收集)。为保证调查问卷的有效性和代表性,对回收样本进一步限定:拒绝匿名非本区IP 样本;拒绝同一IP 或微信账号的重复提交;拒绝单一选项超过35 个的。因此,在最终接收到的181 份问卷中,剔除不符合要求的问卷21 份,最终有效问卷为160 份。

(4)数据清洗:在完成问卷结果统计和质量验证后,对收集的数据进行整理。首先将试题答案按等级主义为1、平等主义为2、个人主义为3 及宿命论为4 进行返回值规范化转译,所任岗位依次以1-4 编码科研、技术、管理和辅助。同时删除被试者自愿提交的账号名称、IP 地址及所在地等个人隐私信息,保留性别、年龄和工作岗位信息。如此形成本数据集。

2 数据样本描述

2.1 样本数据的人口统计特征

清洗后的样本数据集包含50 列。第1 列为序号。第2-5 列为背景信息。其中,第2 列为性别信息,1 为男性,2 为女性;第3 列为年龄信息,以2019 年为基准年可推算被试者的出生年份;第4列为岗位信息,1 代表科研岗位,2 为技术岗位,3 为管理岗位,4 是辅助岗位;第5 列为问卷提交时间。第6-45 列为40 个问题的答案,1 代表等级主义倾向,2 代表平等主义倾向,3 代表个人主义倾向,4 代表宿命论倾向。第46 列为等级主义倾向得分,第47 列为平等主义倾向得分,第48 列为个人主义倾向得分,第49 列为宿命论倾向得分。第50 列为判定的文化类型结果,1 代表等级主义者,2 代表平等主义者,3 代表个人主义者,4 代表宿命论者。

本调查工作所获得的160 份有效样本数据中,所有样本的人口统计特征如表3 所示(具体对应数据集的gender、age 和position)。其中,自愿反馈性别、年龄及岗位的有126 人,占比78.8%。这其中,被试者男性比例为57.9%,女性为42.1%,与中国科学院西部地区某研究单位整体的男女比例接近;31-50 岁的人员占76.2%,即骨干力量占多数。因辅助人员大多从事技术支撑或行政管理,故已知岗位的被试群体中占比50.8%的科研人员抽样数稍微偏低。

表3 样本人口统计基本特征

2.2 样本数据判定结果描述

本调查工作所获得的160 份有效样本数据中,最终判定为等级主义者75 人,平等主义者73 人,个人主义者9 人,宿命论者3 人,整体占比情况如图2 所示。可知,抽样调查所展示的结果为,中国科学院西部地区科技工作者中,等级主义者和平等主义者分别有47%和45%,个人主义者6%,宿命论者2%。其中,等级主义者集合内反馈性别者66 人,男性为32 人;平等主义者反馈性别者59人,男性为36 人。如图3 所示,性别导致的分异,在中国科学院西部地区科技工作者中,等级主义者不明显,个人主义者和平等主义者偏向男性,宿命论者偏向女性。自愿反馈年龄信息的科技工作者中,等级主义者和个人主义者的中位数年龄近40 岁,平等主义者的中位数则在35 岁,而宿命论者处于25-30 岁之间,如图4 所示。不同文化类型的年龄分布结果与以往文化理论大范围调查的结果有较大的出入。后者认为随着年龄增大,人们会倾向于转变为平等主义者和宿命论者,而个人主义者是年轻人的特征。这说明在西部地区从事科技工作可能会对个人的文化类型或生活方式造成影响。自愿反馈岗位信息并担任科学研究岗位的64 人中,27 人为等级主义者,32 人为平等主义者,5 人为个人主义者,无宿命论者;担任技术支撑岗位和辅助岗位的46 人,23 人为等级主义者,19 人为平等主义者,如图5 所示。接受调查的16 名管理人员,9 人为等级主义者,5 人为平等主义者,1 人为个人主义者,还有1 人为宿命论者。从事行政管理工作岗位可能较大程度上影响个人的生活方式。整体上该单位从事科研和技术岗位人员个人主义者偏少,说明往后在新员工招聘过程中,有必要向个人主义者倾斜。

图2 样本数据集中不同文化类型的分布图

图3 样本数据中不同文化类型科技工作者的性别分异

图4 样本数据中不同文化类型科技工作者的年龄分异

图5 样本数据中不同文化类型科技工作者的岗位分异

3 数据质量控制与评估

3.1 质量控制

本数据集的质量控制通过收集前的问卷质量验证和数据回收过程质控两道程序保障。

(1)问卷质量验证

在完成调查问卷的初版开发后,邀请了10 名被试者开展预测试工作。被试者中从事科研岗位的人员有6 人,从事技术支撑岗位的3 人,从事行政管理的1 人。其中男性6 名,女性4 名。为能更好地在短时间接受文化理论进而自我评定,同时因为文化类型根据个人年龄的增长呈现变化趋势,故此次选择预测试被试者的年龄区间在31-40 岁之间,且为在区域科技活动较为活跃者。

在10 名预调查被试者完成问卷的填写后,由问卷开发者详细介绍文化理论关于4 种生活方式(文化类型)的区分特征(如表1 归纳)。在确保被试者已理解的提前下,给予10 分钟时间由其自行判定各自的类型,汇总得到各自的结果。对该评定结果与问卷评定结果进行分析,绘制如表4 所示的混乱矩阵,可以按照式(1)和式(2)计算一致性比率p0和Kappa 系数Kc(Cohen’s Kappa)。

式中m为匹配数,N为观察数。

式中p0是观察的一致性比率,pe则是期望的一致性比例,由式(3)计算可得。

其中,nij是指第i行第j列的频数。

表4 预测试被试者判定值与自评结果的混乱矩阵

注:判定和自评类型1-4 依次为等级主义者、平等主义者、个人主义者和宿命论者。

原则上还应进行评估的独立性检验,但预测试原本按照相互独立的方案进行设计,故此处的样本渐进方差计算省略。

另外,按照Kappa 统计量判定准则,高于0.6 即为高度的一致性强度,而高于0.8 则为几乎完全一致。于是,按照式(1)和式(2)计算得到问卷判定类型和自评类型的一致性比率p0为0.9,Kappa系数为0.861,可见本次开发的问卷具有高度的一致性。

在完成预测试后,还开展了专家评估工作。邀请了9 名在一定程度上理解文化理论,同时又认识前述10 名被试者的专家,组成一个专家判定小组,进而开展专家结合问卷对观察对象进行类型判定的一致性验证工作。其结果如表5 所示。

表5 预调查被试者的专家判定结果

根据上述专家判定结果与问卷判定的结果进行一致性分析,可得到整体观察的一致性比率p0’为0.800,Kc’为0.713,表明具有高度的一致性。

为深入研究专家判定工作的一致性程度,此时利用一个更一般化的Kappa 系数(Fleiss’ Kappa)作为一组评估人(比如m个专家,此处m=9)根据问卷题项,判定观察对象类型的一致性度量。换言之,即n个观察对象(也即被试,同时此处n=10)被m个专家独立分配到互斥的且无遗漏的s个名义分类(本调查中s=4)之中,m个专家的一致性程度。如此可分析基于问卷判定时,不同专家观察结果的一致性情况。

现约定nij为第i(i=1,2,…,n)个观察对象被判定为第j(j=1,2,…,k)个名义的频数(判定数量),则有:

若定义:

Pj即为观察中第j个分类所占的频次比例,即频率,见表5。同时定义:

Pi为对于第i个观察对象m个评估人之间的一致性程度,解释为m个专家的“一致对”占所有可能组合对的比例,见表5。

如此根据专家判定的独立性,可计算n个观察对象接受专家基于问卷判定,总的一致性比率P0为:

进而根据式(2),可以得到专家判定的Kappa 系数KF计算如式(8):

综上,分别根据式(7)和式(8)计算结果,得到问卷对照专家判定的一致率P0为0.672,KF为0.522,可见本次开发的问卷具有较好的一致性。

最后,问卷接受了预测试被试者和判定专家的修改意见和建议,进行了微调,使得言辞语义更加通俗易懂。

(2)回收数据质控

本次调查数据集的回收数据通过系统设置和人工处理两种方式开展质控。其中,依托网络平台限定的回收条件包括:完成全部40 个问题的回答方可提交样本数据;同一IP 地址不可重复提交。人工处理则主要进行单选项数目过高及非调查对象的问卷剔除。

3.2 数据评估

本次调查数据集质量评估采样整体评估和抽样评估相结合的方法。

由于本调查研究是定性研究,收集的数据为类型数据,而非具有连续性的量化变量,也即量表所得到的分值程度数据,故常规的效度检验其实并不适用。因此,采用内标验证的方法,对本问卷的效度进行校标验证。具体以调查问卷中第16 题对人性看法的选择,对本次调查问卷的结构质量进行自验证,结果如表6 所示。进而根据式(1)计算的数据集整体一致性比率为0.762,Kappa 系数为0.623,表明具有良好的一致性。

表6 样本判定结果与问卷第16 题答案的混乱矩阵

表7 样本判定结果与问卷第16 题答案的抽样一致性结果

同时,为验证数据统计随机性的作用,开展了局部抽样评估。从上述两组数据中随机抽取5 组由10 个样本组成的样本集,验证判定一致性如表7 所示。平均的一致性比率与整体的值接近,为0.80。平均的一致性指数为0.667,也与整体的接近。两者都说明数据集有较好的一致性。

4 数据价值

通过从自然感知、社会认知、人际关系处理和自我反省等4 个维度中的任意1-3 个维度,对本调查所得到数据集数据进行对比验证,都无法得到使用全部4 个维度数据的鉴定效果。因此目前来看,本调查设计的框架对中国科学院西部科技工作者的文化类型判定是综合且有效的。本文数据集为中国科学院西部地区某单位科技工作者的文化类型抽样调查情况,具有良好的一致性,可以反映西部地区该学科领域科技工作者的整体文化类型分布,可以直接用于解析西部地区该学科领域科技工作者从业态度的性别差异、年龄差异及其与担任岗位之间的关联研究。也可从文化因素的角度支撑科技评价工作相关研究的开展,为理解科技职业满意度研究、职业倦怠研究以及领导力研究提供一手的资料。如补充完善其他学科领域,或其他区域同领域科技工作者的文化类型分布,则可跨学科或跨区域进行横向对比分析。另外,对本数据集所提供的调查问卷进行相关问题的延伸,还可用于科技资源配置相关、科技创新成果产出评价及科技从业人员关键素质要求等研究领域。

5 数据使用方法和建议

本数据集数据文件为Excel 格式。为完善研究,以及提升准确性,建议使用者补充样本量或针对性地重新调查。数据作者也将持续更新样本数据。

致 谢

感谢兰州资源环境科学大型仪器区域中心给予的全面支持。并感谢瞿珊珊、韩春坛、杨永如和陶明在数据采集阶段的建议和帮助,冯克庭、赵国辉为本文撰写提供的指导。

数据作者分工职责

王肖波(1988—),男,浙江人,在读博士,工程师,研究方向为人文地理。主要承担工作:调查问

卷的设计开发,数据采集与整理,数据处理与分析,文章主体撰写。

徐中民(1974—),男,湖南人,博士,研究员,研究方向为生态经济。主要承担工作:调查问卷的验证和数据分析。

赵雪茹(1979—),女,甘肃人,硕士,工程师,研究方向为计算机应用。主要承担工作:调查问卷的数据前处理、校对。

猜你喜欢
被试者主义者一致性
忌肉主义者
注重教、学、评一致性 提高一轮复习效率
对历史课堂教、学、评一体化(一致性)的几点探讨
IOl-master 700和Pentacam测量Kappa角一致性分析
张小斐:一个长期主义者的梦想
德西效应
张小龙:真正厉害的人,都是极简主义者
德西效应
好人主义者做不了好人
儿童花生过敏治疗取得突破