大数据时代我国数据素养分类研究

2020-04-09 12:05贵州广播电视大学远程教育教学部
图书馆理论与实践 2020年2期
关键词:意识素养专业

付 超(贵州广播电视大学远程教育教学部)

1 大数据时代我国数据素养分类研究的必要性

1.1 填补已有数据素养文献缺乏分类研究的空白

通过文献梳理发现,当前缺乏针对我国数据素养分类的研究。仅有刘培等从研究视角和侧重点的角度介绍了国外数据素养的三种类型:工匠型数据素养、参与型数据素养及交互型数据素养。[1]我国大数据发展迅猛,在国家高层高度重视、数据经济突飞猛进、数据基础设施建设日渐完善、数据技术日新月异的大背景下,相关的数据素养“软件”研究必须跟上“硬件”步伐,才能够促进我国大数据向纵深方向发展。因此,本文对大数据时代我国数据素养进行分类研究,以期填补我国数据素养分类研究的空白。

1.2 扩大数据素养研究对象,拓宽数据素养研究领域

通过对国内数据素养研究文献的梳理发现(见表1),已有研究对象明确且相对集中,主要研究对象为科研人员、图书馆员、教师、学生、编辑、记者等;研究领域主要涉及科研机构、各级各类图书馆、学校、大众传播行业等。这表明主流研究文献认为数据素养是特定人群应当掌握的“技能”或“从业准则”,是少部分人的事情,仅有少数文献阐述了公民个人在大数据背景下提升个人数据素养的重要性和具体途径。在大数据时代,任何个人、公司、企事业单位等非政府组织、各级政府组织集数据的生产者、使用者、传播者、受益者(损益者)等多重角色于一身,数据素养已经成为大数据时代个人及组织的基本素养和技能,数据素养绝不仅是少部分人的事,对数据素养的研究也绝不应该囿于特定人群。

1.3 提高数据素养教育的针对性和实效

为了更好适应大数据环境,让数据技术更好发挥作用,身处大数据时代的任何个人和组织都必须具备过硬的数据素养,但已有数据素养教育研究的主体非常有限,缺乏针对公民个人、社会组织以及创新型数据人才的教育研究和行动。数据素养已经成为制约国家和地区大数据向纵深方向发展的重要因素,数据素养“软实力”与数据基础设施、数据技术等“硬实力”共同决定地区及国家大数据的发展程度。因此,必须重视公民个人及各级各类社会组织的数据素养,着力提升数据素养教育的针对性,数据素养的分类研究即是强化数据素养教育针对性的重要措施。

表1 国内数据素养主要研究对象及主要研究领域

1.4 促进全民数据素养意识的形成

笔者在2019年对贵州省公民数据素养现状进行问卷调查研究时发现,公民的数据素养意识淡薄是普遍现状,大部分已有研究也认为数据素养是特定人群和特殊领域的事情。在大数据时代,为避免成为新时代的“文盲”,必须自上而下形成全民参与数据素养提升的意识,构建以政府、教育行政主管部门、各级各类图书馆、学校、公司、企事业单位等社会组织,以及公民个人为主体的数据素养教育和提升体系。总之,要打造人人皆须具备过硬的数据素养的共识。

2 数据素养的类型

本文按照研究对象以及数据素养能力水平将当前我国数据素养划分为面向公民个人的基础型数据素养、针对专业人士及特殊领域的专业(职业)型数据素养和针对数据人才(如数据算法师、数据分析师)的创新型数据素养。本文将从含义界定及能力特征两个方面分别阐述三种类型的数据素养,能力特征主要围绕数据意识、数据思维、数据能力、数据伦理与道德、数据规范五个维度展开。

2.1 基础型数据素养

2.1.1 含义界定

基础型数据素养是指在大数据环境下,公民个人及社会组织为了适应时代需要必须掌握的数据技术和数据能力。具体来说,是指个人及组织运用数据思维收集、分析、使用、传播数据及体现数据价值的能力,以及在此过程中体现出来的数据伦理和数据规范。[24]基础型数据素养突出基础性和通识性,具有广覆盖(涉及所有个人及组织)、能理解(大数据)、能运用(基本的数据技术)等特点,拥有基础型数据素养的个人及组织就如同具备基本的听说读写能力,处于扫盲水平,是大数据时代个人及组织更好利用大数据的必备素质。

2.1.2 能力特征描述

(1)数据意识。① 明确认识数据的重要性,了解数据在消费、决策、学习、职业生涯、个人隐私中的重要作用。以消费为例,数据意识要求个人须从主观上加强隐私保护,尽可能防止个人数据的泄露,减少因个人数据泄露造成的损害。2019年,北京市消费者协会发布的大数据“杀熟”问题调查结果显示:56.92%的被调查者表示有过被大数据“杀熟”的经历。[25]导致出现大数据“杀熟”现象的原因很多,但从个人角度而言,必须加强自我隐私保护意识,减少个人数据信息泄露。② 有借助数据解决问题的意识。有观点认为,大数据的真正价值在于预测,通过相关关系或是采取寻找关联物的方法,个人及组织可以进行“精准预测”,并及时解决问题。UPS国际快递公司与汽车修理预测就是这方面的典型案例,通过监测车辆的各个部位,UPS公司只需要更换零件而不必更换车辆,大大降低了发生交通事故的概率。③ 有数据权属意识。美国塔夫茨大学全球商业理论权威巴斯卡尔·查克·拉沃尔蒂提出了“新型GDP”(Gross Data Product)的概念。[26]权属问题直接关系到个人和组织的利益,当前我国尚缺乏数据权属意识的培育与形成,但是,随着大数据的深度发展,数据权属意识必将深入人心,作为数据贡献者的个人和组织,理应得到相应的数据利益和回报。

(2)数据思维。① 具备大数据思维方式。大数据思维要求重视相关关系,这是由大数据的相关性特征决定的。在高速信息化时代,为了得到即时信息,实现实时预测,就必须要借助大数据分析技术。[24]企业据此可以实现“精准营销”,政府依此可以实现“精准治理”。大数据具有全样本性的特点,用全数据样本的思维方式思考问题、解决问题,能够大大减少企业成本和政府行政成本。② 具有一定的数据批判性思维。了解数据局限性,不盲目崇拜数据。由于政府数据机构审查机制的缺陷,以及数据输入端的GIGO (garbagein,garbageout) 效应,[27]数据总是“脏兮兮”的。因此,如果不加分析地将大数据奉为“金科玉律”,必然会陷入数据泥潭不可自拔。

(3)数据能力。① 具备一定的数据直觉能力和收集能力,能够对数据保持一定的敏感性,结合实际需要判断数据价值,具有在“大数据”中获取、提炼所需“小数据”的能力。② 具备一定的数据评估能力和清洗能力。因为数据审查机制的缺失、GIGO效应等因素,我们收集到的数据并非完美无缺,评估数据真伪和数据价值是使用数据的前置条件,而如何清洗数据、让“脏数据”变成“干净数据”是实现数据价值的关键环节。很显然,数据素养的缺失是不可能完成这一任务的。③ 具备一定的数据分析和决策能力,即对数据进行分析处理,使之产生价值的能力。[24]值得欣慰的是,有不少教科书“手把手”教导我们如何使用各种软件以实现数据可视化,方便高效地完成数据分析。因此,掌握基本的数据分析方法并不是一件遥不可及的事情。“数据驱动决策”的趋势在变得日益重要,这些基础性的数据可视化软件能够更加直观地呈现数据规律,帮助用户发现数据价值,使决策更加科学。

(4)数据伦理与道德。了解数据生产、采集、传播和使用中所涉及的道德和伦理问题。在大数据时代,每一个人都是数据的生产者、传播者、使用者和受益者(受害者)。基础型数据素养要求身处大数据环境下的个人及组织自觉遵守数据道德,在数据生产、采集、传播和使用各个环节中恪守底线原则,时刻保持同理心,不触犯不伤害他人名誉和利益。

(5)数据规范。了解有关数据隐私问题和保密问题。尽管针对公民个人数据信息保护的专门法律规范尚未出台,但并不意味着用户可以打擦边球或是为所欲为。基础型数据素养要求个人及组织必须主动了解网络安全法、电子商务法、民法总则、刑法等法律中相关的数据隐私及数据保密条款,加强个人与行业自律,自觉遵守并践行相关规范。2.2 专业(职业)型数据素养2.2.1 含义界定

本文所说的专业(职业)型数据素养是指专门针对科研人员、图书馆员、教师、学生、编辑、记者等对象,主要涉及科研机构、各级各类图书馆、学校、大众传播行业等领域,立足于专业(职业)要求,需要研究对象熟练掌握专业(职业)要求的数据能力,以便各类人员具备相关领域规定的专业(职业)素养要求,恪守专业(职业)数据规则和伦理。专业(职业)型数据素养具有明确的对象性、极强的针对性、典型的专业领域限制。

2.2.2 能力特征描述

(1)数据意识。能够意识到数据在个人专业(职业)发展中的重要作用,并利用数据助力专业(职业)发展。中国社会科学院语言研究所词典编辑室对数据意识下的定义是“对各种可能与自己的学习、工作、生活相关的数据敏感,具有关注和发现相关数据的意识和兴趣”;[28]王春生提出,“数据意识体现在生活中就是能够积极利用各种数据来提高自己的生活质量,进行日常生活决策等;体现在工作中就是具有收集工作中产生或与工作相关的数据的意识,以方便进行各种决策,或支持自己的科学研究”的观点;[29]张宪丽等认为,数据意识包括数据感、数据权利意识和数据使用意识等;[30]郝媛玲等认为,数据意识包括主体意识、获取意识、共享意识、更新意识、安全意识等方面。[31]

(2)数据思维。① 在思想上认识到大数据对专业(职业)发展的重要性。孙众等认为,教师要对数据有较强的敏感性与接受度,能有意识地、自觉地、主动地获取数据,为改进教学提供证据来源;[32]金兼斌提出,对新闻记者而言,数据素养的核心内容是对数据的亲切感和直觉,记者要努力成为一个全身散发着“数字泥巴”气息的人。[33]② 重视数据相关关系。教师可以借助数据的力量,提取出隐含的、未知的、有潜在应用价值的教学信息,掌握辅助教学决策的系列工具。[34]③ 能够批判性地评估数据源、客观评价数据质量、识别数据中存在的问题,不盲目崇拜数据。宋甲丽等通过对在校本科生、硕士生、博士生、科研人员等群体的调查研究显示:学生对数据科学性及准确性的判断主要依靠发布数据机构的权威性,科教人员则主要利用实验来验证。[35]

(3)数据能力。① 具有专业(职业)要求的数据技术并能够获取目标数据,数据处理技术正成为确保新闻生产能力的又一种决定性因素。[33]② 能够发现与专业(职业)相关的数据瑕疵并使用正确工具进行数据清洗的能力。如,对隐私数据的辨别与保护、对数据失真的辨别、对数据的综合应用能力,包括数据的收集、获取、管理、分析、清洗、利用与交流等。[36]③ 能够批判性评价与专业(职业)相关的数据。郝媛玲等通过对国内外相关研究的总结和分析,认为数据素养包含对数据的批判性思维能力,其本质是对统计素养和信息素养的延伸和扩展。[31]④ 具有较强的数据分析及可视化能力。左平熙以咨询馆员为研究对象,认为应根据实际的咨询问题确定所要分析的数据对象和数据边界,以便数据价值再现。[7]

(4)数据伦理与道德。① 在专业(职业)范围内,数据的生产、采集、使用、分享中所涉及的道德和伦理问题。隆茜提出“了解数据采集、使用、分享中所涉及的道德和伦理问题,能够尊重他人的数据,使用时能够注明出处”的观点;[37]孟祥保认为,数据引用规范性是数据利用行为的伦理维度,并提出了需加强国内科研人员数据素养的忠告。[12]② 尊重数据原创,自觉维护数据创造者的利益和名誉,注明文献及数据出处,自觉遵守数据发布和使用中相关的社会规范。凌婉阳以科研人员为研究对象,认为科研数据伦理的核心是:在数据生产、采集、使用和分享的过程中,保护他人数据权益的同时,保护好自身的数据权益。[38]

(5)数据规范。① 熟悉专业(职业)范围内有关数据隐私问题和保密问题。黄如花等将对数据产权及隐私权、数据伦理原则的了解程度、能否对所引数据进行规范说明作为学生数据伦理的评价标准。[39]② 践行专业(职业)范围内数据共享和保存的相关注意事项。王春生研究了数据管理过程中数据生命周期、元数据及保存方法等注意事项。[29]③ 注重专业(职业)范围内数据权属问题并自觉尊重他人的数据知识产权。杨文建提出在使用第三方数据时不得用于营利目的;尊重数据来源的法律法规和道德规范,保证数据的完备性,不得恶意截取篡改和歪曲数据;不侵犯他人隐私和利益;注意数据使用的规范性,为学生树立正面形象等建议。[40]

2.3 创新型数据素养

2.3.1 含义界定

创新型数据素养,是数据创新型人才通过分析最大化呈现数据价值,用好用活数据,为个人、企业等社会组织、为地区经济发展、为国家社会向纵深方向发展作出特殊贡献的能力和素质。具备创新型数据素养的人才往往具有独到的眼光和灵敏的数据嗅觉,能够迅速发现数据价值与数据商机,具有极强的数据敏感度和数据创新能力,通过深挖数据价值,为组织或个人做出精准决策。显然,不管是社会组织还是国家发展,拥有创新型数据素养人才是有效挖掘“数据石油”的关键因素,专业的数据分析师、数据算法师、统计学家、人工智能专家即是典型的数据创新型人才。

大部分数据价值都是潜在的,需要通过创新性分析来释放其价值。套用舍恩伯格的比喻“数据的真实价值就像漂浮在海洋中的冰山”,[41]127在大数据海洋中,具备基础型数据素养的人只能看到冰山一角,而绝大部分隐藏在表面之下的数据价值只有具备专业水平和创新水平的人群才能够发现,这就是数据算法师、数据分析师、统计学家、人工智能专家越来越受社会追捧的原因。舍恩伯格认为,在大数据时代,专家将会逐渐被数据算法师们取代,并直言“行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音”。[41]180

2.3.2 能力特征描述

(1)数据意识。具有独到的眼光和灵敏的数据嗅觉,能够迅速发现数据价值与数据商机,具有极强的数据敏感度和数据创新能力,通过深挖数据价值,为组织或个人做出精准决策。

(2)数据思维。① 对收集到的数据有极强的批判思维和怀疑精神,盲目信任收集到的数据是不负责任、不专业表现的理念深入他们的内心,对收集的数据表现出习惯性的怀疑是他们的职业特点。② 能够发现数据的多重价值,秉持大部分数据的价值来自于二次甚至多次挖掘的思维方式。

(3)数据能力。① 能够根据丰富的工作经验和专业能力发现数据中的离群值,发现数据中暗含的缺陷,并高效解决数据瑕疵问题。② 具有系统的数据完整性校验能力——准确评估数据问题大小,准确定位导致数据问题的原因,利用适当的软件及表格进行校验,并进行数据清洗以便进行下一步的数据分析工作。③ 掌握全面系统的分析方法,能够对数据进行深度分析,并不断在数据研究的方法论方面进行创新和突破。④ 熟练掌握运算法则,能够根据实际需要选择适当的分析和预测工具,对计算结果及可视化后的数据能够进行准确解读,以确保为之服务的公司、企业、政府部门甚至个人能够通俗易懂。⑤ 具有极强的软件运用能力,甚至在数据软件开发方面有自己的独到的见解和贡献。创新型数据人才不一定是某一问题的专家,但丝毫不影响他们透过数据现象认识事物本质。

(4)数据伦理与道德。① 熟悉数据生产、采集、使用、分享中所涉及的道德和伦理问题。② 尊重数据的创造者,自觉维护数据创造者的利益和名誉。③ 高度的自觉性,恪守职业规范与职业道德。

(5)数据规范。正因为创新型数据人才在数据能力方面的突出之处,加强对他们的数据规范将会显得比任何一个群体都更加重要。从理论上讲,创新型数据人才须具备习得规范的能力和意识,但在实践中,也必须加强规则意识训练,使他们成为规则践行者。任何行业都有其行业准则,数据算法、数据分析、数据技术工程等创新型领域自然也有其从业准则,如数据算法师可能在公正、保密、资历及专业水准、不滥用数据信息为个人牟利等方面有具体要求。[41]229

2.4 三种类型的数据素养水平等级描述

目前,学界并没有对数据素养的含义形成统一的定义。本文认为,数据素养是指在大数据背景下,公民个人、公司、企事业单位等非政府组织、各级政府组织运用数据思维收集、分析、使用、传播数据信息的能力以及在此过程中体现出来的数据伦理和数据规范。[24]不管是哪一种类型的数据素养,其包含的维度并没有本质上的区别,区别在于各种维度对不同群体的要求不一样。表2从数据意识、数据思维、数据能力、数据伦理与道德、数据规范五个维度对不同类型的数据素养水平等级进行了描述。

3 结论与建议

3.1 结论

随着大数据向纵深方向发展,数据素养将成为国家,公司、企业等社会组织以及公民个人之间重要的竞争力。如果缺乏数据素养,人们在运用科技和使用工具时仍将停留在带有自我局限性的、实验性的和自我满足的原始阶段。[42]但在现实中,数据素养的重要性并未得到应有的重视。毫无疑问,数据素养的普及是一个漫长而艰难的过程,涉及到组织(个人)意识、目标定位、实际需求、数据隐私保护、学习培训、投资回报等问题。个人可以通过自主学习获得某些数据素养,但系统的数据素养的习得必是一个系统工程,需要政府及教育行政主管部门、各级各类学校、图书馆、公司企业等社会组织以及公民个人的共同参与。在这个全民皆是数据的贡献者、使用者、受益者(受害者)的年代,任何组织和个人都必须参与到数据素养提升行动中来,以便能够用好用活大数据,体现数据价值的同时实现自己的权益。

表2 不同类型的数据素养水平等级描述

3.2 建议

3.2.1 分类型提高数据素养教育的针对性

根据教学目的、教学手段、教育对象特征等,着力提升数据素养教育的针对性和实效。① 基础型数据素养教育要体现广覆盖、能理解、能运用的特点,对公民及社会组织进行通识型、基础性的数据素养教育,以扫除大数据文盲为主要目的。② 专业(职业)型数据素养教育具有对象明确、针对性强及典型的专业领域限制的特点,因此,专业型数据素养教育要立足于专业(职业)发展需求,提高研究对象熟练掌握专业(职业)要求的数据能力,以便相关人员具备相关领域规定的专业(职业)素养要求,恪守专业(职业)数据规则和伦理,具备专业(职业)发展所需要的技能和素质。专业(职业)型数据素养教育一定要在针对性上下功夫。③ 创新型数据素养教育的侧重点应放在对数据创新型人才的数据伦理、数据道德和数据规范的教育及意识培育方面,创新型数据人才具有一般人所不具备的数据能力,但他们并不天然具备与数据能力相匹配的数据伦理、数据道德和数据规范。考虑到创造性和破坏性成正比,加强对数据创新型人才的数据伦理、数据道德和数据规范教育显得比任何一个群体都更加重要。

3.2.2 形成一套自上而下、全员参与的数据素养教育体系

如前所述,在大数据时代,数据素养绝不是特定人群和特殊领域的事,数据素养已经成为大数据时代个人及组织的基本素养和技能。因此,为避免成为数据时代的“文盲”,必须形成一套自上而下的,以政府、教育行政主管部门、各级各类图书馆、各级各类学校、公司、企事业单位等社会组织、公民个人为主体的数据素养教育和提升体系,全民普及,全民均须具备过硬的数据素养意识的理念。

3.2.3 将数据素养添加到学校主流课程教育中

我国自2016年开设数据科学与大数据技术专业以来,截至2019年,共有479所高校开设了该专业,其中,2016年3所、2017年32所、2018年248所、2019年196所。但现阶段我国高校数据科学专业建设普遍呈现出课程体系缺乏系统性、教学科研资源严重匮乏的现实困境。[43]因此,应以此为契机,加大高校对数据素养教育的重视和投入,将数据素养添加到学校主流课程教育中,增强学生、教师、各级各类学校、科研工作者、政府及教育行政主管部门对数据素养的重视,让高校大学生在学校习得扎实的数据素养知识,养成良好的数据素养,为我国数据素养教育奠定牢固的理论基础和提供模范的行为方式。

3.2.4 加强对基础型数据素养和创新型数据素养的研究

目前,国内关于专业(职业)型数据素养的研究颇多,有力地推动了我国科研人员、图书馆员、教师、学生、编辑、记者等群体数据素养的提升,促进了我国科研机构、图书馆、学校、大众传播等行业的发展。今后,为了充分实现我国的“数据红利”,必须加强对基础型数据素养和创新型数据素养的研究,将数据素养研究对象扩大到身处大数据环境下的每一个个人及组织。如,加快出台具有我国大数据发展特色的、符合我国国情的《数据素养指南》读本;强化针对数据分析师、数据算法师、统计师等群体的从业规范研究;强化对公民数据素养意识的培育研究,加快相关数据隐私和数据保护法律法规的研究等。

猜你喜欢
意识素养专业
人的意识可以“上传”吗?
一句话惹毛一个专业
必修上素养测评 第四测
必修上素养测评 第三测
必修上素养测评 第八测
必修上素养测评 第七测
专业降噪很简单!
专业化解医疗纠纷
增强“四个意识”发挥“四大作用”
更聚焦、更深入、更专业的数据分析