廖继东 林 风
(河南省总工会干部学校 郑州市 45002)
党的十九大报告指出,加快建设创新型国家,建设科技强国、质量强国、航天强国、网络强国、交通强国、数字中国、智慧社会。第一次提出了“智慧社会”这一概念。追本溯源的话,“智慧社会”是对前几年提出的“智慧城市”的扩大版和升级版,而“智慧城市”则是美国科技巨头IBM 公司提出的“智慧地球”的中国化和城市化。2008年,美国将“智慧地球”定为国家战略,接下来,很多发达国家也提出了自己的智慧国家战略。例如2012 年9 月,韩国政府提出了“智慧韩国”的发展目标。中国在面对第三次产业革命和即将到来的第四次产业革命,也同样做出建设智慧社会这一重大战略部署。
智慧社会中,“智慧”是核心。智慧从何而来呢?我们认为智慧就是国家治理者的决策,决策水平的高低代表了智慧的高低。目前蓬勃发展的各种信息化技术,为国家治理者、工会工作者提供了非常重要的技术支撑。2019 年,习近平总书记在第六届世界互联网大会的贺信中说到:“当前,新一轮科技革命和产业变革加速演进,人工智能、大数据、物联网等新技术新应用新业态方兴未艾。”党的十九大报告中指出推动互联网、大数据、人工智能和实体经济深度融合。
在这些信息技术中,互联网、移动互联网、物联网是数据采集、加工、传输的技术;云计算是用来构建信息系统的平台技术;而能给决策者直接提供决策帮助的是人工智能和大数据技术。
在目前人工智能技术尚未成熟的情况下,大数据是智慧社会中智慧的重要源泉,一个国家、一个社会、一个城市想要“智慧”,离不开对大数据的利用和分析。
为了更好地利用大数据,2015 年,国务院出台了《促进大数据发展行动纲要》。随后,国家决定实施“国家大数据战略”,许多省市也纷纷成立了大数据管理局,规划建设大数据产业园,加快推进本地的数据共享融合。预计中国的大数据市场产值将很快超过万亿元。
在党的《加强和改进党的群团工作的意见》出台后,工会组织正在主动进行自身改革创新,以改革推动群团组织提高工作和服务水平,努力开创党的群团工作新局面。其中建设网上工会,打造智慧工会,正是工会改革创新的重要组成部分。
如果说“工会上网”是“互联网+工会”的初级阶段,属于工会工作的初步信息化和网络化,其特点主要是在工会工作中利用网络,如电子邮件,网络检索信息,通讯软件,提升工作效率和降低工作成本等;那么“网上工会”就是“互联网+工会”的中级阶段,就是把工会工作尽可能地延伸到网上,拓展工会工作的新空间,增加工会工作的新手段,更好地团结和联系职工;而“智慧工会”则是“互联网+工会”的高级阶段,它是运用大数据分析、人工智能、数据挖掘,深度学习以及机器学习等技术,及时、准确地把握工会会员的情况和需求,决定工会工作的下一步方向。上述的这三个阶段,类似于驾驶方式中的手动挡驾驶,自动挡驾驶和自动驾驶。自动挡驾驶升级到自动驾驶,是一个突破性的发展。自动驾驶中,车辆可以根据前方路段拥堵情况,自动调整重新规划行驶路径,这就是智慧的体现。要判断前方路段是否拥堵,主要就是依赖大数据技术。
中国工会十七大报告中指出:“强化互联网思维,运用大数据、云计算、物联网、人工智能等手段推进工会工作,促进互联网和工会工作融合发展,构建网上工作平台,打造工会工作升级版。”[1]从这里可以看出,智慧工会是工会运用多种信息化手段,融合工会工作者的互联网思维,构建智能化工会工作体系。
2017 年,中华全国总工会印发了《全国工会网上工作纲要(2017-2020 年)》,其中主要任务部分中的 “四大建设”专门提到“智慧数据库建设,……充分利用大数据与人工智能技术,建设工会决策支持系统,为广大职工的普惠服务、职工队伍状况的深度分析和工会组织的高效运转提供必要的科技手段。”[2]这也充分说明了,中华全国总工会对大数据技术的高度重视和深入分析。
美国著名学者阿尔文·托夫勒(Alvin Toffler)将大数据认为是“第三次浪潮的华彩乐章”。尽管现在很多政府部门和公司,认为海量的数据就是大数据。但是基于学术观点,大数据应具有:容量大、多样化和速度快的特征,也就是3V(Volume,Variety,Velocity)。
容量大指的是海量的数据规模。Google 前CEO 埃里克·施密特(Eric Schmidt)曾说,现在全世界两天所产生的数据量,相当于人类2003 年以前所有的数据量的总和。数据量大既是优点也是缺点,优点是庞大的数据使我们决策不再依赖于小范围的抽样数据,这样我们的决策会更加精准;而缺点是这些庞大的数据里面包含着大量的无用无效的数据,不是拿来就可以用的,而是需要人们去分析和挖掘。
多样化指的是数据的格式和来源越来越多样化,包含了文本、音频、多媒体等数据。而分析出这些多样化数据之间的相关性,正是大数据的神奇之处。例如供水公司通过分析某个区域的供水数据,可以推算出该区域的交通拥堵时段(早上用水高峰后,再过40 分钟左右,路上可能会拥堵)。同样通过供电公司的电网数据,统计写字楼集中关灯时间,可以估算出晚上堵车时段。
速度快是指数据的产生和处理是自动化和实时性的。随着5G 的到来,移动互联网,特别是物联网的迅速普及,数据的产生变得更为多样、自动、实时。例如,“热搜”榜反映了人们普遍关切的话题,而且传播极快,影响极大。2019 年的“无锡高架垮塌事件”、“李心草事件”等都是登上了热搜榜,而当地相关部门对移动互联网的特点不熟悉,反应回应不及时,造成一些不良影响。因此工会工作者要时刻注意“热搜榜”是否出现了损工事件,从而及时做出正确回应。
继几千年前的实验科学、数百年前的理论科学和数十年前的计算科学之后,大数据已被定义为科学探索的第四范式。大数据功能和作用,可以概括为两个,一是统计,二是预测。
1. 大数据的统计功能。政府、企业、个人在做决策的时候,要么基于经验,要么基于数据,而基于数据的决策被证明优点要多于基于经验。
在小数据时代,我们采用的是随机抽样的方法,即力求用最少的样本数据得到最为精准的结论。这是因为,在互联网时代之前,抽样通常是发放纸质调查问卷和上门走访等方式,获得数据非常困难。另外,由于很多职工群众认识不到位、担心隐私泄露等原因,不乐意参加统计调查样本,所以填写的调查内容并不能真实有效反映职工的情况。这种方法的缺点是,获得的样本数量和质量不能让人满意。常会出现少数人的意见决定多数人的需求,少数地区的特点代替多数地区的特点。
在大数据时代,得益于移动互联网和物联网的发展,数据通常可以实时、便捷的得到,甚至自动产生。这些具备规模大和自动化特点的大数据,正好可以弥补抽样调查中局部、片面数据的缺点。
例如:人民网的“两会调查”的热词调查就是基于大数据。2019 年度参与调查的网民人数超过447 万人,发现老百姓最为关心的问题是正风反腐、依法治国以及社会保障。百度导航、高德导航等导航系统,都是通过分析用户手机上传的数据,分析出实时路况,再进行出行路径的实时调整;Google 公司分析用户搜索流感的大数据,判断出美国流感疫情的现状,在时间上比美国疾控中心发布的还要快两周。
由此可见,工会工作者可以借用互联网和移动互联网手段,进行大规模的职工需求调查,摸清职工各方面的需求,比如个人基本情况、工资福利、技能培训、劳动保护、安全卫生、思想动态等方面,为工会谋划工作思路提供参考。
2. 大数据的预测功能。大数据预测主要是围绕目标对象,基于它过去的大数据和相关因素,进行数据分析,提前做出预警。网络科学学会的创始人巴拉巴西教授认为:如果数据充分,人类93%的行为是可以预知的。
2016 年,美国洛杉矶警察开始与加州大学洛杉矶分校合作,分析了过去上千万起案件,匹配相关的模型和算法,进行犯罪预测,成功将该地区的犯罪率降低了30%。
再例如目前商业机构常用的用户画像技术,就是基于用户的历史行为数据,将他们区分为不同的类型,推断出用户可能的喜好和需求。淘宝网通过大数据技术将你可能需要的产品推荐给你,今日头条将你感兴趣的新闻资讯推送给你,而Google 和YouTube 则利用大数据对用户进行精准的广告投放。
同样,如果工会组织能够对职工的行为数据进行深入分析和挖掘,给不同的年龄、工种、地区的职工做出职工画像,做到比职工更了解自己的需求,这样我们的工会工作就真正能够达到智能化。
3.在大数据应用方面存在的误区。目前,很多工会工作者对大数据不是很了解,常出现两种思维误区,走入两个极端。一是认为大数据就等同于传统数据统计的加强版;二是认为大数据不再需要传统抽样分析。
第一个误区,将大数据等同于传统数据统计。虽然大数据具有传统数据统计的功能,但是通过数据统计得出准确判断,只是大数据的一个基础功能。大数据不但可以做数据统计和分析,还可以找出原本看似风马牛不相及的两个事物之间的内在联系,例如沃尔玛“啤酒+尿不湿”大数据相关性的经典案例。因此说大数据最重要和特别的功能就是预测功能。
第二个误区,认为大数据不需要科学抽样分析。大数据的“大”不仅是其数据体量本身很大,更重要的是大数据相对于传统数据的一个本质特征就是大数据“不是随机样本,而是全体数据”。但是全体数据却常常是理想状态,在现有条件下很难实现。
单纯的体量大,并不能代表是全体数据,很多时候会存在“样本偏差”等状况,这样即使将把体量很大的数据提取出来分析,其预测结果也不一定准确。例如:1936 年“兰顿总统”事件。1936 年美国总统大选,《文学文摘》开展了一次民意调查,共发放调查问卷1000 万份。调查结果显示兰顿的支持率是57%,而罗斯福的支持率是43%。但最终的结果是罗斯福以61%的得票率当选美国总统。这其中最主要的原因就是抽样框选择不当,《文学文摘》的调查样本是从美国当时的电话簿和车牌登记名单中选出的,这大概只覆盖了全美35%的人口,而当时能开汽车用电话的都是高收入人群,他们在政治上偏保守,大多对罗斯福的新政持反对意见。
因此,现实数据是含有系统偏差的,数据源的优先级应该是全体数据>好的采样数据>不均匀的大量数据,在这里好的采样数据是越大越好,数据越多,分析的结果就越精准。
智慧工会与传统工会工作之间的区别在于,它是基于互联网、移动互联网技术,来全面感知职工的多样化需求,再通过人工智能和大数据分析技术做出正确的针对性响应。
首先我们要有数据源(用户群体),然后搭建智慧平台,并在智慧平台对职工提供各种智慧服务,这些服务对职工数据进行感知、收集、存储,工会组织对这些职工大数据进行分析,做出决策和预测,改进和丰富智慧平台上承载的智慧服务,而升级后的平台和服务也会继续感知和产生新的职工数据,工会工作者再对这些新数据进行分析,改进服务。这样整个体系就形成了一个智能化的闭环。
智慧工会的运作环
截至2017 年9 月底,我国职工总数3.14 亿,工会会员3.03 亿人,工会基层组织280.9 万个。这些庞大的会员和组织基数是工会大数据的根本支撑,没有了他们,“智慧工会”的智慧就成了无源之水无本之木。
根据全国工会网上工作纲要(2017—2020年)任务中的“一体推进、两个覆盖、三网并用、四大建设、十类应用”,其中三网并用、四大建设都是属于智慧平台。
习近平总书记说到“网民来自老百姓,老百姓上了网,民意也就上了网。群众在哪儿,我们的领导干部就要到哪儿去,不然怎么联系群众呢?”我们工会工作者要深刻理解习总书记的讲话,工会要上网,而且要注意群众在哪里上网?目前工会工作的智慧平台比较流行的是“两微一端”的微平台。由于互联网行业竞争激烈,产品更新换代快,比如现在今日头条、抖音短视频等在职工群体中喜爱度和利用率已经超过了传统的微博。工会工作者要注意紧跟发展趋势,及时更新改进工作平台。
2018 年,中国工会第十七大通过的《关于〈中国工会章程(修正案)〉的决议》,对工会的基本职责增加了竭诚服务职工群众。这说明做好工会会员服务工作是工会工作的基础,也是下一步工作创新的重点。
在新媒体、自媒体时代,网络逐渐成为职工工作、生活、学习以及娱乐的主要场所。但是正是由于自媒体的高度发展,网络上每个人都有了麦克风,任何人都可以对当前社会的现象发表看法。大家的政治、文化、道德水平都不同,很可能对一些社会现象和社会热点问题产生不准确甚至是错误的看法,工会就需要及时正确引导职工的思想,弘扬正能量。
工会在提供智慧服务的同时,也是收集数据的过程。在收集数据的时候,要注意数据的准确性和实时性。按职工所需和工会所能原则,定期开展线上活动,活动形式多样化,尤其是要符合移动互联网的特点。注意多和职工互动,对职工的要求要及时反馈。实现线上线下有奖互动,寓教于乐,把职工吸引到我们的智慧平台上。这样,随着智慧工会的进一步建设,在工会智慧数据库里存储的会员基本信息、会员活动数据以及会员反馈信息将形成庞大的工会会员大数据。
运用大数据技术,对智慧平台感知和收集来的会员、职工的各类大数据进行分析,用数据分析的结果指导工会工作。
工会正在积极推进普惠化服务。然而不同地区,不同企业,不同工种,甚至不同年龄的职工他们的需求是不一样的,比如富士康的工人和东风集团的职工需求肯定是不一样的,美团外卖骑手和建筑工人的需求也是不同的。如何去挖掘出他们的不同需求,提供差异化和精准化的普惠服务呢?要做出智慧决策,我们就要充分利用已经拥有的庞大会员和组织的行为数据,对这些数据进行分析,挖掘出职工正确的需求,而不是从自己的工作经验出发,用自己的想法代替职工的需求。
例如在工会劳动保护工作方面。通过分析比对近几年内来自劳动监察部门、安全生产监督部门和工会自有的大数据信息,明确不同地区、不同类型企业的工伤比例的数据,从而提供个性化的劳动保护和安全生产教育等服务[3]。
与此同时互联网已经成了意识形态领域斗争的主战场,因此各级工会组织应该对工会各种网络系统中的会员行为如实记录(比如留言,发帖,浏览,聊天等)进行分析,及时掌握用户的思想动态、对其行为进行预测。这对稳定职工队伍思想和引导网络舆情有着至关重要的作用。
大数据思维作为重要的互联网思维,是工会工作者必须要具备的。但是目前一些领导对于快速发展的新技术不适应,又懒于学习,思维还停留在“前互联网时代”,认为“群众跑腿越少、数据跑腿越多,权力的含金量也越低。”在这种思想指导下建设的网站和手机APP,内容单调空洞,办的会员卡也没有多少实惠和实用功能,很难吸引广大职工群众,最终成为 “僵尸网站,僵尸卡”。这些平台和软件一整年下来,可能也收集不了多少数据,更谈不上数据的实时性了。
我们调查了很多地方工会的微信号,浏览量常常都是300 ~500,这显然和其工会会员基数是不匹配的。但是通过分析,我们发现一些职工喜闻乐见的活动,浏览量会明显提升,说明在工会APP 和工会微信公众号的栏目和项目中,需要设置真正吸引职工的内容。要有互联网思维中的用户思维、粉丝思维、平台思维,以用户的需求为出发点,做好工会核心业务,同时利用和借用其他资源,为职工提供所需服务,做职工的娘家人,把会员变成工会的粉丝。
数据是21 世纪的石油和金矿。既然是金矿,就需要挖掘和提炼,不是有了数据,就有了智慧。目前,在大数据方面大多存在一个问题,都知道大数据是宝贝,每个行业每个部门都在收集数据,但收集来的数据,却不知道怎么分析利用。导致了一个现象:数据太多,智慧太少。
由于大数据分析需要较高的IT 成本,所以目前对大数据分析应用较好的只是几家大型的银行、保险、电信和电商。其他企业和行业,在大数据分析方面,暂时都是处在起步阶段。
目前工会本身不具备较高的IT 技术,我们可以和国内知名企业合作,比如阿里和腾讯,对工会大数据进行分析,建立合作共赢机制。
首先加强工会内部数据共享。2017 年5 月,中华全国总工会发布了《工会组织和工会会员实名制管理工作方案》,提出到2020 年底建成以省(自治区、直辖市)为基本集成单元的分布式工会实名数据库。把全国三亿多的职工数据整合在一起,这是工会运用大数据的基础工程。
其次是加强与外部部门的共享。推进与政府相关部门,比如人社、民政、公安、银行等进行有关数据的对接和共享,力争接入国家大数据中心。例如,工会和银行部门合作,对工会帮扶的困难职工的消费购物情况,进行监控分析,确保帮扶资金落在实处。由于政府部门的数据资源都有自己的体系,在数据格式上不兼容,无法直接对接;另外有些数据涉及机密和个人隐私,不能直接共享,这些都需要顶层设计、规划和协调。
大数据和任何技术一样,都是一把双刃剑。我们在享受大数据带来便利的同时,也要面对新的问题,包括数据泄露、数据滥用以及隐私安全等问题。例如成都市某社区工作人员,利用职务之便,泄露新生儿信息50 万条;南京某公务员,泄露82 万条公民信息。类似安全事件的发生给国家信息安全敲响了警钟。
习近平总书记对处理安全和发展的关系高度重视,特别指出“没有网络安全就没有国家安全,没有信息化就没有现代化。”《促进大数据发展行动纲要》中专门强调,要“科学规范利用大数据,切实保障数据安全”。
我国工会会员基数庞大,而且工会数据库里往往还存储着家庭成员的个人隐私数据。根据麦肯锡公司的测算方法,省级工会的职工数据库价值近千万,而国家政府部门的大数据价值在 10万亿以上。
随着互联网、移动互联网以及物联网和我们的工作、生活结合越来越密切,工会系统也和各个部门之间业务来往增多,数据之间的互联共享是不可避免的,这样数据更易受到攻击感染。因此,要合理制定安全防护级别标准,完善网络安全管理制度体系,采用完备可靠的软硬件安全措施,保证工会网络信息系统的安全运行[4]。
我国的工会组织拥有多达3 亿的庞大会员数量,加上全国、地方、产业工会所构建的智慧平台,以后必定会获得海量的职工数据,这蕴含着巨大的价值。各级工会组织要对工会大数据进行认真深入的收集和分析,既可为党政提供决策帮助,又可为职工提供精准的服务,更好地履行工会竭诚服务职工群众的职责。