文/化祥雨 王义伟
从数据、知识、模型算法、案例、工具维度看,数字化改革“大脑”应当将“大脑”数据链、知识链、模型算法链、案例链、工具链全面协同、交叉、融合、贯通、联网,集成嵌入到各种业务流、治理流、服务流,真正形成政府和市场数字化改革闭环网络
“大脑”毋庸置疑是全省数字化改革的中枢。类似于人类大脑,数字化改革“大脑”应包括数据、知识、模型算法、案例、工具等核心部件。其中,数据是数字化改革“大脑”接收的信息,知识是数字化改革“大脑”学习的老师,模型算法是数字化改革“大脑”决策的芯片,案例是数字化改革“大脑”对标的榜样,工具是数字化改革“大脑”操作的系统。数字化改革“大脑”建设路径应从数据、知识、模型算法、案例、工具几个维度展开。
数字化改革大脑建设框架图
“大脑”数据应包括统计大数据、互联网大数据和地理空间大数据等。目前各业务部门数据归集多以统计大数据为主,互联网大数据和地理空间大数据有待进一步采集补充。值得注意的是,数据处理质量的好坏直接影响“大脑”的思考和决策。数据处理环节通常将数据和现实问题抽象成具体的数学符号,常用{X,Y}矩阵集表达存储,根据具体问题进行数据缺失补齐、特征选择、数学化、标准化、归一化等操作。对有些特定问题数据以文本、图像、音频、视频等形式存储,需要进行文本分析、图像处理、音频处理、视频处理等操作,将其转化为一定格式的标准化数据进行存储。
从内涵上来讲,知识可以是物质世界中具体的文件,也可以是精神世界中抽象的思想。从分类上来讲,知识包括图书、文献、论文、报纸、规划、课题研究,也包括指导思想、战略目标、政策法规、法律文件、党规党章、经验做法、公理定理等。从形式上来讲,知识的呈现形式可以是数据、文本,也可以是图像、音频、视频等。需要说明的是,“大脑”知识也应该进行数据化、标准化、模块化处理与存储,这样有利于更好地对“大脑”知识进行深入挖掘与对比分析。知识的重要价值在于其可以作为“大脑”学习、训练、模拟、仿真、预测的先验辅助集,时刻教导、监督、矫正“大脑”学习的效果。
选择模型算法之前要厘清现实问题的属性。各业务部门在做场景的时候,首先要思考清楚现实问题的属性具体是什么。现实问题对应的是监督学习问题、半监督学习问题,还是无监督学习问题?对应的是分类问题、回归预测问题、聚类问题、特征选择问题,还是关联匹配问题?对应的是单一指标问题、多维指标问题、指数构建问题,还是预警预测问题?合理匹配现实问题与最优模型算法是“大脑”的核心。对有些现实问题,单一模型算法未必一定是最优的,多种模型算法综合学习对比或者组合集成决策值得探索。
从体系架构来看,“大脑”案例涉及党建、纪检、民主法制、意识形态、统一战线、群团体制、生态文明、经济体制、社会事业、文化体制、法治、社会治理等领域。从业务实操来看,“大脑”案例包括先进业绩、突出成就、标志成果、最佳应用、规范标准、流程制度、专家经验、经济研判、周期规律等。需要说明的是,成功的案例可以作为“大脑”输出的参考集,辅助“大脑”更好地学习训练,亦可以作为典型标杆,对标对表,激励不同领域、不同跑道、不同场景不断迭代优化升级。
从学习端来看,“大脑”工具应包括数据整理导入、知识转化处理、资源约束管控、模型匹配构建、算法选参训练、预测输出验证、组件衔接调用等。从应用端来看,“大脑”工具应包括问题需求发布、指令一键传达、战略目标管理、政策模拟仿真、资源要素匹配、诉求及时反馈、问题智能诊断、关联文件推送、新闻热点捕捉、舆情预警研判等。
2022年是实现浙江数字化改革“一年出成果、两年大变样、五年新飞跃”战略目标的关键之年,也是全面贯通、集成突破、集中展示之年。2月28日,省委书记袁家军在全省数字化改革推进大会上提出:“要探索‘大脑’建设路径,在全面实现支撑核心业务运行监测评估的基础上,提升‘大脑’的预测、预警和战略管理支撑能力。”数字化改革“大脑”应当将“大脑”数据链、知识链、模型算法链、案例链、工具链全面协同、交叉、融合、贯通、联网,集成嵌入到各种业务流、治理流、服务流,真正形成政府和市场数字化改革闭环网络。