刘莉 王翠萍 刘雁
[摘要]针对情报学中数据、信息、情报三者的关系进行探讨,综述了目前已有的情报学转化论的理论研究,在情报学的学科发展和数据密集的时代发展环境下,构建数据、信息、情报的三角转化模式。在原有的数据转化为信息、信息转化为情报的基础上,提出信息到数据的逆向转化和数据到情报的直接转化,并对转化过程进行探讨。
[关键词]数据;信息;情报;转化
[中图分类号]C250.2
[文献标识码]A
[文章编号]1008-0821(2015)02-0028-04
大数据时代的到来,引起了新一轮的数据浪潮。数据作为情报转化论的研究元素之一,对它的研究引起了各界学者的重视。无论是政府还是企事业单位都在努力获取数据,分析数据并利用数据,从而带动组织得发展。大数据的利用核心是通过对海量数据的搜集和整理,将其转化为有价值的可以为行为主体提供决策服务的情报。这一过程正是数据到信息和情报的转化。在大数据时代发展的推动下,情报领域应加强对转化论的研究,从而更好的利用数据,推动医疗、交通、教育等事业的快速发展。
在中国知网中检索情报学相关论文,可以发现情报应用和实证的研究越来越多,理论的研究与深化有被忽视的倾向。在对情报学三动论的研究中,序化论的研究较多,转化论和融合论的研究相对较少。其中,转化论的研究主要集中在信息的转化上,信息与知识的转化、信息与情报的转化、知识与情报的转化。无论是实践的发展还是情报学自身发展,都需要对数据、信息、情报的转化理论进行深入研究。
1 数据、信息、情报概述
研究数据、信息、情报之间的相互转化,首先应明确三者的概念,及彼此之间具有怎样的相互联系。
1.1数据、信息、情报概念
在情报学中,数据、信息、情报作为情报学研究的主要元素,被学者们从不同的角度进行了研究和探讨。对其概念的理解也是众说纷纭,目前仍没有明确统一的概念。从情报学的角度理解,笔者认为,数据是数字、符号或代码等的表示形式,单个数据本身是没有具体意义的,但在制定的环境下的多个数据是特定含义的。数据是一种资源,它可以作为结构单元被存储和利用。信息是对客观事物属性的描述,虽然有些信息和数据的表现形式相似,也可以是数字、图像、音视频等,但信息本身是有意义的,这一点是与数据存在着明显的区别。信息是传播的具体内容,它有传出方和接受方,具有一定的直观性。数据是客观事实,而信息则具有真伪之分,需要人们通过自己的主观经验来辨别。所以说信息是对事物或情况的描述,可以作为一种交流性的语言,具有明确的解释和内涵。而由于情报的基本属性,虽然不能将情报与信息完全分开,但情报应有其独有的特点。情报是针对不同的主体而言,主要体现在价值上。信息无论其是否存在价值,它都客观存在着。而情报是在有价值的前提下存在着,不管情报的概念最终落在信息上还是知识上,情报都是一个单独的集合。
数据、信息、情报都是一种资源,是对客观事物的不同的表示形式。他们虽然有很多共同点,但却有自己独有的特征。所以数据、信息、情报作为独立的个体,可以进行相互转化。
1.2数据、信息、情报三者关系
由于数据、信息、情报均从不同的角度有很多的理解,导致三者的关系也多种多样。在学术界对于其概念的诠释和三者关系的纷争都从未间断。1997年H.Garai将数据、信息、情报的关系表述为:Data+Relevance+Purpose=Information;Information+Understanding=Intelligence;Intelligence+Action=Effectiveness。从学者们的研究中可以发现,数据、信息、情报的关系可以主要概括为:并列关系、包含关系、转化关系、交叉关系。并列关系体现在情报学基础理论中,数据、信息、情报均为独立的个体,有其自身的特点和内涵,是一种概念元素。作为元素,数据、信息、情报三者存在并列关系。包含关系是大多数学者的观点,认为数据包含信息、信息包含情报,这是从范围的角度对三者关系的界定。转化关系可以说是在包含关系的基础上建立的,数据的范围比信息大,数据中非信息的部分可以通过加工转化为信息,而信息中非情报的集合元素也可以经过加工转化为情报。所以数据、信息和情报之间存在可转化的关系。
数据、信息、情报之间的关系并没有那么简单,其中还存在复杂的交叉关系。数据、信息只是从不同角度对同一客观事实的不同表述。而情报此时并不在其中,如果对这一对象,从外部加入情报,原有的数据或信息将会发生结构性改变。情报作为外加物质,促使数据、信息发生改变,从而实现知识的创新。情报的出现源于广泛的数据和信息,它们之间是互相支撑、互相补充的。
综上所述,数据、信息、情报从不同视角下有着不同的关系。在并列关系、包含关系、转化关系和交叉关系中,转化关系被提及的较多。情报学转化论是对其转化关系的进一步探讨。无论数据、信息、情报的关系怎么界定,三者都是密不可分的。
2 数据、信息、情报转化研究现状
2.1数据、信息、情报的线性转化
数据、信息、情报之间也可以用箭头的形式进行线性链接,从而体现其中的相互关系。数据经过分析和整合转化为信息,信息经过加工和提取转化为情报。而有些学者也将知识纳入其中,贯穿于三者之间的转化。
线性转化模式在学习生活中比较常见,如学术论文的数据库,包含着很多相应的数据,经过检索词的选择和缩小范围就可以搜集到某个主题的数据集合,这些数据集是一种信息的体现,利用各种分析方法对这些信息进行分析,可以得出相应的研究报告,研究报告具有一定的结论性,可以为对以后的研究和热点的分析有一定的理论指导意义,即转化为了情报。这种转化模式较为简单直接,其主要分歧在于知识在其中的位置,早期的线性转化是“数据——信息——知识——情报”,在不断的研究探讨后,有学者提出知识不应作为其中的一个节点,而是将知识贯穿于数据、信息、情报三者的转化之中。数据到信息的加工过程离不开知识,信息到情报的加工过程也少不了知识的支撑。无论是那种观点,线性转化模式都是从最表面的现象对数据、信息、情报关系的一个表达。该模式属于传统的模式,但随后出现的模式也将此作为主干,在其基础上进行加工和扩散。所以数据、信息、情报的线性转化模式在其关系的界定中有其一定的理论基础和研究意义。endprint
关于数据到信息、信息到情报的转化,化柏林教授都已经进行了深入的研究,他认为数据到信息可以通过情景化、有效化、归一化、细分化和精炼化处理进行转化。信息转化为情报可以通过以下几种方式和途径:去伪存真型分析、对比分析型、见微知著型分析、由此及彼型分析、化零为整型分析,通过这些分析将信息转化为情报。
2.2数据、信息、情报的金字塔转化
传统的金字塔模式展现的是一种递进的关系,数据是信息和情报的前提,金字塔的形式也体现了数据的范围是最大的。情报位于塔尖,不仅是范围的精小,同时也说明了情报的价值性。而信息则作为两者之间的纽带,是一个过渡,也是一个枢纽。
用金字塔的形式来表示数据、信息、情报的层次体系,层与层之间都存在着固定的关系,每一层比它下面的一层都多赋予了一些特质。从获取原始的数据开始,对数据进行分析,挖掘数据之间存在的关系,从而转化为信息。数据是记录下来可以被鉴别的符号。它是最原始素材,没有被加工解释,也没有回答特定的问题。信息是已经被处理、具有逻辑关系的数据,是对数据的解释,这种信息对其接收者是具有意义的。情报是加工了的信息,是通过对信息的合成和提取,总结出来的可以为决策提供支持的那一小部分知识。
金字塔转化模式在情报学领域被广泛熟知和传播,对转化理论的影响也较为深刻。但芬兰学者Iikka.Tuomi在1999年的时候提出的倒金字塔转化模式,也值得深思。他认为数据、信息(情报)、知识是倒金字塔结构:数据是从信息(情报)里产生的,信息(情报)是在我们拥有知识后涌现出来的。该结构将信息和情报放在一个层次里,而知识作为金字塔的底部,认为知识是情报的前提,先有知识后才可以出现情报,先有信息后才能有数据。无论是正金字塔还是倒金字塔,它们都体现着数据、信息、情报之间的关系和相互之间的转化。而将两种金字塔结合起来,将更为确切的表示了几个事物的动态关系。
2.3数据、信息、情报包含关系转化
包含于链状转化结构是借用了数学中的集合概念,并结合数据、信息、情报三者的包含关系建立的。有学者认为数据、信息、情报具有包含关系,他们每一个物质都组成一个集合。数据集合中的元素最多,集合范围最大,信息的集合是数据的真子集,而情报作为最小的集合真包含于信息集中。如果数据集合记做全集U,信息集合记做集合A,情报集合记做集合B,那么数据中非信息的部分就可以记做CUA,信息中非情报的部分则记做CAB。由此,数据、信息、情报之间的转化就可以这样理解。在数据集中,非信息的数据可以向信息集中的数据进行转化(CUA转化为A),在信息集中,非情报的信息可以向情报集中的信息进行转化(CAB向B转化)。
包含于链状模式在一定程度上扩大的数据、信息、和情报的概念范围,使其变成一个大的元素集合。并认为信息是一种特殊的数据,情报是一种特殊的信息,也是一种特殊的数据。包含于模式与金字塔模式的主要区别在于内在的转化。金子塔将三者分别独立开来,层与层之间不存在交叉关系。
3 数据、信息、情报三角转化模型构建
大数据时代,随着社会对于数据的重视程度的加深,加工数据的先进技术在不断出现,部分数据到情报的转化可以直接进行,无需按步骤先转化为信息,再进一步转化为情报。而在三者之间的转化关系中,信息的数据化应被列入其中,信息到情报的转化过程也可以是先对信息进行数字化处理后再进一步转化为可以提供决策的情报。数据、信息、情报之间的三角转化模式主要是在线性模式的基础上增加了数据到情报的直接转化,以及信息到数据的反向转化。从而构建出单双线桥连接的三角形转化模式。
如图1所示,该模型在数据、信息、情报之间构建了4条转化路线,分别是数据到信息、信息到情报、信息到数据、数据到情报。其中数据和信息是可逆的转化过程。本文重点探究粗箭头指示的两个转化。
3.1信息转化为数据
信息到数据的转化也就是信息数据化。信息转化为数据与倒金字塔的观点相吻合,芬兰学者Iikka.Tuomi认为数据是从信息中产生的。而怎样产生、如何产生就是信息转化为数据的过程。计算机时代,信息的数字化已经被广泛应用到实际生活中。
信息的数字化其实是计算机技术的典型应用。计算机将信息用二进制代码的形式表示,本身就是一种数字化模式。在这个数据堆积的时代,高效的存储和利用数据要求有较高的技术支撑。条形码、二维码说明了信息到数据的转化。条形码是将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的图形标识符。条形码下面对应着一排数字,每一个数字都有其独特的含义。条形码具有惟一性,而且采集量大。一位条形码可以采集几十位字符的信息,二维条形码更可以携带数千个字符的信息。条形码可以标出物品的生产国、制造厂家、商品名称、生产日期、图书分类号、邮件起止地点、类别、日期等许多信息。二维码输入的是信息,呈现的是数据,生活中到处都是信息,也存在各种信息不安全的因素。在保护个人隐私不被泄露的前提下,我们可以将原本复杂的信息进行转化,以一种简单明了的形式呈现出来。目前二维条形码被应用的越来越广泛,商家利用微信二维码宣传产品,车票利用二维码体现用户购票信息,报纸也出现了二维码,以便读者对感兴趣的信息进一步关注感兴趣的信息。这是一个时代的特征,也是数据时代的产物。条形码、二维码技术足以说明信息转化为数据的这项技术已经被社会所接受和认可。条形码使信息的传递速度增加数倍,而且节省了存储信息的空间,灵活可靠。这也正是信息转化成数据的真正意义所在。
信息数字化既能无时间空间限制的利用信息,又能减少存储空间。不仅可以应用在图书馆、博物馆等重要的信息的保存和利用,还可以应用到各行各业的业务处理中。信息到数据的转化是在一定的合理条件下,由先进的技术作为支持才可以做到的。但是这种转化是存在的,也就是说数据和信息之间是互相转化的,转化反应可逆。在某种特殊的情况下,为了将信息转化为情报,也可以先对信息进行数字化处理后,将数据转化为情报来进行。这一过程可以是连续不间断的。endprint
3.2数据转化为情报
随着数据时代的发展,对数据加工技术的不断改进,数据到情报的转化变得简单易行。R.M.Hays等人就认为:“情报乃是数据经过加工处理而产生的数据”。R.M.Hays的观点表达的是情报其实是一种特殊的数据,是在原始数据的基础上进行加工得到的。加拿大McGill大学信息学教授David Batty,他在《情报工作与信息科学:一船两夫》一文中指出,情报工作和信息科学的相同点在于输入、处理和输出原始数据。情报工作是原始数据变为情报,信息科学是原始数据变为信息。这足以说明数据可以转化信息,数据也可以转化为情报。而数据到情报的转化是否必须经过信息是我们有待探讨的。
对于一个企业来说,数据可以转化为企业的洞察力,数据可以转化为证据,数据也可以转化为提供决策的依据,另外规范的数据还可以提高企业的创新力。无论是洞察力、证据还是创新力,他们对于企业来说都是一种可用作提高企业竞争力的情报。而企业真正需要的就是情报。大数据改变了企业的业务,也推动了社会发展。企业对数据的加工需要更为先进的技术来直接提取情报。数据到情报的转化不是简单的人工能实现的,更多的依靠技术来实现。数据可以通过相应的技术直接转化为情报,但在这个过程中,因为数据具有原始性、复杂性、多量性的特点,对技术也有着很高的要求。大数据时代的兴起,数据将不再是单纯的数字或是符号,而是一笔巨大的财富。掌握数据就是掌握了发展方向,拥有数据就拥有了决定权。超市的销售记录显示,啤酒和尿布共同购买的次数较多,于是超市将啤酒和尿布摆放在附近,让彼此带动销售,得到了很好的效果。在这个过程中,超市的销售记录数据库里储存的是大量的购买记录,经过对该数据库中的数据进行分析,发现其中存在的销售规律。从而为企业赢得更大的利润的过程充分的将数据转化为有价值的情报。
大数据时代出现了数据清洗、数据挖掘、数据融合等技术,对数据的深入加工。数据到情报的转化,可以通过这些技术来直接进行,数据的原始性使得到的情报更具有真实性,技术的先进性使得转化更具有高效性,但目前的技术有限,还需进一步开发。所以数据可以通过一定的技术方法直接将其转化为情报,而无需提取信息,转化过程更为直接。
4 结语
本文是在实践发展的带动下,重新审视情报学基础理论的研究。笔者提出了数据、信息、情报之间存在的新的转化模式:在原有的数据可以转化为信息,信息可以转化为情报的基础上,还存在着信息到数据的逆向转化,也就是说数据和信息在特定条件下是可以相互转化的。此外,大数据时代,一些新的计算机技术的出现,也促使了数据到情报之间可以直接进行转化。因此,将数据、信息、情报之间的转化模式概括为单双线桥结合的三角形的转化模式,进一步完善了数据、信息、情报之间的转化关系。本文的研究是在已有理论基础上新的探索,如有偏颇之处,敬请批评指正。
(本文责任编辑:孙国雷)endprint