电子档案的数字化信息形态

2015-08-15 00:46
黑龙江史志 2015年12期
关键词:数字信息电子计算机脉冲

潘 影

(伊春市农业技术研究推广中心 黑龙江 伊春 153000)

一、电子计算机采集、处理信息的一般过程

电子计算机采集、处理信息的一般过程是:先对自然形态的信息模式进行拾取,得到信息模拟物理量,如声波转换成电波;再对模拟物理量进行转换获得信息的数字编码;然后对信息的数字编码进行存储、传递、编辑等加工处理。当需要输出信息给人们使用时,则将上述过程逆行处理,即可恢复成原来的信息形态。不同信息形态的编码方式和处理的方法会有所不同。

二、计算机录入汉字的方法

电子计算机录入汉字的方法有4 种:即键盘录入法、扫描录入法、语音录入法、手写录入法。以键盘录入汉字,制作文本式的电子档案为例,电子计算机的数字编码过程有以下—些处理步骤:首先是在输入时对汉字进行电子计算机的外码转换。如果使用普通电子计算机键盘作为录入设备,就可以用汉语拼音、五笔字形等外码录入汉字。如果使用汉字大键盘作录入设备、则汉字本身就是外码,在键盘上直接点选就可录入某个汉字。电子计算机接收了某个汉字外码之后,接着就把外码代表的汉字用电子计算机内码记录下来。电子计算机的内码是以16 位二进制的数字表示的。电子计算机外码的编码方案有数百种,尚未制定国家标准。而电子计算机内码的国家标准是GB/T 2312—80《信息交换用汉字编码字符集》。这个标准中收入—级汉字3755 个、二级汉字3008 个、各类其他字符682 个。当完成文本式电子档案的录入工作之后,在电子计算机内进行的文件信息的存储、传输等处理就都是对这些内码的处理。只有当需要将文件输出时,才将其汉字内码所对应的字形点阵,也就是字模,以及众多字模按格式组成的文章在屏幕或打印机上输出。

三、电子计算机对图形信息的处理

对于图形信息的数字编码处理方式和方法有多种类型,但基本过程类似,例如通过扫描仪将平面二维图形转换成一维形式,由二进制数字编码组成序列,并在转换过程中加上附属信息,如行码、帧码等。图形中的白点或黑点分别用二进制的“0”或“l”表示。为了节约存储空间,还可以将二进制数字原编码序列进行压缩实现再次编码。例如文字的行与行之间有空白,就可以将这些空白用简短的压缩码表示,而不必实际存储很多的空白点编码。信息压缩方法有很多种,有的方法对信息的还原质量没有什么影响,如上面列举的对连续空白的压缩编码,就是一种不丢失信息元素的方法;有些方法会降低信息元素的密度,或丢失部分信息。使用时需注意在基本满足还原质量要求的前提下,选择不同的方法或压缩倍率。文本形式的电子文件与图形形式的电子文件有时相互交错,如在文本文件中可能有插图或直接用光笔在其上进行修改或书写。此外,文本文件和图形文件在一定条件下可以互相转换,如用汉字模式识别技术可以把图形文件中的汉字图形经识别后,转换成汉字内码,变成文本文件。

四、电子计算机对其他信息形式的处理

在电子计算机多媒体技术的支持下,电子文件还可以包括声音、影像等多种形式。不过这些信息形态对于电子计算机的内部处理来说,也都不过是二进制的数字编码而已,只是在输入和输出时,才有其各自的特殊形式。电子计算机对于影像信息的处理过程要相对复杂一些。影像信息是由每秒钟25 或30 帧画面组成的,一般还配有伴音。在处理时,要分别拾取和加工,并保留其同步特征,即画面与伴音的对应关系。一帧影像信息按行、列被分成若干象素,如1024 行×860 列等。每个象素的信息属性编码可以有颜色、饱和度、亮度等。这种编码的信息量是很大的,为了少占用存储空间,也可采用压缩编码的方法处理。

电子文件从一个裁体复制到另一个载体,或者从一台电子计算机传递到另一台电子计算机,实质上是在电子计算机内进行数字信号的传输处理。这种处理与通常的纸质文件复制或缩微品拷贝有很大区别。后者于模拟物理量的处理,不可避免地会出现清晰度下降、畸变、信息丢失等问题。而电子文件复制,由于是数字化的信息处理,所以几乎完全不存在上述问题。原因是数字信息本身特性和各种技术措施决定的。例如在其传递过程中可以通过对传输码校验来纠正误码。数字信息传递的波型是脉冲方波,对其进行调制的基本领率来自于精确的脉冲信号,如果传递过程中发生脉冲信号的丢失,则可在接收端按脉冲信号进行增补,被增补脉冲的特性可根据其前后两个相邻脉冲的特性确定,由于脉冲信号颠率很高,对被传递信息的取样密度也就很高,相邻脉冲差别极小,故增补脉冲与丢失脉冲的差别小到可以忽略不计。此外,如果在传递过程中混进了干扰信号,可以采用“脉冲间闲静噪”、“脉冲限幅”等技术去掉干扰信号。脉冲信号在传递过程中其高领分量的衰减较之低频更大一些,使得方波变成“山包”形,只要在增加强度的同时增补高额分量,就可以完全恢复到与原波形一样。例如,在光盘被复制时,如采取了较完善的技术措施,所出现的误码率能够做到不超过十的负十四次方,也就是说相当于传递200000 份《人民日报》的文字信息量,才可能有一个汉字出错。所以完全可以做到复制后得到的电子文件与原来的电子文件无任何区别。由此可见,只要数字信息在传递过程中尚可识别,信息与干扰就可以几乎被完全分离,从而获得高质量的电子文件信息。而模拟信息的传递则是另一种情况,例如,接收普通电视信号时,随着信号的减弱,背景噪音和画面上的雪花状干扰就会越来越明显,直至信号被淹没在杂波之中。而数字信息在接收时.信号弱到一定程度会突然中断,事先没有明显的征兆。从这个意义上讲,在数字信息的处理过程中会产生一些猝不及防的问题。此外,电子文件传递和复制的这种高保真性,通常是好事,但是对于想特意区分原件与复制件来说又是很麻烦的事,这个问题需要采取专门的技术措施方能解决。

[1]侯晓莉.水利施工企业电子档案管理探讨[J].甘肃水利水电技术,2008(05).

[2]阎文华.电子档案的保护[J].林业科技情报,2005(04).

猜你喜欢
数字信息电子计算机脉冲
基于非因果滤波和零点法的近断层脉冲型地震动识别方法
他克莫司联合超脉冲CO2点阵激光治疗慢性湿疹的疗效观察
激光脉宽对熔融石英中超连续光谱的影响*
基于云平台的数据储存与文件管理研究
美国国会图书馆指导公众开展个人数字信息保存的举措
高校学籍档案信息化管理研究
电子计算机的普及与应用
第一台电子计算机
数学与经济发展
有机计算机