〔摘 要〕民族信息学(Ethno-Informatics)是探索信息化条件下中国少数民族地区信息活动和信息现象基本规律的科学领域,研究范式的在学科建设当中具有非常重要的地位。从人、信息、技术和环境之间的互动关系所面临核心矛盾的不同,民族信息学可以划分为“信息交流范式”、“信息处理范式”、“信息管理范式”、“信息理解范式”和“信息融合范式”。目前,我国的民族信息学研究整体上处于由“信息处理范式”向“信息管理范式”的转型阶段,未来需要重点关注学科的基础性问题、少数民族语言电子文件文档一体化管理、少数民族语言信息资源集成共享的基础设施平台、少数民族语言多媒体信息处理与共享、民族地区多语种信息服务的管理规范等问题的研究。
〔关键词〕民族信息学;范式;少数民族语言信息资源
DOI:10.3969/j.issn.1008-0821.2012.02.008
〔中图分类号〕G201 〔文献标识码〕A 〔文章编号〕1008-0821(2012)02-0031-05
The Paradigm and Trend of Ethno-informatics ResearchZhao Shenghui
(Department of Management,Tibet University for nationalities,Xianyang 712082,China)
〔Abstract〕Ethno-informatics is the domain aims to study basic rule of information activities and phenomenon in ethnic minority residence regions of China in digital age,the research paradigm is significant to its development.From the difference of conflicts among interaction of human,information,technology and circumstance,ethno-informatics can be expressed by information communication paradigm,information processing paradigm,information management paradigm,information understanding paradigm and information fusion paradigm.Currently,the research of ethno-informatics situated at the transforming stage of information processing paradigm to information management paradigm.In future,the issues such as basic research,unified management of electronic document and archive,the infrastructure of integrated sharing for information resource in minority languages,the process of multimedia information in minority languages,the management standards for multiple languages information services in ethnic minority residence regions should be emphasised.
〔Key words〕Ethno-informatics;paradigm;information in minority languages of China
中国是统一的多民族国家,多民族、多语言、多文字是国情的基本特征。20世纪80年代以来,为了使少数民族群众共享信息化时代的成果,国家采取各种措施促进少数民族语言文字规范化、标准化和信息处理技术研究,以蒙古文、藏文、哈萨克文、维吾尔文、柯尔克孜文、朝鲜文、壮文、彝文等为代表的少数民族语言操作系统、字处理软件、办公自动化系统、编辑出版系统、多媒体节目制作系统、网站系统等开始在民族地区得到应用。民族地区信息化建设的持续推进催生了一门新兴的学科——民族信息学。
1 建立民族信息学研究范式的必要性
民族信息学(Ethno-informatics)是探索信息化条件下中国少数民族地区信息活动和信息现象基本规律的科学领域,其研究对象是社会信息化背景下中国民族地区的人、信息、技术和环境之间的互动关系,是在近年来随着全球范围内构建多语言信息社会共识的达成,社会信息学(Social Informatics)和社群信息学(Community Informatics)在西方国家的兴起[1],中国民族地区信息化建设进入新阶段而形成的一门新兴的综合性、交叉性的学科。民族信息学的核心理念是“多元一体(Diversity & Integrity)”思想,旨在探索社会信息化背景下保护语言文字多样性、增强中华民族凝聚力的技术架构和管理模式,为中国各民族地区信息化建设提供理论指导,为数字时代“中华民族多元一体格局”[2]的技术实现提供理论支撑。
中国民族问题的复杂性决定了少数民族信息活动当中人、信息、技术和环境之间互动关系的复杂性,也决定了民族信息学必然是一个涉及技术、管理、政治、法律、语言、文化等多领域知识的综合性学科。目前,民族信息学的科学研究刚刚起步,理论体系还不成熟,大多数研究所关注的都是民族信息学当中的微观性问题,研究成果所涉及的领域较为分散,大多数没有触及学科的核心问题。造成这种局面的主要原因在于目前民族信息学领域缺乏较为系统的研究纲领,各类研究的战略一致性难以得到保证。因此,从全局视角研究民族信息学的整体性战略,对于这一学科的构建和发展具有非常重要的意义。为实现这一目标,将科学研究当中的“范式”理论引入民族信息学,研究民族信息学形成和发展过程中的范式演进规律,是当前迫切需要解决的问题。
范式(Paradigm)是美国哲学家托马斯·库恩在其著作《科学革命的结构》一书中提出的概念,主要是指常规科学发展过程中某一科学的研究者群体所共同遵循的世界观和行为模式,是一系列假说、准则和方法的总和[3]。从认识论角度看,范式是帮助人们认识事物发展规律的有效途径,它使事物发展过程中所遇到的各类错综复杂的矛盾得以简化,便于人们明确事物的发展方向,把握特定发展阶段的核心矛盾,保障整体上的战略一致性。从实践论角度看,范式是指导人们按照事物发展规律进行社会实践的行动纲领,范式一经提出并被广泛接受,就可以起到指引发展道路,凝聚各类社会资源,推动特定领域社会实践的作用。
民族信息学研究目前正处于起步阶段,迫切需要以“范式”的形式从战略层面上建立学科发展的整体框架,民族信息学研究范式的作用主要体现在以下方面:第一,明确学科发展的脉络,构建学科发展的路线图,指引学科未来的发展方向;第二,引导研究人员根据不同发展阶段所面临的特殊矛盾提出科学问题,拓展研究人员研究思路,提升研究人员在学术研究领域的想象力;第三,整合来自技术、政治、管理、法律、文化等领域学者的力量,使跨学科研究能够围绕共同的理论内核进行,保障具有不同背景的研究者所做的研究具有战略一致性。总而言之,民族信息学研究范式在整个学科建设过程中具有非常重要的地位,其学科初建阶段必须高度重视并予以解决的问题。
2012年2月第32卷第2期民族信息学的研究范式与发展方向探析Feb.,2012Vol.32 No.22 民族信息学研究的五大范式
民族信息学是民族学与信息学的交叉学科,同时涉及民族学问题和信息学问题,但是两者参与到新学科当中的方式有所不同:民族学决定学科的研究范畴、主要矛盾和信息需求;信息学决定学科的研究视角、研究方法和技术手段;民族学决定了学科问题研究的必要性,信息学决定了解决学科问题的可行性,虽然也可以认为民族信息学属于民族学研究范畴,但从本质上说,民族信息学是信息学的分支学科。因此,民族信息学研究范式的构建主要以其呈现出的信息学特征进行划分,按照信息学发展阶段建立不同的范式。从不同发展阶段人、信息、技术和环境之间的互动关系所面临核心矛盾的不同,民族信息学可以划分为以下五大范式:
2.1 信息交流范式ICP(Information Communication Paradigm)民族信息学研究的“信息交流范式”是指重点关注传统社会环境下民族地区人口信息交流活动的研究模式。尽管民族信息学研究的重点是信息化环境下的少数民族人口的信息活动,但是信息社会本身是脱胎于传统社会的,是在传统社会的基础上发展和孕育而来的,不可能存在一个完全游离于传统社会的理想化信息社会。因此,民族信息学首先需要关注的是中国少数民族人口信息活动的基本规律,此后才能重点关注信息化条件下的特殊规律。
信息交流范式是整个民族信息学研究的根基,关注民族地区传统社会当中,人、信息和环境的互动关系,涉及的领域非常广泛,从信息学基本要素的角度大致可以分为3种类型的主题:
2.1.1 民族地区信息主体研究
主要研究作为信息主体的民族地区人口的基本情况,例如我国民族地区的地理分布,各少数民族人口的分布,特定民族地区少数民族的种类和人口规模等信息。信息主体研究的重点是少数民族人口,由于目前我国民族地区大多数是多民族交错杂居和国家整体性信息共享需求的存在,与少数民族信息活动相关的汉族人口也是研究的范畴,例如国家民族事务管理相关机构、民族类高等学校、语言文字管理机构当中对少数民族语言信息需求的相关人群也应该纳入研究的范畴。
2.1.2 民族地区信息研究
主要研究传统社会环境下民族地区信息的存在形式和发展概况,例如少数民族传统语言的种类、分布和发展概况,少数民族传统文字的种类、分布和发展概况,少数民族古籍、少数民族档案文献等信息资源的存在情况。信息研究的重点是采用少数民族语言和文字作为记录符号的信息,考虑到多民族之间交互以及少数民族人口与汉族人口信息交互的需要,民族地区国家通用语言的使用、国家通用语言信息资源的状况也在研究的范畴。
2.1.3 民族地区信息环境研究
信息环境主要研究与少数民族信息活动各个环节相关的法律、法规、行政规章,国家颁布的相关技术标准、管理规范等,以及民族地区与少数民族语言文字信息系统应用相关的政治环境、文化环境、基础设施建设程度、经济社会发展水平等内容。
2.1.4 民族地区信息活动研究
主要研究信息在民族地区信息活动的概况和基本规律,主要研究民族地区人口使用少数民族语言文字或国家通用语言文字进行信息交互的情况,例如使用少数民族语言文字传播信息的场合、规范,使用国家通用语言文字传播信息的场合、制度,民族地区少数民族语言文字和国家通用语言文字的双语教育问题、民族地区新闻传播机构的信息传播、少数民族人口跨语言信息交互、跨境少数民族的信息交流等问题。
民族信息学的信息交流范式涉及民族学、语言学、政治学、法学等多个学科的知识,其关注的焦点是信息交流问题,可以引用其它相关学科普遍接受的理论和结论,对与之相关的其它学科的知识在细节上不做深究。民族信息学的信息交流范式为民族信息学构建了基础性的框架,是民族信息学最基本的范式,其它研究范式都是以信息交流范式为基础而构建的。
2.2 信息处理范式IPP(Information Processing Paradigm)
民族信息学的“信息处理范式”是指重点关注民族地区语言文字信息处理技术,为民族地区业务活动提供信息技术支持的研究模式。“信息处理范式”是在“信息交流范式”的基础上考虑了现代信息技术的引入,旨在为在民族地区信息活动当中采用信息技术提供解决的方案。
“信息处理范式”重点关注少数民族语言文字的计算机处理问题,例如各少数民族语种语言文字信息编码标准的制定问题、少数民族语言文字计算机输入问题、少数民族语言文字处理软件的开发问题、少数民族文字的文档排版系统开发问题、少数民族语言文字影视作品编辑系统开发问题、少数民族文字的计算机识别问题、少数民族语言的语音识别问题、少数民族语言文字移动通信设备的开发问题等。此外,由于民族地区少数民族语言文字和国家通用语言文字的共存,同时需要考虑国家通用语言文字的信息编码问题、字处理软件系统开发和各类应用系统开发问题。
“信息处理范式”的核心问题是使主要语种的少数民族语言文字和国家通用语言文字一样可以在计算机上进行处理,重点关注的是技术问题而非管理问题,目的在于提高事务处理效率和信息传播的速度,没有充分意识到少数民族语言信息交流的深层次的信息需求,对于信息辅助完成事务处理以后的管理和开发也交流较少。
2.3 信息管理范式IMP(Information Management Paradigm)民族信息学的“信息管理范式”是指围绕民族地区的信息管理活动,重点关注以信息技术为支撑的信息收集、整理、保存、开发、服务等活动的研究模式。“信息管理范式”与“信息处理范式”都以信息技术为支撑,但是其关注的重点问题存在较大的区别,“信息处理范式”的目标是通过信息技术提高业务活动的效率,“信息管理范式”的目标则是通过信息技术整合和开发社会信息资源。
“信息管理范式”主要研究民族地区信息资源的管理和开发问题,例如民族地区少数民族古籍的收集整理和数字化加工,民族地区电子文件管理和少数民族历史档案的数字化加工、民族地区数字图书馆建设、少数民族语言互联网信息资源的采集与保存体系、民族地区文化信息资源数据库建设、民族地区信息资源跨地区共享体系建设、少数民族语言信息资源长期保存问题等。
同时,“信息管理范式”与“信息处理范式”具有紧密的联系,“信息处理”是“信息管理”源头,只有信息技术在民族地区的广泛使用,才会产生大量的数字信息,信息管理才会有工作的对象;“信息管理”又会反过来为“信息处理”提供支持,通过信息资源的管理和开发更大限度的发挥信息资源的社会价值。“信息处理”与“信息管理”相互配合,共同构成民族地区信息化建设的基础架构,推动民族地区整体上向信息社会迈进。
2.4 信息理解范式IUP(Information Understanding Paradigm)民族信息学的“信息理解范式”是指围绕民族地区多语种信息资源的理解问题,重点关注以信息技术为支撑,打破语言差异带来的信息沟通障碍,实现多民族跨语言信息理解和交互的研究模式。“信息理解范式”是在“信息处理范式”和“信息管理范式”的基础上构建的,旨在满足民族地区信息交流当中的深层次需求,也是民族信息学研究需要重点攻克的问题。“信息理解范式”存在两种表现形式:第一是基于用户理解的“信息理解范式”;第二是基于机器理解的“信息理解范式”。
基于用户理解的“信息理解范式”主要研究应用计算语言学理论,构建以国家通用语言文字为核心的少数民族语言多语种信息资源共享体系。例如少数民族语言语料库的建设问题、多语种少数民族语言语料库的跨地域共享问题、少数民族语言信息资源的双语著录问题、少数民族语言信息资源跨语种信息检索问题、基于语料库的少数民族语言信息资源机器翻译问题、以国家通用语言为中间语言的少数民族语言信息资源跨语种信息交互问题等等。“信息理解范式”最终的目标是要建立国家少数民族语言信息资源共享基础设施平台,为少数民族语言信息资源的理解提供支持。
基于机器理解的“信息理解范式”主要应用语义信息处理技术,使民族地区所产生的信息资源的内容具备被计算机所识别和理解的能力,也就是让计算机部分地具有像人脑一样理解少数民族语言信息资源或者进行多语种信息转换的能力。基于机器理解的“信息理解范式”主要研究的是民族地区语义网络所要关注的知识库构建、信息资源语义标注、语义理解的算法规则等等。
基于用户理解的“信息理解范式”体现了民族信息学的核心理念,即在保持少数民族语言文字多元性的同时,通过信息技术的介入实现多元信息的一体化共享,增强中华民族的凝聚力和向心力,因而也是民族信息学需要重点关注的问题。基于机器理解的“信息理解范式”要以人工智能技术为支撑,是未来信息技术发展的大势所趋,鉴于其技术实现的难度较大,民族信息学研究可以在借鉴相关学科在机器理解领域研究成果的基础上开展相关研究工作。
2.5 信息融合范式IFP(Information Fusion Paradigm)
民族信息学的“信息融合范式”是指重点关注泛在信息环境下,民族地区人口跨地域、跨语言、跨媒体、跨平台的“无缝信息交流”和“无障碍沟通”等问题的研究模式。“信息融合范式”代表了民族信息学研究的最高理想,它是随着人类社会信息化程度的不断提高,人、信息、技术和环境无缝集成而产生的一个高度智能化的社会形态,在这个社会形态下少数民族语言文字的多样性得到很好的保护,各类人群在信息技术的支撑下,可以非常便捷地以熟悉的方式、熟悉的语言和文字进行无障碍沟通。“信息融合范式”的实现要受到人类信息技术发展水平的制约,也要受到民族地区经济社会发展阶段的制约,这无疑将是一个长期的过程。民族信息学“信息融合范式”之前的各个范式所代表的不同发展阶段都是为其实现提供技术和管理知识的积累,都是对“信息融合范式”各类必备条件的进一步完善和细化,当各方面的条件都具备的情况下最终过渡到更高的发展阶段。
综上所述,“信息交流范式”、“信息处理范式”、“信息管理范式”、“信息理解范式”和“信息融合范式”是在分析民族信息学研究整体规律的基础上,对不同发展阶段所面临的特殊性矛盾进行理论概括而得出的结论,梳理出了这一领域发展的大致脉络。任何事物发展都是复杂的,在特定的时间段内,各个范式的区分并非是完全清晰的,可能存在相互交叉、相互渗透的情况,需要结合民族地区信息化建设的实践,有针对性地提出并解决具体的科学问题,逐步推动民族信息学的发展。
3 民族信息学的发展方向
五大范式为民族信息学的发展提供了完整的战略参考体系,是民族信息学当前研究的定位更加清晰,也为民族信息学未来的发展指明了方向:
3.1 民族信息学研究的现状与定位
我国民族地区大都处于边疆地带,气候和自然环境相对恶劣,经济社会发展程度相对滞后,少数民族语言信息资源的数量相对较少,共享程度较低,有关信息资源管理的研究和实践虽然已经起步,却还面临诸多亟待解决的问题。从研究范式视角来看,蒙古文、藏文、哈萨克文、维吾尔文、柯尔克孜文、朝鲜文、壮文、彝文等使用人口较多,影响力较大的少数民族语言文字的信息处理标准都已经颁布,相关的字处理系统和各类应用软件已经开始应用,少数民族语言文字信息处理阶段的主要任务已经完成,对于少数民族语言信息资源的管理问题已经得到学者的关注。此外,由于从信息学视角研究少数民族信息活动的成果相对较少,“信息交流范式”所涉及很多内容的研究目前还非常缺乏,“信息理解范式”当中的机器翻译问题也有部分学者在着手研究,但整体上也是局限于小规模研究。因而,我国的民族信息学研究目前整体上处在由“信息处理范式”向“信息管理范式”的转型阶段;作为民族信息学研究的根基,“信息交流范式”的研究还非常薄弱;“信息理解范式”的研究已经开始,但是其中的全局性、基础性的问题还没有很好的解决,民族信息学未来的研究工作依然是任重而道远。
3.2 民族信息学的发展方向展望
结合民族信息学的研究范式和当前的定位,以下领域应该成为研究的重点:
3.2.1 民族信息学的基础问题研究
按照民族信息学的“信息交流范式”所涉及的范围,加大对民族信息学领域基础性问题的研究力度,重点是收集和分析总结我国民族地区信息资源的语言分布和数量分布,梳理我国少数民族人口、少数民族语言、少数民族文字和少数民族信息活动之间的关系,探索民族地区经济社会发展程度对少数民族人口信息活动的影响,研究少数民族内部、少数民族之间、少数民族与汉族人口之间信息交流的基本规律等;
3.2.2 少数民族语言电子文件文档一体化管理
少数民族语言数字信息的数量相对较少,又是国家保护少数民族文化的证据,应当按照电子文件管理的要求进行文档一体化管理,在业务系统中嵌入电子文件管理需求。其中,少数民族语言电子文件的管理需求需要同时兼顾一般性电子文件管理的各类需求和少数民族语言电子文件管理的集成共享等需求。民族地区业务信息系统文档一体化管理的推进,将对促进民族地区信息管理的规范化起到重要的推动作用;
3.2.3 少数民族语言信息资源集成共享的基础设施平台
少数民族语言信息资源跨语种信息共享涉及多个省区、多个政府部门,按照统一领导、分层负责的模式进行管理具有诸多无法解决的矛盾,可以从国家层面上建立少数民族语言信息资源的分布式共享体系,为少数民族语言信息资源的跨语种共享提供统一的技术支撑;
3.2.4 少数民族语言多媒体信息处理与共享
少数民族语言信息资源包括文本、视频、音频等多种媒体形式,少数民族语言多媒体信息资源的整合共享和跨媒体信息检索等领域目前还有大量亟待解决的问题;
3.2.5 民族地区多语种信息服务的管理规范
针对民族地区网站和各类信息服务系统的多语言信息服务问题,制定相应的管理规范和业务标准,促进多语言信息服务的规范化,保障多语言信息服务的质量。
4 研究结论
民族信息学(Ethno-informatics)是探索信息化条件下中国少数民族地区信息活动和信息现象基本规律的科学领域,研究范式的在学科建设当中具有非常重要的地位。从人、信息、技术和环境之间的互动关系所面临核心矛盾的不同,民族信息学可以划分为“信息交流范式”、“信息处理范式”、“信息管理范式”、“信息理解范式”和“信息融合范式”。目前,我国的民族信息学研究整体上处于由“信息处理范式”向“信息管理范式”的转型阶段,未来需要重点关注学科的基础性问题、少数民族语言电子文件文档一体化管理、少数民族语言信息资源集成共享的基础设施平台、少数民族语言多媒体信息处理与共享、民族地区多语种信息服务的管理规范等问题的研究。
参考文献
[1]闫慧.社群信息学:一个值得关注的新兴领域[J].图书情报工作,2010,(4):53-55,99.
[2]费孝通.中华民族多元一体格局[M].北京:中央民族学院出版社,1989.
[3]李国秋,吕斌.经济信息学的研究范式及方法体系[J].情報科学,2005,(1):22-25.
[4]孙凤美.基于ISO10646的中国少数民族文字排版技术研究[J].科技与出版杂志,2007,(3).
[5]赵生辉.中国少数民族语言电子文件的信息编码标准研究[J].云南档案,2011,(9):25-27.
[6]华林.论少数民族文字历史档案的数字化技术保护[J].档案学研究,2006,132(2):36-39.
[7]赵生辉.中国少数民族语言数字信息分布式共享研究[J].情报资料工作,2011,(3).
[8]邵佩英.分布式数据库系统及其应用[M].北京:科学出版社,2006:22-26.