汉字表音化的系统论思想

2013-04-29 00:44陈耀西陈红根
现代语文 2013年6期
关键词:系统论

陈耀西 陈红根

摘 要:本文以系统论思想论述了汉字的“二维结构”规律,揭示了传统汉字理论被掩盖的“音、形、义”关系,从而实现了汉字的表音化。

关键词:系统论 二维结构 表意汉字 表音汉字

文字是信息的信源,让计算机识别汉字,事关中国人独立自主走信息化道路的根本问题。要让计算机识别汉字,汉字必须走表音化的道路。而汉字的“音、形、义”系统论思想,则是打开汉字表音化之门的钥匙。但是,传统的汉字理论掩盖了汉字的字与字之间的“二维结构”规律,致使汉字近两千年来未能走上表音化的道路。

一、被掩盖的汉字“二维结构”规律

近年来,由于遵循了汉字的“音、形、义”系统论思想,在国家推行的注音字的基础上,用加缀法,以一个表意汉字复制一个表音汉字,从而顺利地实现了汉字表音化。

例如,在北京举办奥运会的印章标志上,以汉语注音“Bei jing”代表“北京”。但是,读“bei”的有41个汉字,读“jing”的有78个汉字。分别列举如下:

1.(bei)北 邶 苝 軰 鉳

2.(bei)备 惫 鞴 俻 偹 備 僃 憊 犕 糒

3.(bei)背 褙 偝 揹 禙 鄁

4.(bei)卑 碑 俾 埤 椑 痺 萆 諀 錍 鹎

5.(bei)贝 狈 钡 呗 垻 梖 狽 珼 蛽 鋇

以及:

1.(jing)京 倞 惊 婛 猄 鯨 鶁 麖 鲸

2.(jing)敬 警 儆 憼 擏 曔 檠 璥 蟼 驚

3.(jing)景 憬 幜 暻 燝 璟

4.(jing)晶 橸

5.(jing)井 肼 阱 坓 宑 汫 汬 穽 妌

6.(jing)竟 镜 境 獍 傹 璄 鏡

7.(jing)巠 经 径 颈 茎 劲 痉 弪 刭 胫 迳 泾 俓 剄 勁 弳 徑 桱 涇 烃 烴 痙

経 經 脛 莖 葝 踁 逕 鋞 陉 陘 頚 頸 鵛

所以说“Bei jing”只是一个注音符号,根本不能代表“北京”。可是,在分析上述“北京”的注音符号“Bei”和“jing”的同音字系列之后,人们不难发现:汉字信息可用二维数组A(m,n)来表示:

A1.1,A1.2,A1.3,A1.4,……A1.n,

A2.1,A2.2,A2.3,A2.4,……A2.n,

A3.1,A3.2,A3.3,A3.4,……A3.n,

A4.1,A4.2,A4.3,A4.4,……A4.n,

…………………………………………

Am.1,Am.2,Am.3,Am.4,……Am.n,

(一)同音基本字的列变是基本字的部首(前缀)变化

每一行的黑体字都是基本字,读“bei”的基本字为“北、备、背、卑、贝”;读“jing”的基本字为“京、敬、景、晶、井、竟、巠”。在基本字后面的都是该基本字的不同部首的同音字。例如“(bei)北 邶 苝 軰 鉳”和“(jing)京 倞 惊 婛 猄 鯨 鶁 麖 鲸”。也就是说,同音基本字的列变是通过部首变化来实现的,部首不参与读音,是示意的加缀作用,由于它在字中的位置居前,所以称为部首或前缀。由此可以看出:汉字的形声字是加缀字。其实作为部首的“金、木、水、火、土”等也是基本字,只是作为部首时,有的字已经符号化了,例如:“水”符号化为“氵”,“金”符号化为“钅”等。

(二)同音基本字的行变是基本字的变化

上述“bei”和“jing”就是两个音素,读“bei”的基本字“北、备、背、卑、贝”有5个;读“jing”的基本字“京、敬、景、晶、井、竟、巠”有7个。有的同音基本字较多,但是,一般不超过25个基本字。

在甲骨文字里,形声字只占20%,到东汉许慎的《说文解字》里,形声字所占比例达到82%,到清代康熙年间编纂的《康熙字典》,形声字已占90%。而非形声字,主要为图像文字的象形、指事、会意字,它们大都为基本字。例如“北、京”两个基本字,“北”是会意字,“京”是象形字。如果将基本字包括在形声字系统中。那么,整个汉字就形成一个以基本字为核心的形声字矩阵,每个汉字都有自己的坐标位置。在汉字的416个读音中,几乎每一个读音都有同音字,这是一个普遍现象。所以说:整个汉字体系是二维结构体系。

因此,对汉字体系的二维结构规律,可用公式表示如下:

H=A(m,n)

公式中的“H”代表汉字体系,A(m,n)为二维数组。

二、汉字“二维结构”规律是如何被掩盖的

“高等教育面向21世纪课程教材”《现代汉语文字学》中指出:“语言里的词是‘声音+意义的结合体,选择一个同音或近音的字作声旁,再配上一个合适的形旁,就可以造出一个新字来,方法很简单。”这段文字中,“选择一个同音或近音的字作声旁”的“字”就是基本字,“再配上一个合适的形旁”指的是“部首”。传统的汉字理论都将基本字叫“声旁”,都将部首叫“形旁”。这样定义,混淆了汉字的“音、形、义”关系,割裂了汉字“音、形、义”的内在联系。

(一)“部首”参与形声字构字的功能是部分功能

“部首”只具有符号意义,是表意的符号;它本来也是字,但不表示音,是字的加缀部分;很多“部首”已经符号化了,如“水”符号化为“氵”,“金” 符号化为“钅”,“形”在退化;因此,“部首”不再具备“字”的“音、形、义”的完备功能。

而更重要的是:当我们将同音字并列时。例如:

1.(gao)高 篙 镐 禞 蒿 搞 缟 槁 稿 暠 膏

2.(gao)告 筶 锆 祰 郜 诰 勂 峼 浩

3.(gao)羔 糕 餻

4.(gao)皋(臯)槔(橰)滜 獋 韟 鷎(鷱)

5.(gao)睪 睾

6.(gao)杲 菒

大家知道,系统的要素特征是:必须具有变化的特性。“义变”是“部首”在变化,是汉字的横向变化,或称“列变”。而基本字就是同一个基本字,它是不变的,故“形”不变,“音”也不变。所以,“部首”的变化不能称“形变”,因而不能将“义旁”叫“形旁”。从《说文》以降,几千年以来,一直将“义旁”叫“形旁”,即部首既是“义变”又是“形变”,身兼两职,其实是重复的,说的是一回事。是通过“部首”符号变化而实现意义变化。当称为“义旁”之后,不能再称为“形旁”。

(二)基本字参与形声字构字的功能是完备功能

基本字参与形声字构字的功能是完备功能,即具有“音、形、义”三要素的全部功能。

1.系列字“(hev)合、(yphev)郃、(slhev)饸、(mbhev)盒、(ywhev)颌”。其中,基本字“(hev)合”,后缀为“v”说明为动词。参与形声字构字时:

(1)从“音”来说,是由“(hev)合”而得“音”;

(2)从“义”来说,它们所记录的词都有“合”的含意。例如,“(yphev)郃”,地名:郃阳,因地处郃水以北而得名;“(slhev)饸”,一种条状食品;“(mbhev)盒”,底、盖相合的盛物的器具;“(ywhev)颌”,口腔的上、下两部为颌,上部为上颌,下部为下颌。“合”之表意非常明显,形声字的含义,都由基本字赋予。或者说:形声字将基本字的信息带到“部首”所分类的各个门类,去表达哪个门类的事物,从而扩大文字表达事物的能力,所以形声字是发展了基本字。基本字与形声字的关系是共性与个性的关系,是由“一般”深入、渗透到其他门类(“个别”)去表达事物。

(3)从形体来说,在构字时,布局所占面积的比例大,这是汉字书法的基本规律。

所以,基本字“合”在形声字构字时,应占主导地位。不应将次要部分的“部首”称“形旁”“形符”。

2.系列字“(jianz)戋(小,少)、(shjianz)浅、(zhjianz)笺、(bkjianz)賎、(dqjianz)残、(jjianz)銭”。其中,基本字:“(jianz)戋”,后缀为“z”说明为形容词。参与形声字构字时:

(1)从“音”来说,是由“(jianz)戋”而得“音”;

(2)从“义”来说,它们所记录的词都有“小,少”的含义。例如,“浅(淺)”:水少;“笺”:短信件;“賎”:贝小也;“残”:餐之剩也;“銭”:金之小者。“戋”之表意非常明显,形声字的含义,都由基本字赋予。“部首”只起分类的作用。

(3)从形体来说,在构字时,布局所占面积的比例大。

把参与形声字构字的基本字叫“声旁”,显然丢掉了“形、义”要素。基本字参与形声字构字是一个整体,既然是整体,就包含“音、形、义”三要素。它不是一个“旁”,而是一个“字”。它坐在“正位”,不是“偏旁”;也不是一个“符”,它没有定义为“符”号,不是部首意义的“符”号,不能称“符”。

前文已经说过:从《说文》以降,几千年以来,将基本字在形声字中只称“声旁”。但是,音有同异之别,在上述读“gao”音的基本字系列中:“高、告、羔、皋、睪、杲”诸字是同音字,没有“音变”,只有“形变”;汉字的这种纵向变化,或称“行变”。“行变”时,“意”也没有变。“篙、筶”“镐、锆”“禞、祰”“浩、滜”等“部首”相同,作为“部首”表意的核心——“类别”并未变。故说“部首”未变,所以也就没有“义变”。故汉字的纵向变化才是“形变”。“形变”时,“义”不变,“音”也不变。不能随便称“声旁”,因为这组字都是同音字,读音并没有变化。

因此,汉字的“义变”是横向变化;汉字的“形变”是纵向变化。汉字的“义变”和“形变”组成同音字平面,称为音素面。例如,本例中,在汉字读“gao”音的平面称“gao”音素面;读“bei”音的平面称“bei”音素面。汉字共有416个音素面。音素面的变化才能称为“音变”,“音变”体现在音素面的垂直线上。所以汉字的“音、形、义”系统是一个立体结构。

汉字的“义变”和“形变”是一个发展阶段,《说文》以降,近两千年以来,汉字研究者误将“义旁”当作“形旁”,不加区别的叫“声旁”,掩盖了汉字的“二维结构”规律,以致在汉字发展的第二阶段——拼音阶段,裹足不前。这个影响何其大耶?又何其悲耶?

三、汉字的“二维结构”与汉字注音相结合

当发现汉字的二维模式后,在汉字注音基础上,将“二维结构”与汉字注音相结合,就可以实现汉字表音化。

(一)对汉字的纵向变化,用加后缀的方法将同音基本字表音化

汉字是单音节字,由23个声母、24个韵母相拼,只有416个音素字。以数学的观点来说,单音节字相当于两个数字的排列组合,即A和B的全排列:AA、AB、BA、BB四种情况。现以A代表韵母,以B代表声母,那么,BA情况为声母、韵母拼音,这类情况符合拼音规律;AA情况为韵母与韵母在一起,可以发音(如:“见jian”中的“i”和“an”);BB情况为声母与声母在一起,不能拼音;AB情况为声母在韵母后,也不能拼音。但是,BB、AB这两类情况可以利用,作为同音字的前缀和后缀,以解决同音字的信息差异问题。

将读“bei”的基本字加一个信息差异,即为“(bei)北、(beiv)备、(beir)背、(beix)卑、(beib)贝”,就将其区分开来。同样,将读“jing”的基本字也加一个信息差异,即为“(jing)京、(jingv)敬、(jingr)景、(jingx)晶、(jingb)井、(jingd)竟、(jingp)巠”。因为加信息差异就将同音基本字区分开来,所以处于第一行第一列的“(bei)北”和“(jing)京”都不需加后缀,这就将北京举办奥运会的印章标志表音化了。

对于庞大的汉字体系来说,汉字读音只有416个,其余的字,则是这416个读音的重复循环。每循环一次,读音没有变化,通过字形变化来表达不同的含义,所以汉字多同音字。如果我们将汉字字形的变化看作是符号的变化,我们将打开一条新思路:每循环一次,改变一个信息,如果这个信息是有规律的,那么拼音汉字就是有规律的。这就可以将表意汉字转换成表音汉字。

1.将常用基本字放在音素字系列为第一循环,不加后缀,使拼音字使用简单方便。例如“中华人民共和国:Zhong hua ren min gong he guo”“北京:bei jing”等。

2.为了使表音汉字具有语法特性,将词性引入拼音系统中。为此,将动词基本字放在第二循环,加后缀v;将有生命的名词基本字放在第三循环,加后缀r;将形容词基本字放在第四循环,加后缀x。如此进行下去,直将23个声母字用完。由于“v”在汉字注音中被保留,我们将其作为隔音符使用。将“v”加在动词基本字后面,作为第二循环与其它循环相区别的信息。这样一来,我们将获得25个循环。在归并同音基本字以后,我们发现同音基本字超过25个的极少。

3.每四个循环为一组,可达六组。到第七组时系列基本字就很少了,则可配双声母字做后缀,配到第七组后,就可以停止。

4.后缀表如下:

将词性引入表音汉字,这将为汉语语法带来重大影响,因为从汉字字形上看不出词性。

(二)对汉字的横向变化,用加前缀代替部首将其表音化

汉字的形声字由两部分组成,即由基本字与部首组成。其实,作为部首的“金、木、水、火、土”等也是基本字,只是作为部首时,有的字已经符号化了,例如:“水”符号化为“氵”,“金” 符号化为“钅”等。在将汉字表音化时,对基本字“水”的注音字“shui”,作部首时以“sh”代表;对基本字“金”的注音字“jin”, 作部首时以“j”代表。其中:“zh、ch、sh”因为双声母字,所以单声母字作部首的将是下列20个部首:(b)疒、(p)丿(撇)、(m)木、(f)阝(阜),(d)刀、(t)土、(n)女、(l)力、(g)戈、(k)口、(h)火、(j)金、(q)犬、(x)心、(r)人、(z)足、(c)草,(s)糹、(y)言、(w)王。对于“(zh)竹、(ch)虫、(sh)水”及部首为两个声母字的“(nr)牜、(gr)瓜、(cv)辶、(rb)日”等。其中,因“牛”的基本字在字母化時为(nuir),将其缩写为(nr),以其代表“牛”的部首。以这种缩写法,可将其余作部首的基本字全部转化为表音化的部首。故下面的部首表音化为:

1.(bei)北(ypbei)邶(cbei)苝(cbbei)軰(jbei)鉳

2.(beiv)备 惫 鞴 俻 偹 備 僃 憊 犕 糒

3.(beir)背 褙 偝 揹 禙 鄁

4.(beix)卑 碑 俾 埤 椑 痺 萆 諀 錍 鹎

5.(beib)贝 狈 钡 呗 垻 梖 狽 珼 蛽 鋇

以及:

1.(jing)京(rjing)倞 (xjing)惊 (njing)婛 (qjing)猄 (ykjing)鯨 (nkjing)鶁 (lrjing)麖(ykjing)鲸

2.(jingv)敬 警 儆 憼 擏 曔 檠 璥 蟼 驚

3.(jingr)景 (xjingr)憬 (jmjingr)幜(rbjingr)暻 (hjingr)燝 (wjingr)璟

4.(jingx)晶 橸

5.(jingb)井 肼 阱 坓 宑 汫 汬 穽 妌

6.(jingd)竟 镜 境 獍 傹 璄 鏡

7.(jingp)巠 经 径 颈 茎 劲 痉 弪 刭

胫 迳 泾 俓 剄 勁 弳 徑 桱 涇 烃 烴 痙 経 經 脛 莖 葝 踁 逕 鋞 陉 陘 頚 頸 鵛

从上例可以看出:

1.常用字(第一循环)不加缀;基本字加后缀,基本字大多是象形字、指事字、会意字;常用字的形声字加前缀,没有后缀;形声字既有前缀,也有后缀。所以说拼音汉字简单。前缀和后缀不参与拼音,这在外语中是常见的现象。

2.对于以“a、e、o”单独注音的注音字,在实现“音、义、形”集成的汉语拼音文字时,在加部首前,先加隔音符“v”,再加部首。例如“(an)安、(mvan)桉、(jvan)铵、(rvan)侒、(kvan)咹、(tvan)垵、(?van)洝、(cvan)荌”等。

3.根据《新华字典》,常用的汉字有203个部首,《说文解字》中有500个部首,按排列组合计算:23个声母应当为:23*25=575。因此,将部首符号化,完全能满足汉字部首的数量要求。

4.在归并同音基本字过程中,可以看出:简化汉字和繁体字在汉语拼音字中没有区别。这给汉字省去了很多麻烦。

5.为了使表音化工作具有坚实的基础,我们选用国家标准GB18030-2000汉字库作为平台。因为GB18030汉字库收录了27484个汉字,它是为汉字研究、古籍整理等领域提供的统一的信息平台,所以,能满足一般的应用所需。

(三)辨别多音字,以两个声母字作后缀将多音字表音化

汉字不仅同音字多,而且有大量的多音字。例如第三循环的“(pir)皮”:

1.(pir)皮、(fpir)陂、(bpir)疲、(jpir)铍、(xpir)怶、(pir)蚾、(jpir)鈹、(tpir)坡、(zpir)跛、(mrpir)駊;

2.(fbipr)陂、(rbipr)佊、(xbipr)怶、(mbipr)柀、(?bipr)波、(sbipr)紴、(ybipr)詖、(ybipr)诐、(zbipr)跛;

3.(tpopr)坡、(fpopr)陂、(zpopr)跛、(mrpopr)駊;

4.(wbopr)玻、(zbopr)跛、(sbopr)紴、(?bopr)蚾。

为此,在“皮”字的系列字中,必须增加信息,以示基本字“皮”读音的变化。其中,有基本字“皮”的第一列称为正列;其他的二、三、四列称为奇列。如果以选配部首的方法来选配奇列的后缀。这样,既可保证不重码,又可保证以基本字为核心的规律。

“皮”字的表音字是(pir),去掉韵母(i),保留声母(pr)做为奇列字的后缀。这样做的好处是,一来可将奇正两列区分开,二是(pr)为(pir)的简化,有利于联想到(pir),这种用正列基本字(pir)的简化(pr)作为奇列字后缀的方法,就是奇列基本字的后缀。

四、结语

在当今信息时代,计算机可以说是无孔不入,中国正在走向全民使用计算机的时代,这是汉字应用史上的一次重大转折。

中国语文现代化学会第5次学术会议于2002年10月12到15日在河南省开封市召开,会议发表的《汉语现代化中国语文现代化学会第5次学术会议综述》中说:“事实上,用拼音给汉字注音,用拼音汉语用于汉字不方便使用的领域,已经在逐渐走拼音化道路。世界文字发展的许多事实证明,确实存在表音化方向。今后如果社会迫切需要,谁也阻拦不住拼音文字。”

在当今信息社会里,计算机硬件的核心是芯片;计算机软件的核心就是计算机语言。我国为计算机硬件投入了巨大的人力、物力和财力,终于在国际上占有一席之地。但在软件领域,别人出版一个新操作系统,你就得跟着换装,总是跟在别人的后面转,处于非常被动的地位。这对于一个拥有13亿人口的大国来说,是不能容忍的。在软件领域,我们应该像硬件领域一样,两手都要硬。

但是,在软件领域我们硬不起来的原因,就是中文不是拼音文字。现在,有了表音汉字,可以用表音字设计计算机语言,设计中文计算机软件,设计中文编译器。这样汉字就能进入计算机的核心——中央处理机,全面掌控计算机,这是何等的重要!

语言学是领先的科学,只有语言学的进展才能带动其他学科的进展。语言是人们交际时的公共平台。

参考文献:

[1]中国语文现代化学会第5次学术会议,汉语现代化中国语文现代

化学会第5次学术会议综述[Z].开封,2002.

[2]殷寄明,汪如东.现代汉语文字学[M].上海:复旦大学出版社,

2007.

(陈耀西 河南郑州 解放军信息工程大学测绘学院 450052;陈红根 郑州 河南职业技术学院 450046)

猜你喜欢
系统论
基于系统论的产品低碳设计质性研究
新兴权利保护中利益合法性判定的动态系统论
基于系统论SPO模型的导管相关血流感染干预实践
系统论视野下高校教师党支部发挥作用的机制与平台
系统论视域下中国文化的断裂与重建
多元系统论视角下文学翻译的策略
2016年第20届系统论,控制和计算国际会议
系统论在故障定位中的应用
数字电视经营系统论
系统论在中医理论与临床辨证中的运用