信息化与汉字传承【论信息化社会汉字的改革方向】

时间:2023-01-12 08:09:35 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
《信息化与汉字传承【论信息化社会汉字的改革方向】

















:在信息化时代,汉字的学习、

中文信息处理方面,与字母文字相比,汉字学习难度大,输入计算机慢,字符长,容量大,不能进行高层次的词处理、句处理等,已经成为中文信息处理一个‘瓶颈’。所以汉字应顺应时代的要求,迫切需要进行一次深刻的变革。拼音文字在中文信息处理方面比汉字具有无可比拟的优越性,汉字的改革应变能力朝拼音文字方向发展。 关键词:信息时代;汉字学习;汉字改革;拼音文 汉字是中国的法定文学,从成熟的甲骨文算起,至今已有五、六午年的历史。它经历了甲骨文――金文――小篆――隶书――楷书――草书――行书――简化字等阶段的变革。承载着中国五千年的历史文化,贡献巨大。然而在信息化时代,汉字的学习、中文信息处理方面,与字母文字相比,字学习难度大,输入计算机慢,字符长,容量大,不能进行高层次的词处理、句处理等,已经成为一个‘瓶颈’,成为计算机产业的一个难关,给技术应用增加许多麻烦,也拖了中国信息产业的后腿,所以汉字应顺应时代的要求,迫切需要进行一次深刻的变革。 一、汉字在中文信息处理中出现的问题 二十世纪八十年代,汉字进入了计算机、计算机输出了汉字,可以说是我国取得的一项重大科技成果,但问题也很多,主要在以下几面: 1、文字的键盘输入需要编,速度慢,费脑费时。如拆字编码,将汉字字形分解为笔画或部件,在此基础上按形取码,以一定的顺序输计算机,典型代表是王永民的“五笔字型”。这种编码适合专业打字员、年轻人、不会汉语音拼音的,不适合普通人、中老年人,会汉语拼音的人。 2、汉字的机内码比字母多一个字节,需要内部码和交换码。字母在计算机里可用一字节就能显示,而汉字要占两个字节,积要比字母文字庞大得多;英文的代码不存在“内部码”和“交换码”的问题,因为英文字符的内部是统一的,可以直接使用内部码进行信息交换,所以内部码与交换码是一回事;英文才有94个代码,而汉字有676个交换码和682个非汉字图形符号,增加了研究人员额外的时间、精力和财物上的付出。 3、中文电脑要有比西文电脑大得多的容量。中国科学院声学研究所陈明远先生说:“方块字所需的信息位数,是汉语拼音文字所需信息的10倍到50倍!” 4、目前计算机未能解决汉字词处理、句处理。计算机虽然初步解决了汉字的输入、存储、编辑、输出等问题,但对高一级的文字处理如词的切分、句的处理、篇的处理等却爱莫能助,“词”的切分20年前就成并且现在依然是中文信息处理的“瓶颈”问题,这个问题不解决,就会使中国的信息产业停滞不前。 二、拼音文字的优越性 不少语言学家都倾向于汉字拼音化。如吕叔湘先生说:“四个现代化的关键是科学技术现代化。要实现科学技术现代化,先得让文字现现代化,也就是得让汉语拼音化,不能让汉字拖了四个现代化的后腿”。陈明永先


生预言:“历史将证明:电子计算机是方块汉字的掘墓人,也是汉语拼音文字的助产士。”还有王力、周有光、王凤阳、王开扬等都认为拼音文字在信息化时代比汉字更具优越性,主要理由如: 1、汉语拼音文字比汉字易认。 拼音文字的字形和词义之间没有直接联系,但形体和字音之间却有自然的,必然的、规律性的联系,掌握了几十个字母及其拼写规则,则看见字型就能读出词音;拼音文字书写的如果是母语,那么读出词音就得到了词义,传递信息要比汉字全面、确切得多。 2、汉语拼音文字比汉字易写。 拼音文字的字无论由多少字母组成,一律按发音顺序从左至右呈线性排列;汉字是上下左右中呈面型排列,结构复杂,形近字多,要花很多时间与精力才能记住,不易教学。 3、汉语拼音文本比汉字文体更具优越性。 目前的汉语文本以一个个汉字为书写单位,书面上“字”的单位与汉语的“词”单位不一致,给人脑和电脑的理解带来困难。信息界用了多年的努力,到目前仍然无法彻底解决。正在探索的汉语拼音文本主要有两种:一种是“纯拼音词式书写”文本,另一种是“词式拼音夹用汉字”文本。 “纯拼音词式书写”文体优越性有: (1)词语单位定型化; (2)能够还原方块汉字对汉语的某些失真,如能够区分同形异音词、轻声和儿化等; (3)能消除专有名词歧义; (4)能消除部分语法歧义; (5)能减少机器内存,使中文信息处理可以同英文信息处理相媲美。 但也有其缺陷,主要表现为: (1)方言的干扰。汉语拼音文本只能在普通话水平高的人群使用,不能在全社会使用,使用的范围只能随着普通活的普及而逐步扩大。 (2)聚合关系上的混淆。“汉语拼音词式书写”在组合上有很大的优越性,但是在聚合关系上却存在着同音混淆的毛病。 (3)应用范围的矛盾。如汉语拼音文本的使用范围随着普通话的普及逐步扩大,那所有汉语文都用两种文本来制作,势必造成浪费;如计算机中的汉语拼音文本和方块汉字的纸质文本要转换,那势必还是要带来浪费。 (4)人们的学习难度并未降低。如要转换,人们还要学汉字,机器还要处理汉字,结果是两个难度一个也没降低。 根据“纯拼音词式书写”文本的缺陷,语言学家们又提出了一个新的可行方案,即“拼音夹汉字”文本,也叫“基础华文”,其含义是“千字文+拼音”――限用一千个汉字,超出部分用拼音代替,或者对“超限文字”注明拼音,再加解释说明。其优越性为: (1)可以消除组合关系的歧义。 (2)可以区分聚合关系的歧义。纯拼音文本在聚合关系上的混淆,可以让限用的一千个汉字来发挥区别作用:一千个汉字主要用来书写单音节词,因为单音节词同音率高,而且不容易分化。 (3)最适合中文信息处理。这个方案将给计算机处理汉语书面语带来极大的方便:在复音词的处理上,又利用拼音连写排除了组合关系的歧义切分;在单音词的处理上,又利用汉字排除了聚合关系上的同音混淆。这样就突破了中文信息处理的“瓶颈”,可以顺利进行词性标注、句法分析、语义分析,走上智能化的康庄大道。 (4)“拼音夹汉字”文本是“一文两字”。“一文”指的是“中文”,“两字”是方块字和拼音字。“拼音夹汉字”熔二者于一炉,因此只要出版一个文本,不存在“小范围的人群”和“全社


本文来源:https://www.wddqw.com/doc/4c404d56beeb19e8b8f67c1cfad6195f302be836.html