建立保存人类书写记忆的文本库:头条焦点

来源:光明网-《光明日报》     时间:2023-02-12 06:09:30

建立保存人类书写记忆的文本库

——访华东师范大学中国文字研究与应用中心教授臧克和


(资料图)

光明日报记者 柴如瑾

历时数十年,由华东师范大学中国文字研究与应用中心组织编写的《汉字结构认知大字典》(以下简称“字典”)终于与读者见面。这是一部反映当代汉字学研究成果、兼顾实用的大型汉字文化工具书,旨在对通用规范汉字形、义、用的历史演变进行描写和分析,揭示汉字的结构规律和文化内涵。围绕字典的编撰特点、学术价值以及汉字的结构源流与发展演进等话题,记者专访了字典主编、华东师范大学中国文字研究与应用中心臧克和教授。

记者:相较于同类汉字工具书,这本字典在编纂体例和汉字结构分析方面有哪些特点?

臧克和:文字学科建设大体有两方面的课题:一个是调查整理,加以规范;一个是采集知识,加以释读。前者属于汉字标准化工作,以维持符号体系的有效使用;后者属于汉字发展史工作,使文明记忆世代传承而不至中断失落。

一种语言文字工具书,基本编写体例取决于功能定位的设计理念。这套文字学科建设专书最基本的特色或关键词可以说是“结构认知”。汉字结构体系历经数千年而没有中断,相对于世界范围的各类文字体系而言,算得上是独一无二的存在形态。汉字基本构造元素为“依类象形”的“类符”。相对于西方一直沿用的线性视觉字符,汉字体系的使用者所形成的视觉思维方式,是一种无处不在的“类比认知结构”。

具体而言,所呈现汉字认知结构具有以下特色:结构分析强调结构视觉认知的整体性,形符与声符的互为依待关系,观测描写各个阶段的历史汉字结构性流变与转换,将静态的汉字结构、古今异体,置于动态的历史发展过程和实际使用过程中考察分析。凡此种种,架构联系线索,尝试使其成为提高思维效率的汉字认知“倍增器”。

记者:字典中依次序排比出了各个时期具有代表性的实际使用字形。请问这种对汉字字形演变历时链条的编列有何意义?

臧克和:根据“汉字断代调查与汉字发展史”“中古汉字流变”“量化中国文字发展史”等课题开展和字典研制中的调查统计发现,以往的历史字汇展开的体系,限于历史平台条件,既不能这样复综,也就基本不成系统。就书体类型而言,我们的调查统计,涉及篆书、隶书、行书、草书、楷书类型,其中草书及其演变历史基本没有进入视野。其实,汉代简牍文字已有成熟草书。我一向认为,草书带来的书体形态学上的影响,堪比第一次“隶变”解体,故称之为“第二次解体”。今文字体系中有大量简体,如果缺少对草书带来“二次解体”的调查分析,基本上就等于中断了繁体、简体等结构转换的联系。古今汉字的单位历史考察,具有侧重两端、忽略大段中间过渡环节的倾向。比如,所谓“异体字”乃至“疑难字”等类型的调查数据,基本统计对象集中于一头一尾,即由起始的字形直接到流变结果的固定结构。实际上,海量汉字的使用存在于中间阶段,中间产生大量过渡形态。这些过渡性形体,对于保存人类书写记忆往往具有无法替代的“中介”意义。

下大力气排比各个时期的字形关联,目标就是为了重建已经潜隐、中断或失落的形义联系线索。考察过渡形中介环节可以实现将被固定为静态的字形,置于动态的使用历史过程中进行考察,为文字的理解提供前所未有的可能性,从而使复杂字际关系定义、各种所谓疑难字的辨识,不啻恢复业已失落的联系环节,重建丰富的认识线索。由此可见,汉字过渡性或曰中介性形体,对于拓展汉字发展认知渠道具有不可多得的价值。过渡性形体调查过程,遵循“原形→过渡形(过渡Ⅰ-过渡Ⅱ-过渡Ⅲ…)→定形”的整理模式,由此构成文字资源统计、文字规范标准研制,乃至海量数据加工、考察字形取舍的关键环节。

例如,人们喜欢援引“爱”字结构来诟病由繁体到简体、心符失落的问题。按字典的字形序列,战国早期中山王墓壶铭“慈愛”一词,用“(见图1)”字来记录;战国楚简、秦汉简文等,大都写作“(见图1)”(也使用由既、心组合结构,既、旡作为声符的功能是相同的),到北魏神龟二年寇凭墓志、隋代萧玚墓志等石刻文字中,已经使用将中间“心”符省写的结构。如此看来,不能通观完整发展脉络,单从某个时间层次楷化结果来批评简化者,又失之简单化。

二月四日,小朋友在中国文字博物馆里体验汉字民俗庆元宵。新华社发

图1

记者:汉字字义和结构与该字的文化内涵有何关联?

臧克和:汉字结构与汉字书写体系所负载的文化属性,构成汉字的文化认知结构。传统悠久的“假字解经”“以字证史”,不啻标明汉字体系成为“国学”的根基。汉字结构方式积淀而体现为中国古代人的类比认知模式。汉字表征的中华认知结构,以形表意,以类相成,首先体现为汉字体系的分类——根据文字所表征事物的外延范围,分为系列意识观念结构类别,每个类别也就是“取类”——所取为类属,而不复是具体形态单位。“汉字文化圈”的若干学科,也往往把汉字体系作为构建中国上古三代以来的认知结构和观念系统的基础之一。像最早的古文字字典《说文解字》,集合了上万古汉字篆书结构单位,百科全书式地呈现了先民对于自然与人本的“心性之结习成见”。通过体察认识,分类型分层级,系统演绎了最为丰富的汉字认知模式。

汉字考证索解历程标明,经由古汉字结构的内在联系,可以发掘提取民族固有的纯粹鲜明的意识观念范畴,可以溯源明流、观测动态,从汉字体系发展过程中采集知识——构成中华认知结构意识资源库。

记者:在建构有关汉字源流及汉字结构的理论体系方面,字典有哪些价值?

臧克和:实在还说不上什么“体系”。古人说法,有道是“色外无空”。所谓“空白”,原本不空;所要填补的,其实就在那里面。

第一,科学认识汉字结构属性及其定义逻辑。汉字主体是由类符、借用类符作为音符,按一定方式合成结构,体现汉语语素的视觉书写符号体系。这个定义规定了在汉字结构认知中,字符分类分层的依据,即汉语语素单位对汉字字符分类的规定性约束机制,从而有效避免了简单进行字符分类、汉字文化阐释所带来的随意性。

第二,汉字结构体系上具有历时属性。今天我们面对的所有汉字字集,本身都是一个包含不同发展阶段的杂糅系统。还原当时字样标准所适用的社会环境,重建变异字形的中介联系,关注历史的发展层次及量化关系。结构表意示音模式也在转换,像字符集《舟部》船-舩-舡异体之间,属于不同时期变异过渡乃至误读替换的结构。从船到舩,以秦汉简“[~符号~]”符隶变书写为过渡,北朝到唐代石刻楷化定形为“公”符结构。

第三,“异体字”是“过渡性”结构链条的一个环节。不同时代所面对的字形都是历史积累的结果,体现着若干历时层次。要进行历史汉字规范标准化调查整理,才有必要援引“异体字”这类术语。历时的调查整理其实是件很困难的事情:隶变过程,草书流行过程,中间产生的海量形体,属于“过渡性”形体书写。形形色色的异体字,就是“过渡性”形体的阶段性结果。

第四,明确的意义存在于结构整体联系当中。汉字结构整体到结构成分,成分与成分之间,区别对立,相互依待。结构成分的作用,有待于结构整体的规定。结构意义,若不能纳入统一的文本结构对照就难以准确理解。恢复建立各种结构单元之间固有的认知渠道,从而提高汉字认知效率、社会使用的思维效率,成为汉字学习乃至全球传播的“汉字认知器”。

第五,“假借”关系类型的理解往往存在“时代错位”。深入调查会经常看到,一些调查标注出土文献所谓“通假字”,往往是跟后世文字体系对比甚至是以今律古的结果。就像“霹雳”字,《史记·天官书》写作“辟歷”(《会注本》),历代注本标注西汉《史记》书写过程中以“辟歷”通假“霹雳”,那便是后世注本的理解,并不符合汉代书写文字体系的实际。检《大字典·雨部》可知,“霹雳”字汉代文字体系尚未见记录。实际使用,最早不过隋代刻石。

记者:汉字字形数据库对汉字研究和字典编纂的支持作用主要体现在哪些方面?

臧克和:没有各类文字的大型数据集平台体系,要在一定时间内完成如此大规模的多功能工具类字书的加工集成,几乎难以设想。比如,下面这样几个层面的关系就比较重要:

面对海量的个性化书写样本,在字样选择层次上,工具书所呈现的不同时期、不同材质的字形,需要选择其中常用的、有代表性的结构,这样的工作,由人工统计处理已经远远不能胜任,必须依靠标注完备的各类属性库进行字类字量字频统计分析。

在信息保真层面,数十个数据库标注着各类文字的时间、空间、介质、流传保存、字体原形、结构类型、偏旁构件、考释释文、异文关系、作者以及研究者等各种原始信息,保证了历史汉字属性提取、有序编排的科学准确,数据链完整而信息不会缺失。

在平台共享层面,依托各类数据集合成开放式平台体系,研发过程中团队之间实现同步协调,大大提高深加工效率。

记者:文字学者应如何埋头研究,字典数十年的编撰历程提供了范例。请问您是如何认识并坚持的?

臧克和:国家文化建设事业的日益发展,文字新材料成批的出土发表,提供了超过文字学史上任何“黄金时代”的学科建设条件。越来越多的专业工作者在这个领域里“预流”,进德修业,正果非凡,是可预卜的。

我个人则是惭感杂糅,惊喜交集。这里远谈不上“范例”,我和我的团队目前所做的还非常有限。今年,我实际工作年限业已满48个春秋。回首所经所历,之所以一直在这个相对属于“冷业”的领域里,可以生活得跟“出世间”几乎相去无间,自忖或许是基于如下近乎顽强的执念:

人来到这个世界,立定脚跟,最是要紧。如果说语言作为人类的认知方式与认知结果建构了世界,那么是否可以说,正是文字同构并固定了这个流动不居的大千?

文字标记,为人类社会首次实现系统编码;同构赋形,使得万事万物可以存储、互联、分类、提取,进而可以格物、致知。悠远的汉字,定型了人类世界社会生活和观念领域的各类结构关系。使这个世界的结构变得“可视化”,乃至“场景化”。规则得以明确,世界可以把握。正是从这个意义上说:“文字,足可安身立命。”

进入数据化时代,文字的理解与处理就不仅仅是工具与手段,抑且是一种生命状态与生存方式。建立一个保存人类书写记忆文本库,是大数据时代汉字文化圈面向全球贡献人类智慧的一项重要课题。

汉字的“过渡形态”和“中介图谱系列”理论,为汉字文化圈书面语文本的大数据挖掘提供了理论依据。“过渡形态”单位字段的设置,使得海量文本数据化加工,具有了可操作性。依托该文本库,调查研究者就具备了揭示人类认知行为发展规则与智力记忆传承的第一手资料。

万物皆流动,由旬无常居。白驹已过隙,文字树常绿!

《光明日报》( 2023年02月12日 05版)

关键词:

上一篇:

下一篇:

精彩放送