上海交通大学国际教育学院上海200030上海市新古北中学上海200051摘要:本文主要讨论对外汉语教材中的超纲词问题。一方面阐述了超纲词问题的严重性并分析其原因――大纲词汇量偏低与教材偏难;另一方面提出了减少超纲词的一些策略――扩大大纲词汇量、对生词做不同的处理、加强汉字教学等。一、引言超纲词作为一个概念,其定义是很明确的:超纲词就是超出大纲词汇表的词。本文这里讨论的是超出HSK词汇大纲词汇表的词,即不在8822个词之列的词。但是由于汉语中“词”的认定是一个还未完全解决的问题,因而使得超纲词的判定也就随之成为问题。这主要是由于分词颗粒度大小所致。对于某个具体的语言单位,如果颗粒度大,往往被判定为超纲词,反之,如果颗粒度小,则可能不被判为超纲词。如“我校”,如果作为一个词,则是超纲词,如果分成两个词,则只有“校”是超纲词;再如“我国”,如果作为一个词,也是超纲词,如果分成两个词,就都不是超纲词了。还有“星期一”等也是这样,作为一个词时是超纲词,如果分成两个词,就都不是超纲词了(大纲中只收了“星期日”与“礼拜天”)。本文主要讨论对外汉语教材中的超纲词问题,基本不涉及颗粒度大小的问题,而是以教材编写者给出的生词为准,即主要讨论生词中的超纲词。
此外本文有时也附带讨论到超纲字。比较起来,超纲字的判定相对容易些,不存在颗粒度大小问题二、超纲词的现状分析(一)对词汇大纲的分析本人自己对《汉语水平词汇与汉字等级大纲》(2001修订本)进行了一些统计分析。大纲共有8822词,如果把其中的等义词及词头词尾的示例也独立出来的话,一共是8890共包含字次是16551,不同的汉字共有2864个。其中不在2905字(汉字大纲总字数)中的有字不在286449个,除去汉字大纲中的41个人名(姓氏)地名用字后的还有8《汉语水平词汇与汉字等级大纲》内部的词汇大纲与汉字大纲之间存在着一些不一致的地方:某些纲内字只能出现在超纲词中,同样某些纲内词中却包含一些超纲字。尽管这些不一致所占的比例很小,但作为一个教学和考试用的大纲显然是应该避免这些不一致的情况。李英在《关于〈汉语水平词汇与汉字等级大纲〉的几个问题》一文中对大纲中词语的筛选、词语的分级、词语的切分和词性的标注等问题进行了论述,指出大纲中存在的不少问题。为引起大家的重视,本文不避其繁,择要列举如下:在词语筛选上,(1)口语词相对不足。例如,《汉语水平词汇与汉字等级大纲》中收了“案情”、“把手”、“暗中”、“自行车”等,却没有相应的常用口语词“案子”、“把儿”、“背地里”、“单车”等。
另外,口语中有很多带“子”的词,像“锤子、铲子”等,但《汉语水平词汇与汉字等级大纲》只有“锤”、“铲”等。(2)新词新语选用不多。《汉语水平词汇与汉字等级大纲》收进了一些新词,但吸收的还很不够,像“巴士、曝光、炒鱿鱼、打的、贺卡、名片”等新词新语没有收入。(3)易联想词添加不够。《汉语水平词汇与汉字等级大纲》收入了“外祖本文曾在华东地区第三届对外汉语教学学术研讨会(中国•杭州2003年11月6-9日)上交流过,与会代表在讨论中对本文提出过一些修改意见,由于牵涉到的问题需要做较长时间的数据统计,拟另文讨论,因而未能在本文中得到及时修改,特此说明。当然超纲字和超纲词一样,都有个同形问题,如“花(花钱与鲜花)”、“米(米饭与米尺)”与“地道”、“大意”等。此外还有义项的常用与否等问题。对此本文不作深入的分析。上海师范大学学报,2003,(增刊):96-100母”、“外祖父”、“舅舅”、“舅母”,但是有“姥姥”却没有“姥爷”,有“姑姑”却没有“姑父”,有“外婆”却没有“外公”。在词语分级上,有些令人不解的现象。如在《汉语水平词汇与汉字等级大纲》中,“白天”是乙级词,“晚上”是甲级词;“学生”是甲级词,“教师”是乙级词,“旅行”是甲级词,“旅游”是丙级词;“爷爷”、“奶奶”属乙级词,“孙子”、“孙女”则是丙级词。
这些是根据统计得出的结果。可见一般的语料统计并不完全可靠。现在的统计语料主要是书面语,而在书面语中有些相互依存的词语出现概率并不相同(对此在传统语言学研究中已有人注意到这种近义词、反义词等的用法及频率的不对称问题,但统计语言学家并没有意识到它对语料统计所带来的影响)。比如前面提到的“爷爷”、“奶奶”与“孙子”、“孙女”等词其反映的概念是相互依存的,但它们在实际使用中的频率却是不对称的:“孙子”、“孙女”们常常开口闭口“爷爷”、“奶奶”,但“爷爷”、“奶奶”们却很少“孙子”、“孙女”的叫;而且,“爷爷”、“奶奶”还能作为非亲属称呼,用来尊称老年人。这大大增加了“爷爷”、“奶奶”的使用频率。在词语切分上,由于大纲制定者从所谓严格的语言学意义上来认定词,使得一些一般不能单用的语素字(粘着语素字)进入大纲词表。如“顾(动)”、“观(动)”、“寒(形)”、“唤(动)”、“怒(形)”、“器(名)”、“室(名)”、“行(名)”、“讯(名)”、“众(形)”等都是粘着语素字,而不是单音节词。最近,赵金铭等撰文也指出了《汉语水平词汇与汉字等级大纲》存在的一些问题(二)超纲词问题的严重性超纲词问题是现有对外汉语教材尤其是中高级教材中存在的一个严重问题。
根据李清华的研究的生词是超纲词,而超纲的生字仅有5%。根据本人自己的研究统计,问题比这还要严重:在一套零起点的对外汉语初级教材《汉语教程》中,共有生词1027个,其中纲内词844个,超纲词183个,分别占82%和18%;而在一套对外汉语高级教材《多文体精泛结合高级汉语教程》中,共有生词(超出甲级、乙级和丙级的词)932个,其中纲内词184个,超纲词748个,分别占20%和80%。这大大超出了《汉语水平等级标准与语法等级大纲》中的规定。下面用表给出这些统计数据。超纲词与超纲字统计表总词数超纲词百分比总字数超纲字百分比初级教材102718318%7971%中级教材925054.3524.32%高级教材11166455.17%2202.27%高级教材2352982.86%8310.84%高级教材3932748800230323%(表中“中级教材”和“高级教材1”、“高级教材2”是李清华的统计数字〈分别统计了一篇课文〉,“初级教材”和“高级教材3”是本人对《汉语教程》和《多文体精泛结合感谢该书主编肖奚强先生无偿提供其生词总表。该书突破已往的高级汉语教材文体单一(多是文学作品)、偏重(或只有)精读训练的编写模式,在多文体、精泛结合编写高级汉语教材方面进行了成功的尝试,首次引进了系统的修辞教学内容、对生词直接用汉语注释。
该书在正式出版前试用过两学年,而且“教学效果良好,从形式到内容都受到留学生的欢迎和好评”(见该书前言)。就是这样一部精心打造的教材,其超纲词的比重还是很大,这不能不说,超纲词问题确实严重。这里的超纲词都是指超出《汉语水平词汇与汉字等级大纲》中8822词的词。如果在初级教材中限于甲级词和乙级词的话,超纲词则更多:287 个,占28%;如果在零起点教材中限于甲级词的话,超纲词为519 占50.5%。上海师范大学学报,2003,(增刊):96-100 级汉语教程》的统计数字〈分别统计了全部课文〉)统计数据表明: 超纲字在对外汉语中高级教材中比重则要小得多,二者的比重相差很大。(三)超纲词问题严重的原因 为什么超纲字比超纲词要少得多?这主要是因为高频汉字在语料中的覆盖率极高,而且 语料规模越大,高频汉字在语料中的覆盖率越高。这一点可以从实际语料的统计数据得到证 实:2905 个高频汉字在 887 万字语料中的覆盖率高达 98.6323%,在 8640 万字语料中的覆盖 率则更高,达到99.579%。 为什么会出现大量的超纲词呢?原因无非是两个方面:一个方面可能是大纲词汇量太小, 一个方面可能是教材词汇量太大。
究竟是哪方面的原因呢?还是二者都有? 前面我们已经提到大纲中存在的一些问题,这里再补充一些关于词汇量方面的研究。 李清华在《〈汉语水平词汇与汉字等级大纲〉的词汇量问题》一文中,实际考察了中、高 级阶段教材中三篇课文的生词情况,并与大纲中的词进行了比较。数据分析表明大纲所定的 8822 个词的词汇量偏低,应该达到15000 左右才合适。李据此认为,《汉语水平词汇与汉字等 级大纲》词汇量偏低是造成中高级汉语教材超纲词过多的重要原因。 根据本人对切分标注通用语料的统计,对于一个20 万字的语料库,8822 个词的覆盖率可 以达到96.02%;而对于一个422 万字的语料库,8822 个词的覆盖率可以达到89.89%;而对于 一个465 万字的语料库,8822 个词的覆盖率可以达到87.56%;而对于一个887 万字的语料库, 8822 个词的覆盖率可以达到86.62%。这些数据表明,随着语料库的增大,8822 个词的覆盖率 逐渐降低,有收敛的趋势,预计将收敛在80-85%之间。从这些数据可以看出,8822 际语料中的覆盖率是很低的,并没有达到大纲制定者所称的95%。要达到95%,对于一个465万字的语料库,需要25630 个词,对于一个887 万字的语料库,需要33000 这些数据表明,大纲词汇量确实偏低,这自然会造成对外汉语教材超纲词过多了。
如果仅仅从教材的词汇量来看,不论是初级还是高级教材,1000 左右的词汇量是合适的。 根据《汉语水平等级标准与语法等级大纲》,初级的总词汇量应该达到 3051 个(最低的甲级 词也有 1033 个),而高级的总词汇量则应该达到 8822 个,其中生词数是 3569 个丁级词,按 照《汉语水平等级标准与语法等级大纲》的要求,三年级要求掌握其中的一半,也就是 1785 个。我们前面统计到的教材中的词汇量是小于或者远小于这个标准的(因为这毕竟只是一门课 中的生词)。但从超纲词的比重看,也许教材选择的课文过难也是一个重要的原因,这从我们 对初、高级教材统计数据可以看得出来。一套只有 797 个生字、1027 个生词的初级教材,其 中的超纲词竟占到18%,超纲字也有1%。而在高级教材中比重则更高,超纲词达到80%,超 纲字达到 23%。这一方面是由于教材编写者是母语使用者,很容易低估课文的难度,另一方 面则是由于教材编写者在编写教材时没有意识到超纲词的问题,未能有意识地控制超纲词的 数量。 三、控制超纲词的策略 既然超纲词的数量是如此之大,那么怎样才能有效控制超纲词的数量呢?我们认为可以 采用以下策略。 1.修订大纲词汇表,增加大纲词汇量。治标需治本。根据前面的分析,大纲词汇量偏低。 李清华在1999 年曾经提出应该把大纲词汇量提高到15000 左右,但是这个问题似乎没有引起