约定用法和词的定义

" 词是"语言中的最小意义单位"。(王力,一,16页)

"一个词,就是一个简单的意义单位。"(王力,二,171页)

词是"能够单独成句的单位"。(Bloomfield,178页)

"词是概念的个别形象…" (洪堡特,116页)

"词"的定义一直是个难题。"我们怎样知道哪些是词?语言学家进行了长期探索,试图设计出可行的标准,但还没有一个完全成功的"(克里斯特尔,145页)。

但这个难题不是专属语言学的,它也一直为哲学所关心。"词"的定义涉及"意义"问题,而意义理论通常认作是语言哲学的核心,仅此一点就可说明为什么"词"的定义问题是语言学和哲学的交汇点。

最小的意义单位

"词"的最常见的定义之一是"最小意义单位"。有人反对用意义、观念来定义"词",因为这些似乎是内在的东西,没有提供形式特征,不宜用来下定义 。一个明显的问题是,意义怎样分解为单位呢?固然,意义是可以分析的,例如我们常说"分析一篇文章的意义",然而,分析不见得是把一样东西分解成较小的部分、分解为要素(永井成男,序论,一,"什么是分析"),例如把"三角形"分析为"由三条线段组成的封闭图形",其中"三"、"封闭"、"图形"等显然不是比"三角形"更小的"意义单位"。奥斯丁曾指出"意义的一部分"是个没着没落的用语(Austin,31页),那么自然也就谈不上"最小的意义单位"了。

简单的意义单位

"最小的意义单位"这个表达式含义不明,于是有人把它进一步理解为 "简单的意义单位"(王力,二,171页)。刘叔新把词定义为"意义单纯的语言单位",并举例说"知识""表示一个单纯的概念",与此相对,"知识分子"是个词组,其意义是"复杂"的(邢公畹,118页)。这是个更糟的定义,"知识"、"法"、"衍射",这些都是单词,但何尝意义简单?在我看,"知识"是个很复杂的概念,至少和"知识分子"同样复杂。况且,决定一个概念是否复杂,不是件容易的事,并不比确定什么是意义的单位容易。

最小音义结合体:语素

其实,采用这一定义的论者多半指的是"语言中独立地具有意义的最小声音单位"、"最小的音义结合体"或诸如此类。这个定义不问词义是否还能分解为更小的单位,问的是一个语音是否还能分解为具有含义的语音单位。Beacon固然可以分解为bea和con两个音节,但这两个音节各自或者没有意义,或者其意义不能说明beacon的意义。"醉"是"承载意义的最小单位",一方面,若把它分解为更小的单位,z和ui,那是些没有意义的声音 ;另一方面,"他喝醉了"固然承载意义,但它不是承载意义的最小单位,因为它是由"他"、"醉"等更小的音义结合体组成的。用同样的方法来分析"囫囵",可知"囫"、"囵"都不是词,"囫囵"才是单词。

"最小音义结合体"是一条值得追循的线索,但拿它来作"词"的定义则有疑问。次要的一点是它仍然和意义相连,缺少外在判别式,例如作为词缀的"儿"和"子",怎样判断它们独立具有意义,抑或只是附加的符号? 但这个定义的主要困难在于:语言学里普遍把承载意义 的最小单位称为"语素"(morpheme)。语素是比单词低一级的音义结合体,固然,多数语素本身就是单词,如he,top,但也有些语素不成其为单词,如co-,pro-,trans-、-ness、-ism,它们符合"音义结合体"这个定义,但不是词。语素概念也早被引入来分析现代汉语,按照这种分析,虽然汉语里很多语素同时就是词,但也有大量的字,?quot;英"、"始"、"鞠",有音有义,是语素,但不是词。

基本造句单位:独立成句

赵元任基本上同意"单独成句"这个定义,但他提出了不少附加标准(赵元任,二,79页、86页、101页)。王力则反对这个定义,因为这样一来至少得把"吗""之"这些单词都排除在单词之外(王力,一,17页)。对此,吕叔湘提出一个补充方案:把一个句子里能单独成句的成分拣走,剩下的成分,若不是一个词的一部分,就是词,例如"我下午再来",把"我"、"下午"、"来"拣走后,剩下的"再"字也是词。但"比赛现在开始"里的"始"字不属此列,因为"始"是"开始"这个词的一部分(吕叔湘,17页)。

基本造句单位:自由形式

另一种理解不把"基本造句单位"看作"能单独成句",而是理解为"自由成分"或"自由形式"(free form)。自由形式是不粘附于其它语言成分的单位,它不必须和某个其它成分连用而能和别的单位自由组合。"我"、"是"、"看见"可以出现在无数种前后文里,在合乎句法的条件下可以和任何语词搭配,是典型的自由形式。相反,"英"这个字只出现在"英雄"、"英俊"、"群英会"等特定的搭配之中,所以它不是自由形式。至于"龌龊","龌"只带着"龊","龊"永远跟着"龌",两个字分开来都没什么含义,自然更不是自由形式了。另有一些字,?quot;取"和"笑",在"取笑"这话里粘连在一起,不能自由移动,在"取订单"、"笑他弟弟"这些话里则是自由形式。

"自由形式"和"单独成句"是对"基本造句单位"的不同理解。"吗"符合"自由形式"这个定义,但不符合"独立成句"这个定义。然而有论者不加辨别,已经把"基本造句单位"明确界定为"在语句中能独立活动的基本语法单位",接下来立刻又把这话解释成"能够单独成句"(陈光磊,9页),或干脆把两者混在同一个定义里,说词是"能够单独说的、自由运用的造句单位"(李荣,14页)。我认为,"最小造句单位"只能由"自由形式"来定义,而不能由"独立成?quot;来定义。

"自由形式"和"最小音义结合体"显然是不同的定义,"英"是音义结合体,但"英"在现代汉语里却不是自由形式。然而有些论者同时采用这两种定义:"词是由句子中分出来的最小意义单位,这就是说,词是句子所由组成的各个可以独立运用的部分"(王力,三,238页)。这种"兼收并蓄"不能解决而最多是掩盖了我们的困难。我们希望找到把不同线索结合起来的结构,而不是在两条线索之间摇摆的折中主义。

"自由形式"这个定义有自己的困难。驼和鸭都不是自由形式,羊和鸡都是,推论下来,似乎"驼毛"和"鸭蛋"都是单词,而"羊毛"和"鸡蛋"都是自由词组(吕叔湘,20-21页),这未免有点奇怪。不过我们先放过这层困难,来看一看怎样确定自由形式。

扩展法

比起从意义方面来定义的"音义结合体","自由形式"这个定义看来有一个优点,那就是可以由外在的标准来判别。最通用的判别方法是"扩展法"或"插分法":我们想知道hit the man 是一个单词还是三个单词,我们可以试着在hit和the之间以及the和man之间插入另一些语言成分,看看成不成话,例如把它扩展成为 hit and killed the young man,现在" 我们看到这仍然成话,于是就确定hit the man 是三个单音节的单词而不是一个三音节的单词。相反,在youngest中间,在young和-est之间,无法插入任何别的成分,由此可知youngest是个单独的词。同理,some thing是词组而something是单词,因为我们说some good thing,但只能说something good。由此也可知,虽然un-、-est、-ness等等可以加在很多词上产生新词,但它们本身只是词缀,不是单词。

很多研究汉语的学者也采纳扩展法来区别单词和词组(王力,一,46页;高名凯、石安石,106页),有些在运用时有所变通(参考:陈光磊,13-14页)。根据扩展法,可以判定"老婆"是单词而"老人"是词组,在"老人"之间可以插入别的字,扩展为"又老又丑的人",但"老婆"中间就插不进任何别的字了。"马车"可以扩展成"马拉的车",所以是词组,不是单词。"说话"和"取笑"都是动宾结构,但一个是词组,一个是单词,"说话"可以扩展为"说大话"、"说废话","取笑"中间则不能再插入任何语词(王力,一,46页)。

我们也可以用扩展法来检验包括"英"字的所有语词,如"英雄"、"英俊"、"群英会"等等,结果发现"英"与另一个语素之间都插不进别的成分,由此可知在现代汉语里"英"是语素但不是单词。

扩展法的缺陷

扩展法的一个优点,是它能提供外部标准。但这个优点其实十分有限,我们说允许在几个语言成分之间插入其它成分,当然是说插入了其它成分而意思没有大变。我们凭什么?quot;老婆"不能扩展成"老年的婆婆"?因为"老婆"和"老年的婆婆"意思不一样。然而,把"马车"换成"马拉的车",意思就当真没变吗?一辆车现在由骡子拉着,我们仍然叫它"马车",用马来拉一辆小汽车,这辆小汽车并不因此叫作"马车"。这个反诘虽然有点刁钻,但的确需要回答。总的说来,"意思不变"、"意思一样"是极难澄清的概念。但无论意思变了还是没变,总要对意思有个了解,而这种了解恰恰又回到了"内在"方面去了。

而且,我们根据什么规则允许把"马车"换成"马拉的车",而不是仅仅换成"马的车"?"马车"可以扩展为"马拉的车",那么"火车"、"卧车"、"机车"、"大车"、"铁路"呢?我们能否说火车是火力推动的车,铁路是铁轨铺成的路?如果提供不出一定的规则,说不定所有的复音词都能扩展,即如"取笑",亦可扩展为"取其短处加以嘲笑"。

而且,在西语分析中采用扩展法就会碰到不少模棱两可的案例,应用于汉语分析,疑难的例子更多。王力承认有时会碰上分不清的例子,如"干儿子"、"帝国主义"等(王力,一,14页)。进一步的验试发现疑难实例远比"有时"更经常。"物理"(物之理)、"宇宙"(上下四方为宇,古往今来为宙)、"人心"、"六边形"、"法律学",算不算合乎扩展法?"打倒"等动补式组合通通可以插?quot;得"字"不"字,构成了另一大类难题。再如"鞠躬",人人都会认之为单词,却可以扩展为"鞠了个躬"。另一方面,"含沙射影","天将降大任于斯人也"等成语、熟语在句子里总是连在一起用的,不能在中间插入别的成分,但因此可以说它们是单词吗?

仂语

即使"马车"、"说话"等等不是单词,但它们总比一般自由词组结合得紧密,我们的实感总觉得它们和"大车"、"取笑"更近些,和"一匹白马拉的破车"或"说了一上午的话"远些。王力采用"仂语"这个概念,就是为了解决这个问题。貌似单词而经不起扩展法检验的复音语词,都是仂语。仂语是汉语里一个庞大的中间体,一边与复音词邻接,另一边和自由词组邻接。

然而,我们应当怎样定义"仂语"呢?我们看来只是把给词下定义的困难转移过来而已。"凡词群没有句子的作用者,都是仂语"(王力,一,42页)。这个定义实在糟糕,按照这个定义,"马车"、"马拉的车"、"这辆从来没有任何人动过的车",都该归在仂语里。但显然,"马车"的结构、功能和具有意义的方式都和"挡车"、"大车"这些标准的单词更为接近,和"这辆从来没有任何人动过的?quot;则相去甚远,故有论者说:"我们把它("马车")当作一个单词看待,也不能算错,而且在习惯上是很自然的"(文炼,226页)。可以肯定,王力心目中的仂语,只有"马车"、"说话"一类,而不包括"这辆没人动过的车"一类,所以他会说"仂语在原则上等于一个单词的用途"(王力,一,45页)。可按照他对"仂语"的定义,偏偏要把"马车"和"这辆没人动过的车"划在一类。看来,仂语概念无助于明确词的定义。

外部标志:拼写与语音

科学偏爱具有形式标志的定义,在这一点上,语言学殊非例外。所以很多语言学家反对从意义方面来下定义。"造句单位"可由扩展法判别,但不仅例外太多,而且再追一步,扩展法仍然依赖我们对意义的了解。在哪里能找到较为确实的形式标志呢?

在拼音文字里,似乎有个简捷的办法:看一看语词是怎样书写的。然而,谁能单凭这一点来确定roadblock是一个词而road machinery是两个词呢?"海滩"在英文里有时写成sea shore有时写成seashore,那么它是一个词还是两个词?至于中文这样的非拼音文字,书写特征就更不足为凭了。 陆志韦很早就指出单根据声音来给词下定义是不可能的,而且这个办法在汉语尤其行不通,他举的一个例子是"代表"和"戴表"(陆志韦,14页)。王力的看法也是这样(王力,三,240页)。陆志伟自己采用的方法叫作同形替代法(陆志韦,15-26页),这个方法没有被后人普遍认同,他的工作可说是后继无人。赵元任曾对这个方法的主要缺点做了说明(赵元任,三,236页),不过他认为把某些语音特点和同形替代法综合起来考虑,"也许会产生出一个跟其它语言的word很相似的概念"(赵元任,三,239页),"这些因素(重音声调等)看来至少能给出部分答案"(赵元任,三,237页),但他同时也指出,汉语复合词固然有轻重音型这一特定的音型," 但"在这一方面,词组跟复合词没有区别"(赵元任,二,79-80页、190页),"袖手"是词而"就走"不是,"图书馆"是词而"他不管"不是。

词和字

为"词"下定义的工作陷入困境,根本的原因也许在于"word这一级单位…在汉语里没有确切的对应物"(赵元任,三,233页)。在西语里,语言的基本的单位是词,在汉语里,是字?quot;字"这个概念的外延很清楚,字读出来是一个音节,写出来是一个方块。小学校里最初一个一个教的,任何语文工具书必须一个一个解释的,就是"字"。"在中国人的观念中,’字’是中心主题,’词’则在许多不同的意义上都是辅助性的副题"(赵元任,三,248页)。

在一个基本的意义上,汉语的字和西语的word大致相当:在西语里,绝大多数的语素本身就是单词(元素词),而在汉语里,绝大多数的语素都是字。在西语里,复合词是由元素词构成的,汉语里的复合词则是由字组成的。语言学的中心任务是研究语音和语义的联系,因此,确定最小音义结合体始终是语言学的一项中心任务,而在汉语里,音义结合体就摆在字这个自然层面上,那我们似乎是该把字当作"中心主题"。 综观前面对"词"这个概念所作的分析,主要得出"语素(最小音义结合体)"和"自由形式(最小造句单位)"这两条线索。在西语word这个层次上,这两条线索大致重合:绝大多数语素同时也是自由形式,只有trans-、-ism等少数例外。所以,西语研究把word作为语言的基础层次,颇为自然。在古汉语里,在"字"这个层次上两条线索也基本重合,只?quot;囫囵"这样少量的连绵词是例外。如果讨论的是古汉语,我们满可以用"字"来翻译word。但上古以后,通过意义兼并、近义词结合、习惯用法等等,多音语词渐渐多了起来,"语素"和"自由形式"不再相合:字大都是语素,但其中一半是自由形式,一半不是;词汇多半是复音词,是自由形式,但不是"最小音义结合体"。所以,"字"或"词"都不能和word对上。"语素"这条线索大致落在"字"上,"自由形式"馓跸咚鞔笾侣湓?quot;词"上。这样我们也就清楚了:以字还是以词为基础单位,实际上争点在于侧重于音义结合体还是侧重于造句单位。像赵元任那样建议以字为基础单位,等于是说音义结合体是主导线索,像王力那样坚持以词为基础单位,等于是说造句单位是主导线索 。人们更经常把word译作"词",这似乎表明人们更偏重于从"造句单位"来理解word。

依我的看法,这两条线索的重要性差不多。后面我将表明这一看法的依据。其实,虽然汉语研究者有的赞成以字为基础单位有的赞成以词为基础单位,但在具体的研究工作中差不多都是两者并重的。

定义和概念分析

我们行到中途,有必要停一下,看看自己走到哪里了,看看我们是否已经接近了"词"的定义。

对定义工作有一种极常见也极幼稚的误解,以为给"词"下定义就是要找出一个或一些特征,为一切词所共有,为一切非词所不具有,似乎这样的特征就构成了词的本质。"词"这个概念从来不是从所有词的共同点归纳出来的共相,我们原不可能把天下的单词或至少一种语言里的单词都摆到眼前,以便抽绎出它们的共同之处。所谓经验主义的归纳法实是完全无视经验的主张。"词"是日常用语,我们平时用"词"所称的,原不一定具有某一或某些共同点,这一点已由维特根斯坦的"家族相似"概念讲得很清楚了。退一步讲,如果是由于所有的词都有一个或一些共同点所以都称作"词",像所有的兔子都具有一些共同点那样,那只说明"词"这个词没什么概念内涵,不过是个名称而已。而本质却是属于概念的,我们不谈论"兔子的本质"。

要理解词的本质,首先需要的不是定义,而是概念分析。对"词"作所谓"概念分析",说得最简单,就是弄清我们把这些语言单位叫作"词"而不把另外一些语言单位叫作"词"道理何在。"词"的概念分析回答"词"这个概念是根据什么道理形成的,而不是回答"所有被称作’词’的东西的共同特征是什么"。"音义结合"和"造句单位"就是这样的道理。

但其中每条道理,乃至各条道理的联合,通常都不能充分界定"词"的实际用法。首先,我们不能保证我们已经穷尽了实际用法所基的全部道理;其次,一些新道理可能在不断改变实际用法;最后也是最重要的,我们不能保证一切实际用法都必定符合某种道理。

那么,"词"岂非不可能得到充分的定义了?自然概念本来就不可能得到充分定义。像"音元"、"语素"这样的理论概念是可以充分定义的,所有语素都是"最小音义结合体",没有例外。这并不奇怪,因为"语素"不是一个自然概念,它本来就是其定义的缩写。与逻辑主义者的论断相反,概念的可充分定义性并非泛泛的优点,而只是建构精密理论的一条必经之路。

如果把"音义结合"、"造句单位"这样的分析结果称作"定义",那它就是揭示性的或概念性的定义,与理论概念的定义不是一回事。概念性的定义无需提供形式标志。本文第一节提到,从意义、观念、概念方面来定义词,人们疑虑重重,因为"意义"等概念缺少形式标志。在概念分析的范围之内,这种疑虑是多余的。

"词"、"句"、"意义"等,一方面来自自然语言,同时又是语言学理论中的概念;它们是语言学的基本概念,也可说是桥梁概念,是沟通自然理解和专业理解的桥梁。我们在为理论目的定义这些语词的时候,既要梳理其原始概念结构,又要考虑其构建理论的功能。在这些基本概念的基础上,进一步构建起"语素"、"音元"等纯粹理论性的术语。这些术语的整体构成了一门科学的语言,即建立在自然理解基础上的一种亚语言。

从建构理论的目标来看,可以把概念分析看作定义的准备工作。但"严格"的定义工作不是用来界定"词"的实际用法的,而是用来构建语言理论的。我们会纳闷,即使能够通过重音声调等等确切地界定什么是词,对平常人怎样确定什么是一个词也并无帮助。这些技术性的方法,十分繁难,我们未经训练,没有设备,所以无法应用,其结果也只是一些技术术语,完全不能增进我们对"词"这个概念的理解。然而,这些定义本来不是为了直接增进我们的理解,而是为了建构科学理论的。

概念分析是在自然理解的层面上进行的,始终依托于感觉。在这个园地里,我们经常听到研究者互相询问:这种提法是否符合实感。然而,概念的技术性越强,我们就越不可能诉诸实感来检验它。我们平常看作静止的,牛顿说"" (匀速直线)运动",从前,光和明晰可见连在一起,伦琴以来却有了"可见光"和"不可见光"的区分。技术性概念的功能是建构理论,而不是为"模糊的自然概念"提供精确的界说。我们也许会抗议说,如果科学对"运动"、"光"等等的定义和我们对这些词的日常理解相悖,科学干嘛还要说它讲的是"运动"和"光"呢?它满可以为它所界定者另起一个名字,就像"语素"、"夸克"这类与日常语言无关的语词。然而,科学所理解的"光"、"运?quot;、"词",并不是与日常理解的"光"、"运动"、"词"完全无关的全新概念,它们是日常概念的某种变形、伸张、深入,虽然在不断的理论构建过程中最后变得和日常概念完全无关了。 语言的基本单位

回顾历来对"词"的各种各样的定义,音义结合体也好,造句单位也好,以"字"代"词"也好,不难看到,都是要确定某种"基本单位"。那么,我们径直把词定义为"语言的基本单位"行不行?这个笼统的提法也许不错,但它实在太笼统了,行得通行不通仍然要看下面怎样解释这一定义。在采取这一定义的论者那里,所?quot;基本单位"仍被理解为"最小音义结合体"或"最小造句单位",或无原则地在两者之间跳跃。

我们可以换一个角度来思考这个问题。若说词是基本单位,那么,什么是不基本的单位呢?自由词组和句子也是语言里的单位,但它们既然由单词这个更小的单位组成,所以它们不是"基本的"单位。然而,句子和单词却不是同一个意义上的单位,正是由于认不清这一点,引起了经久不息的争论和广泛的混乱。从一个角度着眼,人们主张词是基本单位,从另一个角度着眼,人们又会主张句子是基本的单位。我颇喜读的一位论者,竟在同一本书里一时明?quot;词是语言的基本单位",一时又称"(语言的)基本单位是句"(朱星,5页、62页)。

词是构成句子的单位,句子又是什么的单位?是一篇讲话的单位?一篇文章的单位?这样的思路错失了关键之点:词的用法是约定的,而句子、段落、文章等等都不是约定的。人们常说语言是交流、交通。那么,词就是我们进行交通的设施,而句子则是交通本身。交通设施是建好的,交通则依各人每天的需要进行。单词是约好的表达手段,句子则是自由表达。

约定用法与自由表达

约定用法与自由表达,即叶斯柏森所称的formulas and free expressions,这一组范畴提示出了语言的本质,恰如叶斯帕森所说的那样,"约定用法和自由表达 的差异渗透到了语法的各个部分"(叶斯柏森,7页),"约定用法可以是一个完整的句子,也可以是一个词组,或是一个词,或一个词的一部分"(叶斯柏森,13页)。所以,他在《语法哲学》里开篇就讲解这对范畴。最重要的对照不是语素和单词的对照,而是约定表达和自由表达的对照。"喷饭"不能说成"喷哺","吐哺"不能说成"吐饭",这是典型的约定;"我明天来"是典型的自由表达。有了"心细""心碎"的成说,心思细碎就只好说心思细碎或心思琐碎,不能再说"心细""心碎"。就连"吃了吗?"也应该视作约定用法。叶斯柏森就提供出很有力的理由,把How do you do和Beg your pardon都叫作约定用法(叶斯柏森,5页)。

音义结合体、单词、以及短语等等,它们都是约定的用法,它们之间的区别在于约定/自由的程度各个不同。语言在各个层次上都有着程度不同的约定,整个语言可看作是使用完全约定的符号编制约定性质较弱而自由程度较大的符号,直至于自由的表达。

我们可以把约定大致分为两个等极。第一级的约定是语素,大致就是字,如"始"、"走"、"大",它们是没有什么道理可讲的纯粹约定。第二级的约定依据一定的道理乃至某些规则,但这些道理和规则是不充分不完整的。"地震"是约定的说法,不能说成"地动",但"地震"这个约定是以"地""震"这两个字原有的含义为基础的,所以不是纯粹的约定,我称之为次级约定。次级约定里有一种特别的约定,如"吐脯"、"瓜田李下"、"爱你没商量"等等,它们的意思不仅有赖于其组成成分的语义,而且也有赖于某种特殊的文化、历史情况。在约定用法之外是不经约定的自由表达或自由词组。"飞机"是个约定用法,"飞来"和"大飞机"是自由表达。

基础约定,语素、字、连绵词、混一词

最基本的约定是最小音义结合体,或语素。"大"就是"大"的意思,把"大"分解成d和a,这两个音要就没意义,要么其意义和"大"没有关系。"雨"不指雪,"跑"不指跳,这些完全是约定的,没有道理可讲,只有单独学过才懂得其意义。

汉语里的语素大致就是字。有些字是自由形式,如"大"和"我",有些字不是自由形式,如"英"和"始"。英语里的trans-不是自由形式,但其中文对应物"跨"则应视作自由形式。

无论是不是自由形式,语素都是造词的元素,"始终"这个词是由"始"和"终"这两个非自由形式的语素构成的,"大话"这个词是由"大"和"话"这两个自由形式的语素构成的。一个语素尽管可能不是自由形式,不能自由地用来造句,但它造新词的能力体现了一定的自由度(Hockett,307-308页)。"迢"和"遥"都不是自由形式,但"遥"的自由程度较高,因为它具有更强的造词能力,如"遥望"、"遥盼"、"遥祝",而"迢"已大致丧失造词能力。"英"、"始"这样的字自由程度更高,它们虽不是完全的自由形式,但在多种语言游戏里可以单独使用,包括玩笑、对联。

基础约定还包括"鸧鶊"、"囫囵"、"蝴蝶"这样的连绵词。连绵词是双音的,就是说,是两个字 ,但也是最小的音义结合体,因为它与复合词不同,其成分没有独立的意义。

各种连绵词的约定程度稍有不同。"囫"和"囵"都不能单独使用,"蝴蝶"中的"蝶"却是可以单独使用的,?quot;庄生梦蝶"。在现代汉语里,"蝶"是个独立成分,构成"粉蝶"、"蛱蝶"等词,颇类于"鲸鱼"、"鲫鱼"里的"鱼"字。不过,"鲸鱼"、"鲫鱼"里的"鲸"和"鲫"本身是语素,而"蝴蝶"里的"蝴"不能拆出来使用。连绵词里至少有一个字不是语素。概括说,复音词里只要有一个字不是语素,我就把它归入一级约定。依此,"蝴蝶"是一级约定而"鲸鱼"是次级约定。 外语词的音译通常也是第一级的约定,如"坦克"、"逻辑"、"托拉斯"。有些译名混合了音译和意译,如"拖拉机"、"来福枪"、"乌托邦",按照上述原则,这些仍该算作一级约定。

次级约定,派生词、复合词

"牙"和"齿"意思相同," 但"齿冷"不能说成"牙冷"。同理,"人造",不说成"人制"。"地震山摇"和"地动山摇"都说得,"七级地震"却不可以说"七级地动"。"人造"、"地震"、"齿冷",这些都是约定的说法。不过,它们是次级的约定,因为它们以"人"、"造"这些一级约定为基础,是由其成分的意义促动的约定。

汉语里最基本的约定至少已经是一个字,那么次级约定当然两个字或更多,所以次级约定都是复音的。

次级约定的约定程度有深有浅,相差甚多。"打听"的约定程度明显高于"听说","口吻"的约定程度明显高于"口译"。"发韧"的约定程度甚深,近乎混一词,我们很可能只知道它的整体意思而不清楚其词素的意思,或不尽能看?quot;发"和"韧"这两个字怎样合成了"发韧"一词的意思。另一端,"闭上"的约定程度很浅,但仍应看作是约定,我们不说"闭下眼睛",虽然实际上我们很难说眼睛是闭上的而不是闭下的。次级约定主要包括通常所说的派生词和复合词。

汉语的派生词结构比较简单,由一个词根和一个词缀合成,例如"桌子"、"肘子"、"老师"、"老虎"、"大李老李和小李"。词缀本身不是一个语素,但具有构词功能 。

借词缀构成的单词不多,词缀的数目也不大。有一些字词,该不该算词缀,尚有争论,如作者、智者,药性、革命性,氧化、现代化,激进主义、自由主义,我们、人们。我认为只有那些大致不具有意义的构词成分才应被当作词缀,所以,上面列举的这几种成分依我看都不是词缀。

组成复合词的成分,本身各是语素,复合词的含义建立在这些语素的含义之上,但这几个语素如此结合,却有约定在内,不能完全推论出来。我们后面将详细讨论这一点。

我们所说的复合词,不仅包括王力所说的复合词("复音词"),而且也包括他划作仂语的"说话"、 "扩大"等,这些语词也有约定的成分,只不过约定程度较低而已 。在我看,既然仂语是与自由词组对照提出的,那么无论就用途而言还是就语法而言,它们本来就该归属于复合词的范畴。

三级约定,短语

次级约定里有一些词语,它们之成为约定用法,不仅基于语义,而且含有特殊的历史文化因素。"吐脯"、"喷饭",从结构上看就像"喷水"那样是普通的动名结构,两者字面上的意思也差不多,但它们的实际含义来自特定的典故,结果意思相去甚远。"玩的就是心跳"结构上是个普通句子,一旦被视作某种时代心情的标题,就成了约定用法。若加细分,可以把这类语词称作三级约定。

英语表示速度之快的词如quick,fast等,都和心情之欢畅没有什么联系,但学习汉语的英国人不必了解中国哪一个特别的故事,就能够理解"快"这个字同时含有速度之快和心情之畅快。然而,他不读古典或注解就不可能知道为什么"吐脯"意指求贤若渴,"高山流水"意味着知音难觅,我们也无法从任何或全或偏或显或隐的道理向他解释"断袖"的同性恋倾向。从瓜田李下和天上地下的相同结构我们也推导不出同类的含义结构。

上节说到语词的约定程度有深有浅。三级约定既然在语义之外还含有文化积淀,像"蛊惑"、"杀青",约定程度通常都更深,人们常只明白整个这个词的意思,却不清楚各个词素的意思,以及这些词素如此组合怎么一来就有如此含义。

三级约定中有些是普通的复合词,如"吐脯"。三级约定中最大量的是成语、谚语、熟语、流行语、歇后语等,我总称为"短语"。成语一般指书面上的短语,谚语则指民间的短语,日常生活中新近涌现的短语,七八年搞一次、你别无选择、过把瘾就死,我称之为"流行语"。我称之为"短语"的,别的书里常称作"固定语"、"固定词组"、"现成说法"、"习语"、"习用语"等。

教科书对短语主要有两点界说,一是结构的完整性,二是意义的完整性(高名凯、石安石,10

7、108页)。从结构上看,多数短语并没有什么特点,"玩的就是心跳",原是再寻常不过的话。如果"结构的完整性"是说"瓜田李下"不能说成"瓜田桃下","爱你没商量"不能说?quot;爱你不磋商" ,那么这显然不是短语的特点,而是所有约定说法的共性:"口译"不能说成"嘴译","闭上"不能说成"闭下"。至于短语意义的完整性,仍定义为"不是它的各个结构成分的意义的简单总和"(高名凯、石安石,108页),这也一样不成立,因为这说法也可套在复合词上。另有教科书说"组成短语的词的意义明显,…由词所组成的短语的意义则显得复杂"(邢公畹,118-119页) 。我们在"简单的意义单位"一节已经批评过这种说法,"玩的就是心跳",意义有什么不明显的?再说,"显得复杂"这种话也实在不适于用来对概念进行界定。至于说短语是"极常用的"词组,那就更不着边际了。短语不是由频率决定的?quot;今天下午"、"看电视",这些话出现的频率极高,却不是短语,"藕断丝连"出现频率要低得多,却是短语。其实,与复合词一样,短语之有别于自由词组,只因为它是约定的说法,只不过短语的约定牵涉到特定的历史文化来源。

约定与规则,类推

我们根据什么说"理想"是个词,"万一"是词,"你讲"和"两万"则不是单词,"一唱一和"是成语而"一大一小"不是?概括说来,我们根据什么区分约定用法和自由词组?

在谈到约定用法与自由词组的区别之时,最常见的说法是,复合词等等约定用法的意义不是"它的几个构成成分(字面)的意义的简单总和"(高名凯、石安石,106页),例如,"白事"是"白"和"事"这两个字的有机结合,产生出了新的意义,不是"白"和"事"的"机械和"(陈光磊,10页)。"有机结合"(或"化学结合")和"机械和"这些提法即使不算错,也差不多只是把所要解释的疑问换了个名称,而没有提供真正的的解释。怎样算含义的简单相加,怎样算有机结合?约定用法中的成分在结合中真改变了含义吗?在"鞠躬"这个词里,看不出"鞠"和"躬"哪一个改变了含义。

所谓"约定",就是不能根据规则类推得出。所以,叶斯帕森视自由组合法等于类推法(叶斯帕森,11页)。次级约定是有些道理可循的约定,就是说,并非完全不守规则,但又不可能尽由规则推导出来 --若能完全推导出来,那就不是"约定"了。这也等于说:没有一定的规则告诉我们类推到哪一点就失效了,为什么就失效了。我听到"口译"、"口信",但我想说"口头提供的证据"时能说"口证"吗?我们常说"一等"、"头等"、"一流",可偏偏不说"头流"。"有时候意义相加虽等于相加的意义,可是不知道加起来成不成这个语言所用的词"(赵元任,一,43页),赵元任喜欢举的一个例子是法语用"四个二十,十九"来表示"九十九"。

有一些单词,粗粗一看像是自由的组合,但若细加考察,便会发现其中含有某种约定的因素。

强大。固然,"强"和"大"都是自由形式,而且"强大"也就意味着"强而大",但"强而大"或"大而强"却不能说成"大强"。此亦约定不可类推之一例。

高山。我们说高山、高峰、高楼、高空,但不说"高树"、"高柜"(比较"矮柜")、"高杯"(比较"高脚杯")。形名组合不是很自由的,特别是单音形容词。 "组合不自由,就是有熟语性,这是复合词的特点。短语 的组成,原则上应该是自由的,应该是除意义之外没有任何限制的"(吕叔湘,23页)。吕叔湘在这里所说的"熟语性",就是我们所说的"约定"。

我们须注意,这里的关键不在于是否有时能够类推,而在于有时不能够类推。让我们再用一个例子来说明这一点?quot;窗子"和"桌子"、"椅子"的构成是有规则的,我知道"窗"和"窗子"是一个意思,第一次听到"桌子椅子",可以类推它和"桌椅"是一个意思。然而不知何时,类推终止了。我们说"桌子"、"窗子",却不说"门子" ,说"新娘子"却不说"新郎子",说"儿子"、"孙子"、"侄子"、"外孙子"、"小舅子",却不说"哥子"、"姐子",说"狮子"却不说"熊子"。

说话人与听话人

这里我们接触到语言学里常讲的听话人和说话人" 的区别。之所以有这种差别,是因为存在着大量的次级约定。我学到了"子"这个词缀,第一次听到"新娘子"就懂得它的意思,但作为说话人,只要没听到过别人这样说,我自己就不会说"新娘子",就像我不会说"新郎子"。"口译"遵循另一个规则构成,我知道"口信"中的"口"是"口头"的意思,相对于白纸黑字而言,第一次听到"口译", 就像听到一个自由词组一样,立刻可以类推得知它是"口头翻译"的意思,与笔头的翻译相对 ,实际上,"口头的"正是"口"的主要构词规则,"译"也是"翻译"构词的规则。然而,我自己不会造出"口证"这样的说法来表示口头说出的证据。用成分意义的联合是否能说明复合体的意义作标准来判定自由词组和复合词,这是从听话人方面来看的,依此标准,"口译"就是自由词组。从约定来看侍猓炊运祷叭死此凳欠裼姓庋殖傻脑级ㄋ捣ǎ?quot;口译"自然是个单词。

叶斯帕森说"学习约定用法全凭记忆或重复已经学过的内容(但自由用语则要求另一种脑力劳动)"(叶斯帕森,7页),那是着眼于说话人而不是听话人说的。成年人学外语,记不住那么多约定,只好求援于语言的逻辑来类推,经常"编出"各种各样的说法,外国人听得懂,但听上去不是地道的外语。

数理科学寻求的是完备的规则,在那里,听话人和说话人的逻辑地位是一样的。历史诸科学所要对待的却是一系列完备程度不等的规则。因此,语言学作为一门历史科学,虽能事后能总结出构词法等规律,却不可能根据这些规律预测我们将构造出哪些新词来 ,就像我们不能靠某些历史规律制造历史。这显然远不止是规则与例外的问题。这更远不等于说历史是一大堆偶然性的堆积。在必然和偶然之间有着广阔的原野。

自由词组

约定用法里包含约定,与各式各样的约定相反,在自由表达中,各成分完全根据规则联系在一起,前者由构词法研究而后者属于句法(狭义的语法)范围--"语法研究语言的普遍事实,而词汇学则研究特定的事实"(叶斯帕森,23页)。"马耳朵"是一个自由词组,因为凡"动物名称"加"耳朵"的说法统统成立,例如驴耳朵、牛耳朵、兔子耳朵。根据同样的道理,可?quot;马耳"是自由词组而"木耳"则是约定用法,因为"某耳"这一构造只在"动物"范围内通行。"执牛耳"也是个约定用法,但这属于三级约定。

我们在"扩展法的不足"一节中已指出仅凭扩展法不足以判断约定用法和自由词组之间的区别。按扩展法,"口译"可以扩展为"口头的翻译",因此是自由词组,但按我们的标准,它显然是个复合词,我们不说"嘴译",也不说"口证"。按照我们的理解,"打仗"是一个单词,虽然"打"和"仗"这两个字在一个句子里可能分开甚至倒转:打胜仗,打了三年仗,仗打赢了,仗打了三年。可以说"仗打了三年"却不能说"革改了三年",这是各种单词的语法弹性不同,为了标识这种不同,把"打仗"称作"离合词"也不妨,但这不影响"打仗"和"改革"同为单词。

约定用法既然总有约定在内,所以这个词语多多少少都需要从新学习。但把约定用法连到一起,则是基本的说话能力,不需要每次说一个新词组时再学习什么。只要懂得"经济"也懂得"新闻",就会说"经济新闻"。懂得"子"也懂得"夜",要从新学习"子夜";懂得"子夜",则自然会说"子夜之前"。词是现成造好的,供我们使用,句子还等我们去造,所以我们说"遣词造句" 。

因此,我们只问约定用法的意思,不问自由词组和句子的意思。我会问"’别墅’是什么意思",我不会问"’我昨天晚上到他的别墅去了’是什么意思",除非"别墅"两个字下加了重音。一旦我懂了"别墅",我就知道"大别墅"、"去了别墅"这些自由词组是什么意思。我怎么知道的?这等于问,我从来没有把自然数系列写到过100056,我是怎么知道100055后面跟的是这个数呢?知道100055后面是100056是"知道自然数系列"的应有之义,是对一种规则的掌握,知道"大别墅"、"大耳朵"、"大窗户"是基本的说话能力。依此类推是学习的基本机制。我们用这种方法学会展开一个代数式,用这种方法学会交通规则。

一级约定、次级约定和自由词组构成一个连续统,一端是完全的约定,即没有什么道理和规则的纯粹约定,另一端是完全的自由表达。这三个阶梯之间不是界限分明的,我们很难断?quot;打尖"是一级约定(元素词)还是次级约定(复合词),像"大吵大闹"这样的说法,算它固定词组还是自由词组都行。我们只求从原则上说明这些区别,明白什么是典型的约定用法,如"自行车"(其实你不蹬它就不走)或"单车",什么是典型的自由词组,如"小红车"、"破车"、"新车"、"马拉的车"。不过,一般说来,我倾向于把两难之间的语词视作约定用法。例如"马车",虽可解为马拉的车,但也可以是牛、骆驼、骡子拉着。"火车"可以解作靠火力发动的车,但电力发动的仍?quot;电气火车",和"电车"有别。"小车"则有两种用法,有时是最典型的自由词组:小的车,有时专指小轿车或手推车。此类还有大车(大的车和牲拉的车)、快车(开快车和旅客列车的一种)。

一边是由句法照管的自由表达,另一边是纯粹约定,而渭对级ㄕ飧龅卮蚴亲罡灰馊さ牡卮0?quot;大"这个语素的语词,"大方"、"大员"、"博大",大多数保留"大"的通常含义,这个叫"大米"而那个叫"小米",这个叫"大老爷们儿"而那个叫"小媳妇儿",道理相当明显。但也有些几乎没有规则可循,"大粪"是人的粪便,"大车"却是牲口拉的车。"人排泄的"、"牲口拉的",不包含在"大"的通常含义之中,我们学会什么叫"大车",毋须知道为什么叫它"大车"。但即使在这里,我们也不能断定毫无道理可言,牲口躯体大力气大,人的粪便肥力大。"大"不是一个由三五种固定意义合起来的语词,而是一个提供了某些可能用法的概念空间。

总结:"词"的定义

确定什么是一个词,简单说,就是从两个方面为词划出界线,一方面是词怎样区别于比词小的单位,区别于语素,另一方面是词怎样区别于比词大的单位,区别于短语和词组。语言学家早已指出,由于汉语缺少发达的形态,在确定某一语言单位是不是一个词的时候,"常常要综合几方面的标准"(吕叔湘,12页)。本文讨论了音义结合、造句单位、韵律、约定这些线索,把重点放在了约定这一概念上。所谓"最小的音义结合体"或"语素",就是语言中的基本约定。两个以上语素的组合可以是一种约定,如"他杀",也可以是自由的组合,如"他去"。检验是不是约定的形式标志依靠类推,我们不能从"他杀"类推而得出"我杀"、"你杀"的用法,但从"他去"可以类推而知"我去"、"你去"、"他来"。

凡不是约定的组合,都不是"词",都是自由词组。我们不说"’他坏’这个词"、"’快来’这个词"。但并非凡约定组合都是"词"。"藕断丝连"、"爱你没商量"都是约定组合,但通常不称?quot;词",而称为"成语"、"流行语"等。

日常语言中对"字"、"词"、"语"的区分,我相信主要是以音节数来定的。凡一个音节,我们就说它是一个字。我们倾向于说"’飞’这个字",而不是"’飞’这个词"。双音节的约定用法,我们都管它们叫"词"。由三个字组成的约定用法,名词性的如"图书馆"、"人造革"等,通常称为"词",其它类型的如"只不过"、"面对面"、"敲竹杠"则为短语。凡四个音节的,我们就不愿再叫它"词","一心一意"和"专心"都是次级约定,"分桃"和"瓜田李下"都是三级约定,但我们通常把"专心" 和"分桃"叫作"词",而把"一心一意"和"瓜田李?quot;叫作"成语"或"短语"。只从语义而不从韵律学上来考察是无法说明这些现象的(冯胜利,8-9页)。

依此,我们可以从两个角度来看待"词"这个概念。从语法上下定义:"词"是不包括短语在内的基本造句单位。在这个框架里,我们可以从好多角度来把词分类。从音节来分类,可分为" 单音词如"我"、复音词如"英雄"、多音词如"照相机" (综合词)。从语素来分类,单个语素成词的可称为"元素词"(赵元任称作"单纯词"), 包括单音词、连绵词("葡萄")、混一词("马虎")。从结构上说,语素加词缀的是"派生词",语素加语素的是"复合词"。

但是在日常说法里,我们愿意区别字和词,就是说,把单音词排除在词的范围之外?quot;词"一方面和"字"有分别,另一方面和短语有分别。词和字合在一起,可统称作"字词",词和短语合在一起,可统称作"语词" 。在这个框架内,"自由形式"这个概念在讨论字的时候才有实际意义,它告诉我们哪些字可以直接造句,如"就"、"飞"、"稳"、"重",哪些字只能构词不能直接造句, 如"始"、"扩"、"英"、"雄"。这种区别也许不像很多语法学家设想的那么重要,乃至字典通常都不标明一个字是不是自由形式 。我想主要原因在于那些不能直接造句的字的实际自由程度相差极大,有些可以相当自由地构词,有些则不能 。至于一个多音词是否由自由形式构成,则是个颇为次要的区别。"狐狸"这个词只包含一个语素;"英雄"这个词包含两个语素,但这两个语素都不是自由形式;"强大"这个词包含的"?quot;和"大"都是自由形式。然而,"狐狸"、"英雄"、"强大"都是一个词。由同样的方式我们可以确定"鸡蛋"和"鸭蛋"具有同样的身份,这里无关乎"鸡"和"鸭"一个能单独说而另一个不能单独说。

参考书目:

Austin, J.L.,Philosophical Papers,Oxford Press,1961。

Bloomfield,Leonard, Language, New York, 1933。

Bolinger and Sears,Aspects of Language,Harcourt Brace Jovanovich, Inc.1981。

陈光磊,《汉语词法论》,学林出版社,1994。 冯胜利,《汉语的韵律、词法与句法》,北京大学出版社,1997。

高名凯、石安石,《语言学概论》,中华书局,1963。 Hockett, Charles, A Course in Modern Linguistics, New York, 1959。

洪堡特,《论人类语言结构的差异及其对人类精神发展的影响》,商务印书馆,1997。

胡裕树主编,《现代汉语》,上海教育出版社,1981。

克里斯特尔,《剑桥语言百科全书》,中国社会科学出版社,1995。 刘叔新,《论词的单位的确定》,天津人民出版社,1984。

刘叔新,《汉语描写词汇学》,商务印书馆,1990。

陆志韦,《国语单音词词汇》,北京,1938。

陆志韦,《北京话单音词词汇》,载《陆志韦语言学著作集》

(三),1990。

吕叔湘,《汉语语法分析问题》,商务印书馆,1979。

齐冲天,"汉语单音节词的构成问题",载《词汇学论文汇编》,商务印书馆,1989。

Ryle, Gilbert, "Ordinary Language", 载 V.C. Chappell 《Ordinary Language》, New York, 1981。

王力,一,《中国语法理论》,《王力文集》第一卷,山东教育出版社,1984。

王力,二,《汉语语法纲要》,《王力文集》第三卷,山东教育出版社,1985。

王力,三,"词和仂语的界限问题",《王力文集》第十六卷,山东教育出版社,1990。

文炼,"关于研究仂语的两个基本问题",载王松茂主编,《汉语语法研究参考资料》,中国社会科学出版社,1983。 邢公畹,《现代汉语教程》,南开大学出版社,1992。

叶斯柏森,《语法哲学》,语文出版社,1988。 张志公主编,《现代汉语》(试用本),人民教育出版社,1982。

赵元任,一,《语言问题》,商务印书馆,1980。

赵元任,二,《中国话的文法》,香港中文大学出版社,1984。(A Grammar of Spoken Chinese) 朱星,《汉语词义简析》,湖北人民出版社,1981。 王松茂主编,《汉语语法研究参考资料》,中国社会科学出版社,1983。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 yyfangchan@163.com (举报时请带上具体的网址) 举报,一经查实,本站将立刻删除