意义组合原理及汉语中的“词”处理

意义组合原理及汉语中的“词”处理王淑华①(上海大学文学院,上海200444)摘要:从表层看,汉语中由字组词的情况很复杂,语法与语义之间不存在对应关系。以意义组合原理为依据,可把汉语中的复合词分为两类,一类是不遵循意义组合原理的原子词另一类是遵循意义组合原理的组合词,组合词的意义可以从组成成分和语法结构的意义中求解出来。通过意义组合原理,描写并分析语素构词的主要形式,挖掘构词层面上语法与语义之间的对应关系,可为计算机处理未登录词提供语言学知识的支持。关键词:词;原子词;组合词;意义组合原理;:文献标识码::一、汉语中的“词”汉语研究中关于词的争论由来已久。我国传统汉语文的研究以“字”为基本单位,“词”专指“虚字”。汉语语言学研究中的“词”是从西方语言学中引进的,最早引进“词”这个概念的是章士钊的《中等国文典》。自此,“词”逐渐成为研究汉语语法的一个基本单位。从引进“词”的概念到现在已经过了一百多年。在汉语是否存在“词”这一级语法单位的问题上,学界已基本达成共识。关于“词”的研究也在不断地向各个方向拓展,但是,传统的“字”的概念对“词”影响很深。什么是“词”,如何确定汉语中的“词”,如何辨别“词”与“非词”,仍然没有明确的结论。在认定某一个语言单位是不是“词”的时候,“独立运用”、“语素的自由或粘着”、“音节长度”、“使用频率”、“意义的透明度”等因素通常都会影响我们的认识与判断。一般认为,区分词和语素,是看能否“独立运用”。而区分词和短语,要比区分词和语素更难。吕叔湘指出:“词和短语的区分大致涉及五个因素:第一,这个组合能不能单用,这个组合的成分能不能单用;第二,这个组合能不能拆开,也就是这个组合的成分能不能变换位置或者让别的语素隔开;第三,这个组合的成分能不能扩展;第四,这个组合的意义是不是等于它的成分的意义的总和;第五,这个组合包含多少个语素,也就是它有多长。”[1]这五个因素中,前三个属于语法标准,后两个属于词汇标准。在确定“词”的实践中,语法标准和词汇标准经常不太一致。也就是说,同一个语言单位,运用语法标准和词汇标准有时会得出不同的结论。而且,对于同一个标准,不同的人理解也不太相同。在一些语法著作中,我们经常能看到互相矛盾的论述。譬如,一般都认为,词是“最小的能独立运用的语法单位”,它以“最小”区别于短语,以能“独立运用”区别于语素。但是,“独立运用”有着不同的内涵。张斌指出:“独立运用”或称之为“自由运用”,包括下列内容:第一,能单说的(包括能单独回答问题的)最小语言单位。第二,虽然不能单说,但是在句子中抽去可以单说的词之后,剩下的又不属于词的一部分,也是词[2]。符淮青指出:词的“能独立运用”的特点主要表现在以下两个方面:一是能单说,能单独回答问题。二是虽然不能单说却可以独用,即充当词组或句子的成分。[3]对“独立运用”的①作者简介:王淑华(1976-),女,安徽安庆人,上海大学文学院博士后,研究方向为计算语言学、现代汉语语法。不同理解,关系到虚词的词类资格确定问题,。按符淮青的标准,介词、连词、助词、语气词等虚词是不能称其为“词”的。又如,一般认为,词表达的概念比较单纯、凝固,复合词的意义不能是语素所表示意义的简单相加,即不能简单地从语素义求解出词义。据此可以判断,“白药”、“白领”是词,而“白马”、“白布”是短语。但是,有些词典中也收录了“牛肉、羊肉、运费、用法”等可以“见字知义”的语言单位,这或许是考虑到这些单位的音节长度和使用频度等因素。为了避开关于“词”的争论与矛盾,有学者提出,要区分语法词、词汇词、书写词。但是,对于汉语来说,没有分词连写的习惯,短期内也不可能实现分词连写,所以“书写词”没有什么意义。至于由词典提供的“词汇词”,在语法分析时作用不大。重要的仍然是“语法词”。还有些学者提出了“韵律词”、“语音词”、“语境词”、“理论词”等术语。随着中文信息处理事业的发展,从便于工程处理的角度出发,又出现了“切分单位”、“分词单位”、“切词单位”、“拼写单位”、“信息词”...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?