关于红楼梦的统计学

《红楼梦》前80回与后40回某些文风差异的统计分析韦博成一、引言在统计学应用的诸多领域中,文学著作的统计分析是一个饶有兴趣的分支。美国斯坦福大学教授Efron(19761987)和他的学生曾经对莎士比亚的著作进行过相当深入的统计分析(见[1],[2]),并指出:1985年发现的一篇“无名氏”诗稿(仅9节429字)确为莎士比亚所著。Efron是当今国际上最著名的顶级统计学家之一,他们的工作在当时引起很大反响,另一位国际顶级统计学家Rao誉之为“一曲统计学的赞歌”(见[3])。《红楼梦》是我国四大名著之首,而且有很多悬而未决的问题,把统计学的定量分析方法引入红学研究是很自然的。早在1980年,在美国威斯康星大学召开的“首届国际《红楼梦》研讨会”上,该校华裔学者陈炳藻教授首次报告了他在这方面的研究工作(见[4],[5]),此后还出版了专著(见[6])。陈教授将《红楼梦》120回分为三组,每组40回,并将《儿女英雄传》作为对照组进行比较研究。他从每组中任取8万字,挑出名词、动词、形容词、副词、虚词这5种词,然后运用统计学方法算出各组之间用词的相关程度,结果发现:《红楼梦》前80回与后40回所用词汇的相关程度远远超过《红楼梦》与《儿女英雄传》所用词汇的相关程度,并由此推断:前80回与后40回均为曹雪芹一人所作。但是,我国华东师范大学陈大康教授得出了迥异的结论(1987,[7])。他也把《红楼梦》120回分成三组,每组40回,并统计了其中所含词、字、句等88个项目。他发现,这些词在前两组出现的规律相同,而与后40回却不一致;关于用字特点和句式规律,前两组也是惊人的吻合,而后40回则迥异。由此推断:后40回非曹雪芹所作(但含有少量残稿)。同时,复旦大学李贤平教授又提出“成书新说”(1987,[8])。李教授选择了47个虚字为识别特征,诸如:“之、其、或、亦、了、的、不、把、别、好”等等,利用各种统计方法(主成份分析、典型相关分析、聚类分析等),对它们在书中各回的出现频率进行统计分析,探索各回写作风格的接近程度,并用三个层次的聚类方法对各回进行分类。由此提出了成书过程新观点:《红楼梦》前80回是曹雪芹根据《石头记》增删而成;而后40回则是曹家亲友搜集整理原稿加工补写而成。李贤平教授的观点也受到质疑,例如,陈大康教授(1988,[9])认为其“成书新说”难以成立。台湾成功大学王三庆教授也提出若干不同意见(1994,[10])。以上三位学者都是从《红楼梦》的词语结构出发进行统计分析,他们按照词语的一定规则进行量化,得到数据集,从而应用统计方法推断前80回与后40回之间的差异。这方面的研究已经比较充分,本文拟从另一种观点出发研究前80回与后40回之间的差异。其主要特点是分析《红楼梦》中着力描写的若干情景,通过量化得到数据集,然后应用统计方法推断前80回与后40回之间的差异。具体来说,我们选择了花卉、树木、饮食、医药与诗词这5个情景指标,统计出它们在前80回与后40回中出现的频数,并应用统计学中的“等价性检验”方法来检验二者的差异。由此得出结论:《红楼梦》前80回与后40回在饮食和花卉的描写上确实存在非常显著的差异,其可信概率不低于98%;同时在树木的描写上也存在明显差异,其可信概率不低于95%。这样,我们就依据统计学原理提供了一个强有力的证据,说明《红楼梦》前80回与后40回在某些重要的情景描写上确实存在非常显著的差异。至于导致这些差异的原因,还涉及到人文和社会方面的诸多因素,仅用统计学方法可能是无法解释清楚的,因此本文未有讨论。本文第一节列举了《红楼梦》中着力描写的5个情景指标,并经过量化得到相应的数据集;第二节对这5个数据集进行等价性检验,计算出相应的p-值,并指出《红楼梦》前80回与后40回在某些文风上所存在的显著性差异,从而得到本文的本要结果;第4节结束语对本文的研究作若干注记;附录简要说明了数据集的生成过程。一、情景指标的数据集据2007年10月10日南京“现代快报”报道(见[11]),南京林业大学汤庚国教授另辟蹊径,从海棠文化出发,分析《红楼梦》前80回与后40回的差异。汤教授主要是从人文花卉方面进行分析,但是他们也提供了一组数据,即《红楼梦》前80回有16回涉及...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?