统计分析《红楼梦》代词使用特色及作者辨析

统计分析《红楼梦》代词使用特色及作者辨析作者:卫晶淼单位:吉林大学中文摘要:本文通过对《红楼梦》中代词的穷尽考察,简要分析其特色,并在获取数据经过筛选后,对部分代词在前八十回与后四十回中的使用频率分别做参数估计,并对结果进行比对、分析、阐述,进而得到结论:《红楼梦》前八十回与后四十回确非同一人所著。关键词:《红楼梦》代词统计学参数估计SystemicstudyonDreamoftheRedChamberWei激ngmiao激nlinUniversityAbstract:DreamoftheRedChamberhasthetitleof“pearloftheartisticimperialcrownoflanguage”,hasbeenalwayspraisedbypeople.Therearealotofpeoplewhostudyit,butSofar,therehasn'tbeenanyworksthatdosystemicresearchonthegrammarof"DreamoftheRedChamber”,althoughsomeprogresshasbeenmade.Thatiswhyitisnecessarytomakeasystemicstudyon“DreamoftheRedChamber”andhaveanall-roundanalysisofitsgrammarwithstatistics.Thepurposeofthispaperisalsobasedonthispoint.Usedpointestimateandintervalestimatetothebothindependentsampleofthetwopartof“DreamoftheRedChamber”,itprovethat“DreamoftheRedChamber”isnotwrittenbytheonlyonewriter.Keywards:DreamoftheRedChamberPronounfunctionStatisticspointestimateintervalestimate《红楼梦》是我国古典小说的巅峰之作。自其问世以来,研究者甚众,研究领域甚广,从索引、考证到人物形象、艺术成就等诸多方面成果丰硕,而《红楼梦》的语言研究较之颇为清冷。普遍认为:用统计方法研究语法演变,值得仿效。而且此前已经有学者运用统计学方法,判定某些有争议的作品,作者谁属的问题。而代词系统可以说是比较能反映一种语言某个时期语法特点的一个方面,在研究近代汉语时,吕叔湘先生就是从“指代词”这一角度着手进行研究的。而且代词在文章中可替代性强,所以能够很好地反映出作者的语言习惯和叙事风格。因而本文以代词为突破口,用正态分布(或经验分布)描述作者使用代词的频率,正态分布的参数可以体现作者使用代词的风格,进而统计、分析《红楼梦》前八十回与后四十回语言特色的差异并且加以讨论,或者说验证前八十回与后四十回是否为一人所著。我在考察过程中,以人民文学出版社出版的《红楼梦》为准,逐个找出所要研究的代词,统计了每个章节各个代词出现的次数,然后算出其均值与方差,再对前八十回中一些有代表性的词汇做参数估计的区间估计,再以后四十回的均值与之比对,得出结论。一、数据地获得和预处理通过字数统计,知《红楼梦》前八十回的总字数为550725字,后四十回为275019字。各词项在前八十回和后四十回出现的总次数如下:表1前八十回词项出现次数统计值词项我我家我们吾咱咱们余出现次数5403218071614047词项侬俺你你们你家汝奴出现次数10443006871582词项尔他他们他家伊渠自己出现次数1345066155320503词项自家这此那彼每各出现次数1252041034292978252397词项谁孰甚什么何如何何妨出现次数659230116656421417词项多少早晚怎么怎样怎出现次数105346431319表2后四十回词项出现次数统计值词项我我家我们吾咱咱们余出现次数238015402302161词项侬俺你你们你家汝奴出现次数011707336631词项尔他他们他家伊渠自己出现次数3619802362770331词项自家这此那彼每各出现次数5242233419851329185词项谁孰甚什么何如何何妨出现次数220214731191472词项多少早晚怎么怎样怎出现次数49144872824按照人称代词、指示代词、疑问代词分类后,用excel画出各个词项在其所属的类别中的比例的圆环图,可以比较直观的看到多数词在前八十回和后四十回中的比例是有很明显差异的,但是也有少数无明显差异的词汇。为下一步分析准备;用SPSS给每列数据画直方图,剔除不符合正态分布的,如:尔、吾、伊等等。再分析留下的数据,考虑每章长短不一,字数本有差异,算出其在一章中所占比例就可以消除这种差异;然后计算其比例的均值和方差,结果如下:表3前八十回中词项比例的统计量词项我我们咱们你你们他他们均值0.0097270.0014140.0007160.0078180.0011930.0082190.001064方差0.0039970.0008990.0005450.0...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?