基于聚类汉语学习者兴趣分组算法探究

基于聚类汉语学习者兴趣分组算法探究摘要:本文提出了一种基于模糊聚类分析中传递闭包法的汉语学习者兴趣分组算法,从日志整理出特征,得出聚类结果,为汉语教学个性化、风格化提供了依据。关键词:国际汉语言文化传播;聚类分析;传递闭包:TP391.6文献标识码:A文章编号:1674-7712(2012)12-0169-01一、引言对外汉语网络教学是国际汉语言文化传播的有效手段之一。教育个性化理论认为每个学习者的行为特征都不一样,因此,学习需求和语言接受能力对于每个汉语学习者也就不尽相同。在汉语网络教学中对学习者进行科学的有针对性的分析与设计,将使得学习更具个性化、风格化,学习效果更好。二、基于传递闭包兴趣分组聚类分析是指将物理或抽象对象的集合分组成由类似的对象组成的多个类的分析过程。(一)传递闭包法传递闭包法是将经典集合理论中的等价关系应用到模糊集合中,产生新的模糊等价关系。该模糊聚类分析方法是按照传递闭包不同截集入(0W入W1)来进行分类。首先要得到模糊相似矩阵R,然后求出矩阵R的传递闭包T(R),即包含R的---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---最小模糊传递矩阵,最后通过T(R)进行聚类,即将模糊关系矩阵足传递性,所以要对模糊相似关系进行处理,可以通过求传递闭包来满足传递性,形成模糊等价关系,只要设定阀值就能将这种关系直接用于聚类,得到聚类分析的结果。(二)兴趣分组聚类算法定义1:设学习者的兴趣集则学习者第i个兴趣为li,可表示为Ii=(Ki,Qi),Ki为li的名称,Qi为li在兴趣集I中的重要程度。定义2:第i个兴趣的日志挖掘信息表示为Li={LiO,Lil,Li2,Li3,Li4}。式中,LiO为兴趣i的初值,Lil为学习者访问兴趣i的资源节点数,Li2为学习者收藏兴趣i的数量,Li3为评论兴趣i的数量,Li4为访问兴趣i页面花费的总时间。通常,学习者对某种兴趣的喜好度可以用Lil到Li3这几种行为表示。考虑到学习者对兴趣喜好度高的资源上花时更长,故加入Li4并对其进行预处理。设通过日志获取访问开始到结束的本次访问时间t,tl表示最小阅读时间限制,t2表示是最大阅读时间限制。当tWtl时,认为学习者没有访问该页面;当t^t2时,认为学习者并不一定特别关注该资源。学习者兴趣的计算:式中,a和B是可以由相关教育专家根据统计结果作出改变的参数,IiO为更新后的值。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---通过以上计算能得出学习者每种兴趣的权值,这里分两种情况:若考虑学习者只有一种兴趣,就以权值最大的的兴趣来进行分组;若认为学习者有多种兴趣,则可以采用以下模糊聚类传递闭包方法进行分组:首先,用向量相似度法计算两个学习者间的相似度,将每个学习者的兴趣看作一个由多关键字组成的向量,用向量的夹角余弦表示相似度,计算公式如下:式中,Qi为学习者每种兴趣的权值。Aul*u2越接近1,则表示两个学习者的兴趣越接近,若Aul*u2=l,则表示两个学习者的兴趣完全相似。然后,以学习者为行、列构造相似度满足对称性和自反性矩阵SoS中的元素表示学习者间的相似度。一般S不具传递性,要将s转换模糊等价关系,求S的包含关系其最小的传递性矩阵T,然后设置截集君(0WXW1,取值越大分类精度越高)的大小进行聚类。以下是总结兴趣分组聚类算法:1.预处理输入值Web日志信息,得到如浏览数、评论数、收藏数、浏览时长等所需要的信息;2.利用上一步的结果,通过公式2和公式3得到学习者每种兴趣的权值Qi;3.通过公式3得到学习者间的兴趣相似度Aul*u2,构建相似度矩阵S;---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---4.通过S计算出传递闭包T;5.确定X值,输出值=学习者的聚类模式。三、算法评估本文的系统评估模型={个人满意度,学习效果},主要从个人满意度和学习效果两个指标来进行评估。满意度通过调查问卷的形式采集,学习效果通过学完后测试来完成。根据智力活动复杂程度和国外学习者实际情况,将认知能力目标分成三个层次:识记、理解、应用,每层次可给出1-5分。设D'={DI',D2,,D3'},D1,、Ds,、D3'分别表示教育专家决定的三层次学习效果分量隶属度,且or+D2'+D3'=lo设F={F1,...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?