话题跟踪中静态和动态话题模型的核捕捉衰减

话题跟踪中静态和动态话题模型的核捕捉衰减软件学报ISSN1000-9825,CODENRU_UEWE-mail:jos@JournalofSoftware,____,23(5):11001119[doi:10.3724/SP.J.1001.____.04045]__169;中国科学院软件研究所版权所有.Tel/Fa_:+86-10-62562563话题跟踪中静态和动态话题模型的核捕捉衰减洪宇+,仓玉,姚建民,周国栋,朱巧明(苏州大学计算机科学与技术学院,江苏苏州215006)DescendingKernelTrackofStaticandDynamicTopicModelsinTopicTrackingHONGYu+,CANGYu,YAOJian-Min,ZHOUGuo-Dong,ZHUQiao-Ming(SchoolofComputerScienceandTechnology,SoochowUniversity,Suzhou215006,China)+Correspondingauthor:E-mail:hongy@HongY,CangY,YaoJM,ZhouGD,ZhuQM.Descendingkerneltrackofstaticanddynamictopicmodelsintopictracking.JournalofSoftware,____,23(5):11001119./1000-9825/4045.htmAbstract:Topictrackingisataskinresearchonidentifying,miningandself-organizingrelevantinformationtonewstopics.Itskeyissueistoestablishstatisticalmodelsthatadaptthekindofnewstopic.Thisincludestwoaspects:oneistopicalstructure;theotheristopicevolution.Thispaperfocusesoncomparingandanalyzingthefeaturesofthreemainkindsoftopicmodelsincludingwordsbag,hierarchicaltreeandchain.Differentperformancesofstaticanddynamictopicmodelsaredeeplydiscussed,andatermoverlappingratebasedevaluationmethod,namelydescendingkerneltrack,isproposedtoevaluatetheabilitiesofstaticanddynamictopicmodelsontrackingthetrendoftopicdevelopment.Onthisbasis,thispaperrespectivelyproposestwomethodsofburstbasedincrementallearningandtemporaleventchaintoimprovetheperformanceofcapturingtopickernelsofdynamictopicmodels.E_perimentsadopttheinternational-standardcorpusTDT4andminimumdetectionerrortradeoffevaluationmethodproposedbyNIST(NationalInstituteofStandardsandTechnology),alongwithdescendingkerneltrackmethodtoevaluatethemaintopicmodels.Theresultsshowthatstructuraldynamicmodelshavethebesttrackingperformance,andtheburstbasedincrementallearningalgorithmandtemporaleventchainachieve0.4%and3.3%improvementrespectively.Keywords:topictracking;statictopicmodel;dynamictopicmodel;descendingkerneltrack;bustyfeaturebasedincrementallearning;temporaleventchain摘要:话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3类主流话题模型的形态特征,尤其深入探讨了静态和动态话题模型拟合话题脉络的优势和劣势,并提出一种基于特征重叠比的核捕捉衰减评价策略,专门用于衡量静态和动态话题模型追踪话题发展趋势的能力.在此基础上,分别给出突发式增量式学习方法和时序事件链的更新算法,借以提高动态话题模型的核捕捉性能.实验基于国际标准评测语料TDT4,采用NIST(NationalInstituteofStandardsandTechnology)提出的最小基金项目:国家自然科学基金(61003152,60970057,60873105,909____4,60970056);国家高技术研究发展计划(863)(____AA收稿时间:____-04-26;修改时间:____-12-15;定稿时间:____-04-28011102);国家教育部博士点基金(____3____10006);苏州市应用基础研究计划基金(SYG____30)

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?