引文网络中文献深聚合方法与实证研究-以WOS数据库中ML研究论文为例_1

引文网络中文献深度聚合方法与实证研究以WOS数据库中XML研究论文为例从时间发展上来看,聚合3和聚合4的文献发表较早,其次是聚合2,聚合1中的文献绝大多数是近5年的研究成果。如果说早期的研究内容更多的是围绕对于XML文档本身的结构、特征及应用环境等内容的话,聚合1的研究表现出了明显的深化,这种深化充分体现在聚合1中文献的研究主题上。5基于权值“高地”的聚合5.1权值“高地”聚合方法在一个连通的引文网络中,其平面的X、Y坐标分布结构由整个网络的结构决定,可以通过一定的算法(如弹簧算法)使网络整体的二维布局更为合理,在此基础上以各文献节点或引文关系的核心程度权值作为Z坐标,利用R软件绘制引文网络的三维立体图形[8](见图4)。所谓权值“高地”,是指在这样的三维结构中一些特殊的聚合,其中文献节点或引文关系核心程度权值要大于其周边文献节点或引文关系核心程度权值,从而产生一个相对“高地”,即这些聚合产生的原因是其中的文献节点或引文核心权值相对较高。图4整体文献的等高线三维分布本文主要通过获取引文“高地”聚合间接获取文献节点“高地”聚合。令网络N=(A,C,1),网络中的引用关系权值1:C→R,有非空文献子集PA,如果存在最大生成树T,其中引用关系权值的最小值大于或等于该聚合中文献P到邻近其他文献集合之间引用关系的权值,则称该最大生成树T为引文权值“高地”聚合,即公式(4)构成最大生成树T的文献子集P生成了一个文献权值“高地”聚合[9]。5.2聚合结果对于权值“高地”聚合而言,聚合中文献数量上限的设定十分重要,如果规模过大则聚合结果反映主题结构的功能将被大大削弱,通过不断测试后,选取40作为文献数量的上限。通过计算,共获得引文相对“高地”聚合735个,其中大多数聚合文献数量都很小,聚合中文献数量为2的聚合有531个,包含文献数量最多的聚合中有34篇文献。权值“高地”聚合规模的分布图与结构图分别如图5、图6所示。通过对聚合结果的进一步分析发现,以聚合1和聚合113为代表的一类聚合特点突出,与其他的文献聚合相比,这两个聚合中文献数量多,且文献权值极高,整体的重要性很高(见表4)。如果从整体的三维效果上来看,这类聚合的可视化效果是“山脉式”的权值“高地”聚合。图5权值“高地”聚合的规模分布图6权值“高地”聚合结构图(局部)从研究主题上来看,聚合1中的文献囊括了阈值聚合1中的全部文献,数量进一步增加到33篇,由于更多文献的加入,该聚合中研究主题表现得更为集中,主要是关系数据库环境下的XML研究,出现频率较高的关键词有功能依赖与多值依赖(共35次)、约束(共21次)、关系数据库和关系数据集(共18次)、公理化(共19次)。聚合2中26篇文献出现最多的关键词有查询(共27次),包括查询语言、查询优化、查询算法;半结构化(11次),包括半结构化数据实例、半结构化数据模型和半结构化数据查询;数据(16次),包括数据提取、数据合并、数据共享和数据挖掘。语义(10次),包括语义功能、语义模式匹配、关系语义;Web(8次),Tamino(7次)。聚合2中的文献关于XML应用的相关研究较多。表4两种类型的“高地”聚合结果聚合序号聚合规模文献文献权重最大值文献权重最小值1346、76、151、237、520、776、840、1087、1598、2134、2364、3086、3222、4677、4695、6102、6294、6370、6993、6994、8105、8773、9354、10174、10797、11008、11323、11713、11923、12191、12235、13261、13748、142880.13590.0108113263107、4708、7905、8494、9484、9614、10313、10554、11009、11679、11710、12137、12271、13182、13784、13785、13787、13788、13791、13797、14178、14217、14327、14333、14334、143450.1060.008161245、171、194、687、3627、4701、7486、7665、8384、10891、13279、132810.00030.0000471649、2048、2768、3809、5255、6326、6869、7513、7555、7735、8060、8488、8860、9844、10076、115280.00020.00002以聚合6与聚合7为代表的一类聚合同样具有鲜明的特点,从绝对数量上来说,这一类聚合中包含了一定数量的文献节点,然而其绝对高度相对较低,如果从整体的三维效果上来看,这类聚合的可视化效果是“丘陵式”的权...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?