利用VBA技术和EndNote软件建立查新报告数据库

利用VBA技术和EndNote软件建立查新报告数据库〔摘要〕针对查新报告中各种有效信息未被整理、利用的现状,提出了一种利用VBA技术和EndNote软件建立查新报告数据库的方法。首先,利用WordVBA技术,依据文本特征从Word文档里抽取查新报告元数据项,之后利用ExcelVBA技术将Word中的元数据项变为Excel数据,同时将Excel数据转换为EndNote可识别的文本文档从而建立了基于EndNote软件的查新报告数据库。〔关键词〕查新报告;数据抽取;VBA技术;EndNoteDOI:10.3969/j.issn.1008-0821.2015.08.025〔〕G2507〔文献标识码〕B〔〕1008-0821(2015)08-0131-06查新报告是查新机构根据查新委托书的要求,通过查新项目的查新点与所查文献范围内的文献信息进行比较分析,对查新点做出新颖性判别后,以书面形式撰写的客观、公正的技术文件。作为一种针对新颖性的鉴定报告,与其它科技类数据源相比,具备创新技术路线清晰、创新主题明确、创新结论对比客观、有序等优点,并客观反映出了创新主体、创新内容、创新领域、创新程度等各类信息。但现实中查新报告经常仅作为一次性鉴定材料,用完即废,其包含的各种创新信息并未被有效地挖掘、利用。其实,自2001年1月1日开始实施的国家科技部制定的《科技查新规范》就规定每个查新项目的《科技查新报告》需登记著录到国家查新工作数据库[3]。但是,到目前为止国家查新工作数据库还没有建立,各查新站的查新报告存放方式还是以纸质加电子文档形式存放为主。虽然有个别查新机构使用查新数据库管理[4],但是购进一个数据库系统价格较为昂贵,且不同系统导出的数据文档都不统一,极难共享,这不利于今后全国查新报告统一数据库的建立。同时这些系统需要手动输入各种字段信息,如项目名称、委托人、委托单位、检索词等等,这不但费时费力,还很容易出错。针对这一问题,本文提出一种利用VBA技术和EndNote软件建立科技查新报告数据库的简易方法,与此同时还可以利用这些数据方便地实现对查新报告的统计和深度挖掘。1建设查新报告数据库的设想目前,几乎所有科技查新机构都选择用Word软件编写查新报告。Word文档易于编辑、修改、呈现文件内容,但其本身不包括语义信息,不易于数据信息的查询和交换。介于此笔者设计了采用WordVBA技术和EndNote软件实现构建科技查新报告数据库的简易方法。具体设计方案如图1所示。8查新报告数据库设计具体流程如下:(1)根据查新报告Word文档中分析出的固定文本特征,利用WordVBA技术抽取查新报告元数据项,得到包含元数据项内容的Word文档。(2)利用ExcelVBA技术将Word中的元数据项抽取、转换为Excel工作表中数据,此时的Excel工作表可实现元数据项统计、基于共现与耦合的元数据项深度挖掘,同时Excel数据表格可以方便转换为各种数据类型,如XML数据、CSV数据、DIF数据交换格式、SYLK符号链接格式,从而可以导入各种主流数据库和数据分析软件。(3)依据绝大多数科技查新站都在使用EndNote软件的现状,以及EndNote软件创建数据库的特点,本文将Excel数据转换为EndNote可识别的文本文档。(4)将数据导入EndNote,建立基于EndNote软件的查新报告数据库,数据库可实现各种统计和检索功能。2查新报告数据库的具体建立过程21查新报告中元数据项的抽取对一篇正规的查新报告本身来说,虽然不同部委(教育部、科技部)的查新报告撰写规范略有不同,但都严格遵循其定义的格式,具有严格的编排结构。如查新报告编号、委托项目名称、查新委托人等待抽取的数据内容在查新报告Word文档中都有固定的文本特征,且多数待抽取的数据内容有可参照定位的文本信息。为此,笔者针对不同特征的数据内容项编写了对应的元数据项抽取规则。同时为了使查新报告抽取时更加准确、智能化,在窗体控件中增加了分子式下标修正、添加字段、中文数据库日期修正、签字日期修正、生成查新费用等,并编写了相应的程序。图2为窗体界面。图2科技查新报告元数据项抽取界面图24利用EndNote软件建立查新报告数据库EndNote软件作为参考文献目录的管理工具是由美国科学信息所(ISI)所开发研制的SCI(ThomsonScientific公司)的官方软件[7]。目前绝大多数科技查新站为了提...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?