基于TPI的新闻媒体信息数据库建设-以广州大学图书馆媒体眼中的广州全文数据库为例

基于TPI的新闻媒体信息数据库建设以广州大学图书馆《媒体眼中的广州》全文数据库为例摘要:本文介绍了新闻媒体信息数据库的发展现状,分析了数据库的基本特点,从构建数据库的数据采集、数据加工、数据发布和输出、数据检索几个环节出发,以广州大学图书馆《媒体眼中的广州》数据库为例,着重阐述了基于TPI的新闻媒体信息数据库建设及其建设中注意的问题。关键词:新闻媒体,媒体信息,数据库,TPI,数据库建设1概述新闻媒体是信息传播的重要载体,是报道社会经济、政治文化的主要渠道。随着计算机和网络技术飞速发展,新闻媒体信息网络传播已成为新视点,各新闻媒体注重媒体信息的电子化,相继推出网络版,这不仅方便了媒体信息的网络传播,加速其信息的传播力度,同时也为建设新闻媒体数据库提供了方便,促进了新闻媒体信息数据库的建设与发展。综观国内外新闻媒体信息数据库建设情况,国外起源较早,始于20世纪70年代[1],经过三十多年的发展,出现了一大批包括Factiva、ProQuest、LexisNexis、慧科等新闻媒体信息数据库服务商和服务产品,逐步形成新闻媒体信息开发与服务的产业化,以Factiva为例,它将DowJohesInteractive和ReutersBusinessBriefing两大资源库的9000多种新闻媒体信息整合在一起,提供118个国家22种语言出版的重要媒体信息[2],影响广泛。我国新闻媒体信息数据库起步相对较晚,始于20世纪80年代[3],---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---且规模较小,档次较低,没有形成产业化,当前最具商业化的新闻媒体信息数据库有三家,分别是:由新华社和北京电讯工程学院合作开发的《新华社多媒体数据库》;TRS与人民日报社合作开发的《媒体全文按词检索数据库》以及CNKI的《中国重要报纸全文数据库》。就图书馆而言,开发建设媒体数据库以广东中山图书馆开发的《决策内参》系列产品、广州大学图书馆的《媒体眼中的广州》(以下简称《媒体广州》)全文数据库以及温州市图书馆的《媒体看温州》数据库为最成功。新闻媒体信息数据库除与一般数据库具有共同的技术要求外,还有自身的特点:首先是新闻媒体数据库信息采集量大,仅就报纸而言,全国各类报纸2005年有1926种[4],其承载的信息当以海量计算;其次是数据库数据源对象信息时效性强,大量信息需及时采集、加工、发布甚至打印呈送到服务对象手中,信息价值时效性很强,时间观念要求较高;第三是采集信息呈现专题性,新闻媒体海量信息决定了搞综合性数据库难度很大,开发建设专题性数据库是比较切实可行的选择,针对用户需求不同,确定数据库信息采集范围,有针对性地加工,最终提供满足客户需要的信息产品;最后是信息内容具有时事性,新闻媒体信息一般是对当前政治法律、社会经济以及科教文卫体等领域的新闻报道,追求快速、准确与简洁,反映的是当前社会发生的一些热点事情,具有时事性特征。2基于TPI的新闻媒体信息数据库建设实现思路2.1TPI[5]简介TPI是由清华同方光盘股份有限公司开发的数字图书馆建设与管理系统一—“清华同方数字图书馆管理与建设平台”,是一个全面系统的数字图书馆建设与管理平台软件,是清华同方光盘股份有限公司在建设和管理的知识信息资源库(包括CNKI专业知识仓库和CNKI数字图书馆)的基础上,结合自身开发与应用经验,推出的一套成熟的数字图书馆建设与管理系统。TPI是基于非结构化文档管理而开发的大型智能内容管理系统,该系统以全文检索数据库(FTS)为核心,采用流行的D/S浏览器的检索方式和先进的三层C/S架构,能够同时管理文字、图片、多媒体等信息,并提供全文检索服务,支持网页的动态发布,是一个面向内容管理的应用、管理和信息发布工具。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---TPI系统具有以下突出特点:●全文检索基于分词策略,提供中英文混合检索、渐进检索,支持SDK二次开发。●提供灵活的内容发布平台,可依用户需要的形式将数据发布到Internet上。●提供异构统一检索平台,在统一的检索界面中,可以同时检索多个异构的数据库。●提供自动关联功能,用户可以指定库与库之间、记录与库之...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?