教学论文-全文搜索引擎检索帮助的改进建议的论文

全文搜索引擎检索帮助的改进建议的论文关键词:全文搜索引擎;检索帮助;改进;建议摘要:针对目前全文搜索引擎的检索效率低,引擎提供的检索帮助不够完善的实际情况,结合并借鉴诸多检索网站的优点,提出了将检索帮助置于显见位置、普及和改进高级检索、在全文检索中引入分类体系、对搜索引擎的信息网站进行主题分类、增加同义词的检索帮助以及引导用户参与设计检索帮助等方面的改进建议。:g252.7文献标识码:a:1003-1588(2012)03-0031-03收稿日期:2012-05-06作者简介:冷玥(1990-),北京大学信息管理系学生。研究方向:信息管理与信息系统。随着以百度、ggle为代表的全文搜索引擎在人们生活中扮演愈加重要的角色人们也提出了在使用全文搜索引擎进行检索过程中遇到的一些实际问题。其中,检索效率低,需要全文搜索引擎提供更加有效的检索帮助是一个突出的问题。1全文搜索引擎的工作原理全文搜索引擎是真正意义上的搜索引擎,全文搜索引擎的数据库是通过一个叫“网络机器人(英文为---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---spider)”的软件,将网络上的各种链接自动获取大量的网页信息,并按一定的规则分析整理而形成的。全文搜索引擎的“网络机器人”是一种网络上的软件,遍布eb空间,能够扫描到一定ip地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站再到另一个网站去收集网页资料。全文搜索引擎的“网络机器人”为保证收集到的信息资源最新、最全,还会再回访已抓取过的网页。“网络机器人”收集的网页,还要由其他程序进行分析,根据一定的相关度算法进行大量的计算建立起网页索引,这样才能添加到索引数据库中。平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当用户输入关键词进行搜索时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排列规则返给用户。综上所述,全文搜索引擎的原理主要分为三个部分:首先是从internet上抓取网页。利用“网络机器人”系统程序从internet上自动收集网页,自动访问internet,并沿着任何网页中所有的统一资源定位符爬到其他网页,再经过多次过程重复,并把爬过的全部网页收集起来;其次是建立索引数据库。利用分析索引系统程序对收集起来的网页内容进行分析,并提取有关的网页信息,通过复杂大量的计算,算出每一个网页针对页面内容中及超链中每一---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---个关键词的相关度,再由这些相关的信息建立起网页索引数据库;最后是在索引数据库中搜索排序。当用户输入关键词搜索后,利用搜索系统程序从网页索引数据库中找出符合所输入关键词的全部相关网页。因为全部的相关网页对所输入关键词的相关度已经计算出来,并对结果进行了优化,然后再由页面生成系统将搜索结果的链接地址和页面内容、摘要等有关内容呈现给用户\[1-3\]。2全文搜索引擎检索帮助存在的薄弱环节目前,全文搜索引擎得到了快速发展和广泛应用,其功能也越来越强大,但仍然存在着检索效率不高的问题,虽然一些搜索引擎和一些具有检索功能的网站设置了检索帮助,但通过分析研究发现,全文搜索引擎检索帮助也有很多薄弱环节,主要体现在受控较弱,很难从一个完整的分类体系的角度为用户提供有价值的检索帮助,也可以理解为很难将用户的检索范畴限制在想要检索的信息存在的范围内,用户需要在返回的海量信息中寻找自己真正需要的信息。整个网络就是一个超级大型的信息资源数据库,而且无法用一个完整的分类体系对信息资源进行分类、分区,用户依然需要经过对信息资源内容进行筛选,如果用户面临的信息资源来自较大的范围,就不得不花大量的时间在浩如烟海的大型信息资源数据库中进行信息的筛选。因此可以将思路锁定于寻找一种可以缩小检索范围的检索---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---帮助之中,从对全文搜索引擎检索帮助的分析研究中发现对其检索帮助进行改进和完善是必要的和可行的\[4,5\]。3全文搜索引擎检索帮助的改进建议经分析研究,针...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?