元搜索引擎优化的研究

元搜索引擎优化的研究本文档下载自文档下载网,内容可能不完整,您可以复制以下网址继续阅读或下载:http://doc.xuehai.net/d548255553.html计算机光盘软件与应用CDSoftwareandApplications2012年第10期工程技术元搜索引擎优化的研究李忻睿(吉林大学,长春130012)摘要:元搜索引擎通过调用多个独立搜索引擎,从而提高了检索结果的覆盖面。本文简述了元搜索引擎的运作原理,研究了元搜索引擎的核心技术,阐述了它的局限性以及未来发展趋势,并对其局限性提出实用可行的优化方案。关键词:元搜索引擎;成员搜索引擎;网页去重;结果排序中图分类号:TP393.09文献标识码:A文章编号:1007-9599(2012)10-0060-02一、引言随着网络科技的迅猛发展,网络深入人们的生活。如何在网络中寻找需求度额信息显得尤为重要。据Cyceillance于2000年7月10日公布的一项研究表明,目前Internet上已有21亿个唯一URL地址的公开网址,并且仍以每天超过700万的惊人速度增长。十余年过去,信息的膨胀与爆炸,使用户们不知所措。正如Wurman所说,信息爆炸给人们带来的事信息焦虑。用户对信息的需求各不相同,于是搜索引擎逐渐成为web用户不可或缺的工具。元搜索引擎(metasearchengine,简称MSE)作为一个新的搜索技术的研发领域,已经在实践中初步显示了其便捷性和重要性。虽然目前元搜索的研究有不断的发展,但是由于依赖各个独立的搜索引擎,元搜索引擎在处理查询输入和输出显示时均可能出现问题,如检准率不易控制检索时间过长,对高级检索的支持有待改进,检索结果不能很好体现等等。因此,元搜索的优化研究具有一定的时代意义和创新性。二、元搜索引擎的原理传统搜索引擎分为全文搜索引擎、目录索引、元搜索引擎。元搜索引擎又称多搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布http://doc.xuehai.net/d548255553.html于网络的多种检索工具的全局控制机制。目前国内的搜索引擎发展迅速,市场也很广阔。但是,元搜索引擎的发展很缓慢,相关网站也比较少。元搜索引擎由3部分组成,包括请求提交、检索接口代理、检索结果显示。(一)请求提交:负责实现用户的检索要求,检索内容可以是单个关键词、短语,也可以是句子,可以由用户选择搜索引擎组合,也可以由默认的搜索引擎搜索,还可以由用户选择单个搜索引擎进行搜索。(二)检索接口代理由于各个独立的搜索引擎所采用的搜索算法和数据库存在很大差异,需要将用户检索的请求转化成各个成员搜索引擎所要求的格式,包括是否支持布尔检索、是否提供自然语言查询等高级检索服务,逐一做出适应各个源搜索引擎的转换,以提高检准率。(三)检索结果显示将所有来自源搜索引擎的搜索结果进行二次处理,包括对结果的去重和排序,并将处理的结果按照统一格式输出给用户。难点在于对数据的去重和排序。目前的检索处理方法主要是“将响应最快的搜索结果先返回”、“位置排序法”、“摘要排序法”等,各有利弊,检索处理算法好坏直接影响检索时间、检索覆盖率、排序质量等。以上为元搜索引擎的组成部分,也是进行设计元搜索引擎的三个步骤。三、现有元搜索引擎存在的缺陷而对于国内现在已经存在的元搜索网站,例如搜魅网(someta)等,虽然能实现基本的功能,但是却有一定的缺陷,大多数存在两个方面的问题。其一,是搜索覆盖面虽然很全面,但是搜索的时间很长,例如搜索“元搜索”这个名词,我们用了4家国内利用元搜索原理开设的搜索应网站进行了搜索测试,其中两家的搜索时间大于30秒,甚至无结果显示;其二,是搜索时间较短,但是覆盖面较窄。我们同样对上述几个网站进行测试,有的返回的搜索结果只有单一搜索引擎的结果,并没有发挥元搜索真正的优势。以此来看,目前的元搜索引擎还没有真正发挥其本身的优势,为广大用户提供便利。http://doc.xuehai.net/d548255553.html而随着网络的发展,越来越多的信息是人们通过Internet获取,据估计网络中有超过8亿个可索引的网页,大约15TB的信息量,而单个搜索引擎能覆盖的不超过全部可检索页的16%,因此元搜索引擎的开发势必成为将来...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?