1.1 single search engine(独立搜索引擎) 它的特点是仅在搜索引擎自身的数据库检索信息,比如Yahoo。
1.2 Meta search engine(元搜索引擎) 它在检索信息时通过调用其它多个独立的搜索引擎来完成检索功能,并且能够将从多个独立搜索引擎查询的结果进行不同程度的处理,比如删除重复结果、校验连接、结果按照相关度排序等。元搜索引擎本身可以有也可以没有自己的数据库。由于不同的元搜索引擎挂接的独立搜索引擎各不相同,且各自独立的搜索引擎在查询语法上的差别较大,使得元搜索引擎本身仅支持AND、0R、N0T等简单的语法 *** 作,返回的结果只能满足“最低常用分母”,即不能提高搜索结果的准确性。
1.3 Net search engine(网络搜索软件) 就是网络用户可以将相应的搜索软件下载至本地的计算机上,安装查询,这是一种具有网络查询功能的离线浏览器。相对于元搜索引擎,它可以灵活地控制输出结果,其最大特点是方便用户使用和能快速地查询网络相关资源。2 网络搜索引擎的工作原理及其基本构成
用户检索信息时,搜索引擎是根据用户的查询要求,按照一定的算法从索引数据库中查找对应的信息返回给用户。为了保证用户查找信息的精度和新鲜度。对于独立的搜索引擎而言.还需要建立并维护一个庞大的数据库。独立搜索引擎中的索引数据库中的信息是通过一种叫做网络蜘蛛(spider)的程序软件定期在网上爬行,通过访问公共网络中公开区域的每一个站点采集网页,对网络信息资源进行收集,然后利用索引软件对收集的信息进行自动标引,创建一个可供用户按照关键字等进行查询的web页索引数据库,搜索软件通过索引数据库为用户提供查询服务。所以,一般的搜索引擎主要由网络蜘蛛、索引和搜索软件三部分组成.
网络蜘蛛。是一个功能很强的程序,它会定期根据预先设定的地址去查看对应的网页,如网页发生变化则重新获取该网页,否则根据该网页中的链接继续去访问。网络蜘蛛访问页面的过程是对互连网上信息遍历的过程。为了保证网络蜘蛛遍历信息的广度,一般事先设定_ 些重要的链接,然后进行遍历。在遍历的过程中不断记录网页中的链接,不断地遍历下去,直到访问完所有的链接。
索引软件。网络蜘蛛将遍历搜索集得到的网页存放在数据库中。为了提高检索的效率,需要建立索引。索引一般为倒排档索引。
搜索软件。该软件用于筛选索引数据库中无数的网页信息,选择出符合用户检索要求的网页并对它们进行分级排序。然后将分级排序后的结果显示给用户。
3 搜索引擎的主要性能评价指标
3.1 搜索引擎建立索引的方法 数据库中的索引一般是按照倒排文档的文件格式存放,在建立例排索引的时候,不同的搜索引擎有不同的选项。有些搜索引擎对于信息页面建立全文索引;而有些只建立摘要部分,或者是段落前面部分的索引;还有些搜索引擎,比如Google建立索引的时候,同时还考虑超文本的不同标记所表示的不同含义。如粗体、大字体显示的东西往往比较重要;放在锚链中的信息往往是它所指向页面的信息的概括,所以用它来作为所指向的页面的重要信息。Google、infoseek还在建立索引的过程中收集页面中的超链接。这些超链接反映了收集到的信息之间的空间结构,利用这些结果信息可以提高页面相关度判别时的准确度。由于索引不同,在检索信息时产生的结果会不同。
3.2 搜索引擎的检索功能搜索引擎所支持的检索功能的多少及其实现的优劣,直接决定了检索效果的好坏,所以网络检索工具除了要支持诸如布尔检索、邻近检索、截词检索、字段检索等基本的检索功能之外,更应该根据网上信息资源......>>
问题二:检索工具应具备的条件有哪些? 检索工具:(retrieval tool)对有关文献的外部特征(如名称、著者、出处、出版年月等)和内部特征(如所属学科、论述的主题等)进行标引,并把各种特征按照一定的顺序科学地组织起来,从而向读者指明文献的所在之处,提供寻检搜索所需文献的工具,它可以是书本、卡片、胶卷、胶片、磁带、数据库、搜索引擎等形式。
一般来说,检索工具必须具有如下条件:
(1)较详细地描述所收录的文献信息的外部特征和内容特征。(包括篇名、题录、著者、主题、分类号、摘要、来源出处等项目)。
(2)每条款目都标明有可供查找用的标识。如:分类号、题名、关键词、主题词、文献序号、代号代码、网址等等。
(3)全部款目科学地组织成一个有机的整体。在整个检索工具体系编排的时候应该是主次分明、类目详明、彼此相互关联。
(4)具有多种必要的检索手段。即各种体系的索引如分类索引、主题索引、作者索引、号码索引等,以便读者能较方便地进行检索。
(5) 明确的收录范围。说明本工具的性质。
(6)检索速度要快,检索结果的准确率要高。
(7)具有纠错和推荐功能。用户在输入错误的检索词时主动提示用户;向用户推荐与检索主题相关的信息。
问题三:百度高级检索有哪些功能,举一个运用的例子 不知道你说的是哪个?
百度新闻高级检索
百度搜索的搜索工具可以按照时间,网页类型和指定域名搜索
问题四:搜索引擎的主要功能是什么 搜索
问题五:Cnki的基本检索功能 5分 CNKI的基本检索功能包括初级检索和二次检索,介绍如下:
1、初级检索
导航检索:用户不需要输入任何检索词,只要选择自己关心的栏目名称就能直接查到所需专题的文章。
篇名检索:检索在文章篇名中出现检索词的文章。
作者检索:检索某作者发表的文章。
关键词检索:检索在文章关键词中出现检索词的文章。
机构检索:输入机构名称,检索该单位的作者发表的文章。
中文摘要检索:检索在文章中文摘要中出现检索词的文章。
中文刊名检索:检索某期刊发表的文章。
年检索:检索某年的文章。
期检索:检索某期的文章。
全文检索:检索在文章全文(包括文章全部内容)中出现检索词的文章。
2、二次检索
对1中任何方式的检索结果,可以在此检索范围内用新的检索词进行逐次副近检索
问题六:查询文献的时候用哪些检索工具比较好呢?有什么查询技巧么? 直接用EndNote在线搜索的飘过。
关键词一一般可以用空格隔开,加引号可以以一段词组检索。“-”代表排除某一关键词。也可用AND、OR等进行逻辑检索。
有的数据库是分项检索的,也就是每一项填入一个检索词,在下拉菜单中选择所需选项。
数据库上面几个已经涵盖的差不多了,基本不需要其他数据库了。还有一个窍门,可以用google 学术搜索相关文献。也可到期刊自己的主页上去搜索下载。
问题七:文献检索有什么作用呀? 文献检索(Information Retrieval)是指根据学习和工作的需要获取文献的过程。
作用如下所以:
问题八:搜索引擎有那几部分组成,都有哪些功能? 网站其实都只有2部分,搜索引擎也不例外
pc端 和服务器端
你想问的是服务器这边有几部分.
1.蜘蛛,抓取程序
2.数据库,
3.算法程序
抓取和数据库十分简单,
抓取只负责抓带有特征的页面.
数据库只负责把抓来的页面储存.
算法就比较复杂
就百度来说.大大小小的算法应该有300多种
主要算法还是分以下几部分
链接算法,内容算法,域名算法,反作弊算法等
其中链接算法比重最大.
问题九:常用的搜索引擎都有哪些基本类型? 索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。
搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。
随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。
然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000‘000个网页。我们可以从google.stanford.edu/ 下载。
设计搜索引擎是一项富有挑战性的工作。搜索引擎为上亿个网页建立索引,其中包含大量迥然不同的词汇。而且每天要回答成千上万个查询。在网络中,尽管大型搜索引擎非常重要,但是学术界却很少研究它。此外由于技术的快速发展和网页的大量增加,现在建立一个搜索引擎和三年前完全不同。
本文详细介绍了我们的大型搜索引擎,据我们所知,在公开发表的论文中,这是第一篇描述地如此详细。除了把传统数据搜索技术应用到如此大量级网页中所遇到的问题,还有许多新的技术挑战,包括应用超文本中的附加信息改进搜索结果。
本文将解决这个问题,描述如何运用超文本中的附加信息,建立一个大型实用系统。任何人都可以在网上随意发布信息,如何有效地处理这些无组织的超文本 *** ,也是本文要关注的问题。
关键词 World Wide Web,搜索引擎,信息检索,PageRank, Google 1 绪论 Web 给信息检索带来了新的挑战。Web上的信息量快速增长,同时不断有毫无经验的新用户来体验Web这门艺术。人们喜欢用超级链接来网上冲浪,通常都以象Yahoo这样重要的网页或搜索引擎开始。大家认为List(目录)......>>
问题十:检索工具书与参考工具书有哪些区别? 参考工具书是汇集某一方面的知识与资料,以供读者查考有关字词和名词术语的解释、手册;参考工具书则提供具体文献资料、词典、地理概况、人物背景资料。所提供的具体而实用的文罚资料包括疑难字词、专业术语解释、存储和查找文献信息的工具检索工具书是人们用以报道。
检索工具书只提供文献资料的线索、百科全书、名录
一、Everything
Everything提供的是文件名检索,并可以使用各种表达式语法,结果非常准确,且速度非常快,一秒都不到就可以搜索出结果。
二、Filelocator
这款软件的特点是可以检索全文,结果可靠,速度也比较快。
权威检索工具有哪些? 目前,大多数科研管理部门将下列四种数据库作为科研评价的权威检索工具:SCI(科学引文索引)、ISTP(科学技术会议录索引)、EI(工程索引)和CSCD(中国科学引文数据库)。还有一些检索工具也可作为科研评价的数据源,如SSCI(社会科学引文索引)、A&HCI(艺术与人文科学引文索引)、新华文摘、人大复印资料、中国社会科学引文索引。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)