任务描述
学校组织了一场以“弘扬中医药文化”为主题的PPT制作大赛,王强想以“药王”孙思邀的医德、医术和所著医书为题材,制作一个演示文稿。开始创作前,他需要广泛收集与主题想关的材料和素材,因此需要在搜索引擎中进行信息检索。
知识讲解
1.搜索引擎的基本知识
搜索引擎 (Search Engines)是用户通过互联网检索特定信息的重要工具,其工作机制为,搜索引擎先行收集互联网上数以亿计的网页并对其中的每个词(关键词)进行索引,以此建立一个庞大的索引数据库,当用户需要检索某个关键词时,搜索引擎再将所有包含该关键词的网页作为搜索结果呈现出来。目前国内主要的中文商业搜索引擎有百度搜索、360搜索等,国外的商业搜索引擎有Google、Bing等。
搜索引擎根据搜索方式的不同可以分为:
(1)全文搜索引擎。是目前应用最广泛的搜索引擎,它可以从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
(2)目录式搜索引擎。是以人工方式或半自动方式搜集信息,由搜索引擎的编辑员查看信息之后,依据一定的标准对网络资源进行选择、评价,人工形成信息摘要,并将信息置于事先确定的分类框架中而形成的主题目录。目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,而只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词进行查询。
(3)元搜索引擎。是一种在接收用户检索请求后,在一个统一的搜索界面帮助用户同时在多个搜索引擎上实现检索操作的搜索引擎。元搜索引擎一般都没有自己的网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其他多个独立搜索引擎的搜索结果并以统一格式在同一界面集中显示的。
2.搜索引擎中常用的搜索方法
计算机信息检索的基本检索方法和技术主要有如下几种。
布尔逻辑检索。是一种比较成熟、较为流行的检索技术,其检索的基础是运用逻辑运算定义需要检索的内容。常用的逻辑运算有“与”(AND)、“或”(OR)和“非”(NOT)3种。
下面以“孙思邀”和“千金要方”两个检索词来解释3种逻辑运算符的具体含义。
“孙思邀”AND“千金要方”,表示要检索的结果需同时含有这两个检索词。
“孙思邀”OR“千金要方”,表示要检索的结果只需含有其中一个检索词即可。
“孙思邀”NOT“千金要方”,表示要检索的结果只含有“孙思邀”但不含有“千金要方”。
位置检索。也称为临近检索,是指用一些特定的位置算符来表达检索词与检索词之间的顺序和词间距的检索。以美国DIALOG检索系统为例,位置算符主要有(W)算符、(nW)算符、(N)算符、(nN)算符、(F)算符、(L)算符以及(S)算符。
截词检索。是预防漏检、提高查全率的一种常用检索技术,其含义是截断词的一个局部进行检索,并认为凡是满足这个词局部中的所有字符的文献,都是检索结果。截词分为有限截词和无限截词,如“?”常用来表示截断一个字符,“*”常用来表示截断多个字符。
字段限制检索。是将检索范围限定在数据库特定的字段中,通过选择字段和填入检索词的方式检索信息的方法。该检索方式通常需要在下拉菜单中选择字段,再输入检索词,方可开始检索。
3.使用搜索引擎查找信息
以百度搜索引擎搜索信息为例
1)简单搜索
用浏览器打开百度网站后,在搜索框中输入“2023年杭州亚运会”,单击“百度一下”按钮,就可以得到搜索结果,其中有一行小字显示“百度为您找到相关结果约89,200,000个”,搜索结果中排在第1位的是百度百科,排在第2位的是新浪新闻,可以根据需要单击进入对应结果页面。
2)多关键词搜索
当用户输入多个关键词并且关键词之间使用空格隔开时,百度会对空格两边的关键词之间的关系进行逻辑 AND的判断,即搜索出同时包含这些关键词的信息。如果在关键词之间加上“→”符号,则表明关键词之间为逻辑 OR 的关系,百度会搜索出包含其中任意一个关键词的信息。如果对关键词进行双引号标识,则表明这是一个完整的关键词,不能进行拆分和演变。例如,输入“杭州亚运会 全红婵”、“‘ 杭州亚运会 全红婵’”和“杭州亚运会→全红婵”的搜索结果是完全不一样的,如图所示。
3)高级搜索
如果要进一步提高搜索结果的查全率与查准率,则可以借助百度的高级搜索功能。在百度搜索框的右侧,在“设置”菜单中选择“高级搜索”命令,即可打开百度的高级搜索设置界面,如图所示。在高级搜索设置界面中,用户不仅可以对关键词的出现形式与位置进行限定,也可以对搜索结果的时间范围进行限定,还可以对要搜索的网页格式与网站进行限定等。
4)将搜索范围限定在网页标题中
例如,在搜索框中输入“跳水intitle:全红蝉”,如图所示。
5)将搜索范围限定在特定网站中
例如,想要在网站“www.skycn.com”中搜索“百度影音”,可以在搜索框中输入“百度影音 site:www.skycn.com”,如图所示。
6)用inurl指令进行搜索
inurl是高级搜索指令,它的作用是限定在 URL(统一资源定位符)中进行搜索.
“inurl:xxx”的作用是查找URL中包含“xxx”的网页,如“inurl:www.weibo.com”就是指在搜索引擎中查找URL 中包含“www.weibo.com”的网页。
例如,在搜索框中输入“inurl:toutiao”,查找 URL 中包含“toutiao”的网页,如图所示。
“inurl:xxx关键词”或“关键词inurl:xxx”表示在搜索引擎中查找满足URL和关键词这两个要求的网页。例如,在搜索框中输入“杭州亚运会 inurl: baidu.com”,查找网页正文中包含关键词“杭州亚运会”且URL中包含“baidu.com”的网页,如图所示。
7) 搜索结果排序
用户可以在个性化设置中让搜索结果更符合自己的需求,但并非所有的搜索结果都能合乎心意。这是因为搜索引擎返回的 Web 站点的顺序可能会影响人们的访问,为了增加 Web站点的点击率,一些 Web 站点会付费给搜索引擎,目的是在相关 Web 站点列表中显示在靠前的位置。从 2016 年起,百度推广开始标注“广告”,如图所示。一般情况下,搜索引擎会鉴别 Web 站点的内容,并据此安排其顺序,但不排除有失误的情况,因此,用户要对搜索结果进行仔细鉴别。
视频讲解

