第四章 网络搜索引擎
一、选择题
1.使用google搜索有关信息检索的pdf文档,最佳的检索式为( D )
A.信息检索 pdf          B.信息检索 @pdf
C.信息检索 file:pdf      D.信息检索 filetype:pdf
2.具有相近含义的同义词或同族词在构成检索策略时应该使用( B )算符予以组配。
A.逻辑“与”                B.逻辑“或”
C.逻辑“非”                D.位置
3.若想排除概念,以缩小检索范围,可使用(  B  )算符。
A.逻辑“与”                B.逻辑“或”
C.逻辑“非”                D.位置.
3. 某同学希望在网上查一种需要的资料,那么较为好的信息搜索流程是( B )
A、选择查方式---确定搜索目标----确定搜索引擎-----查、筛选
B、确定搜索目标---选择查方式----确定搜索引擎-----查、筛选
C、确定搜索引擎---确定搜索目标----选择查方式-----查、筛选
D、确定搜索目标--确定搜索引擎----选择查方式-----查、筛选
4. 如果你想在网上下载孙楠的美丽的神话的mp3,用全文搜索方式查,你认为使用关键词(  D  )最容易得到结果
A、孙楠    B、美丽的神话      C、神话          D、孙楠 美丽的神话
5. 对Google的描述,以下(  C  )是错误的。
A.是通用检索工具                        B.最先采用pagerank技术
C.独立制作了人工编辑维护的网页目录      D.提供中文网页搜索
6 .对元搜索引擎以下( A )描述是错误的。
A.是独立的搜索引擎                      B.可同时搜索多个网络检索工具
C.有关键词检索功能                      D.自身没有数据库
7. 搜索引擎的工作原理包括数据采集系统,( C )用户界面和数据检索系统。
A.数据更新系统                          B.数据维护系统
C.数据标引与索引系统                    D.数据分析系统
8.下面的几种检索表达方式,哪种方式属于截词检索。(A  )
  A.“*magnetic”    B.“知识+信息”  C.“关键词=知识挖掘”  D.“Information(N)management”
9、下面的几种检索表达方式,哪种方式属于布尔逻辑检索。(B )
  A.“*magnetic”  B.“北京大学+五四运动”  C.“题名=财务管理”  D.“Database(W)Stru
cture”
10. 如果打算了解最新即时的专业学术动态,一般可参考(A )。
A.专业学会网站
B.教育机构网站
C.综合性门户网站
D.综合性虚拟图书馆
二、多项选择题
1.检索式computer(w)information检索出来的结果是( AC )
A. computer information                Bputer color information
Cputer-information                D.color computer information
2.检索式Laser(1w)printer检索出来的结果是(AB)
A.Laser printer                B.Laser color printer
C.printer                      D.the laser printer
3.截词检索中,常用的截词符号有(CD)
A.+                    B.-
C.*                    D.?
4.常用的位置检索符号包括(ABCD)
A.(W)                  B.(nW)
C.(N)                    D.(nN)
5.检索式money(N)supply检索出来的结果是(AB)
A.money supply          B.supply money
C.supply of money        D.rich money supply
6.在计算机信息检索系统中,常用的检索技术有(ABC)
A.布尔检索                B.截词检索
C.位置检索                D.逻辑检索
7.通过google查得的结果过多,可以通过(ABCD)方法,优化检索结果。
A.词组检索    B.字段限定      C.增加同义词            D.使用优先算符
8.利用谷歌搜索出所有包含关键词“旅游”和“泰山”的中文网页,其错误的检索式是(  ABD    )。
A.旅游 | 泰山
B.旅游 * 泰山
C.旅游 泰山
D.旅游 –泰山
9.在教育网内搜索“登陆火星”,下面的检索式哪些可以达到这个目的?(ABCD)
A.”mars landing”+domain:edu              B.火星+登陆+domain:edu
C.火星+登陆+url:edu                    D.landing+title:mars+url:edu
10.搜索引擎存在的问题和缺陷有哪些?(ABCD)
A.web网页的数目庞大,增长迅速,查全率不高 
B.过期信息较多,经常有死链接
C.索引更新较慢,以信到最新的信息
D.多义词、同义词的大量存在,查准率不高
三、简答题
1. 什么是搜索引擎?搜索引擎有哪些类型?简述搜索引擎的基本工作原理
搜索引擎(Search Engine)是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。
搜索引擎包括:全文索引、目录索引、元搜索引擎、垂直搜索引擎等。
搜索引擎基本原理:
    搜集信息
    整理信息
    提供检索服务
2. 布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。
布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”(2分),它们分别代表逻辑与(表示检索结果中必须包含所有的检索词)、或(表示检索结果中只要包含任何一个检索词即可)和非(表示检索结果中一定不能出现“not”后面的检索词)1分),如:美国AND 社会保障, 数字图书馆 OR 虚拟图书馆,玉米 NOT 甜玉米(3分)。
3. Google检索关于汽车品牌方面的资料,但不要包括丰田的内容,资料类型为Word文档、PDF文档、PPT文档,请写出检索式。
汽车 品牌丰田 filetype:doc OR filetype:ppt OR filetype:pdf
    4. 案例:某科研人员想了解华南虎生活习性,通过Google却搜索出了136,000项符合华南虎生活习性的查询结果,其中大量结果是关于陕西镇坪华南虎虎照事件。
    (1)本案例说明了什么问题?
    (2)试分析案例背后的原因
    (3)从检索的角度出发,如何解决案例背后的问题?
问题:
1.检索结果过多,136,000项,无法一一阅读。(2分)
2.非学术信息与学术信息混杂在一起,且非学术信息多,学术信息少,且大多淹没在非学术性之中,造成选取困难。(2分)
3.搜索引擎是基于关键词的匹配,检出大量不相关的信息,增加检准信息难度。(2分)
原因:
1.网络是无政府主义者且无审查机构和中心节点,任何人可以在上面发布信息,导致信息大量、重复、甚至错误信息,造成信息过载。(2分)
美丽的神话 mp3
2.网络信息组织存在缺陷,非学术信息与学术信息混杂在一起。(2分)
3.搜索引擎检索能力的不足。(1分)
解决办法:
1.提高信息检索能力,采取各种措施提高搜索引擎的查准率。(1分)
2.提高信息辨别能力。(1分)
3.利用专门数据库和学术搜索引擎。(1分)
4.提高信息素养。(1分)
四、论述题
1. Google学术搜索引擎练习 1):请写出Google学术搜索网址。 2):利用Google学术搜索引擎,检索《僧帽牡蛎三倍体的研究》
2. 请用搜索引擎把国外经济学家“曼昆”所写的《经济学原理》这本教材的英文原版幻灯片(课件)和繁体版的幻灯片(课件)全部齐。(提示:这本书可能有很多章节,可能每一章会有一个对应的PPT文件)
3. 请大家以报考北京大学或清华大学研究生为目标,到两校BBS上查自己专业的相关考研资料,最好能与北大或清华的学长取得,从他们那里获得相关读书笔记。 
地理科学考研资料 (site: bbs.tsinghua.edu|site:bbs.pku.edu)
4. 使用“百度”搜索引擎,查在网页标题中含有“智能控制”的资料,写出检索式以及3个网页的网址。
5.假如你想向《中国农业科学》杂志搞稿,却不知道通信地址和EMAIL,请查并给出它的通信地址和EMAIL,并说明你得到信息的具体方法。
通信地址:中关村南大街12号《中国农业科学》编辑部
邮编:100081
EMAIL:zgnykx@mail.caas
6.利用搜索检索本专业的DOC/PDF/PPT格式的文档各一篇。
7.利用搜索引擎查杨振宁的生平、研究成果、何年获得何项诺贝尔奖?