认识搜索引擎 - 范文中心

认识搜索引擎

10/29

实验四 认识搜索引擎

一、实验目的

1、认识搜索引擎

2、了解搜索引擎原理及使用方法

3、在线查找搜索引擎

学时安排:2学时

二、实验内容

1、在IE浏览器输入网址:http://www.moon-soft.com/web/searchengine.htm,或是利用Google搜索引擎查询【认识搜索引擎】,找到该网页,了解搜索引擎的原理极其发展过程。

2、打开http://www.sowang.com/index.htm和http://www.sskb.cn/,查看站点中文搜索引擎指南网(搜网)和搜索快报,了解搜索引擎有关新闻、使用技巧、排名规则、以及在商业上的应用。

3、在线查找搜索引擎,列出你所熟悉的中文引擎的前5名,英文引擎的前5名

4、列出至少20个搜索引擎(包括一个能够搜索—搜索引擎的引擎,报告中请注明)

5、使用不同的英文搜索引擎分别给出歌德巴赫猜想(Goldbach's conjecture)和世界名画《蒙娜丽莎》(Mona Lisa )的英文详细介绍网址,并分别给出内容的英文简介。

6、针对你的选题自选检索词利用英文搜索引擎检索,记录检索结果

三、实验报告

1、搜索引擎的原理

搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。

1. 从互联网上抓取网页

利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

2. 建立索引数据库

由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

3. 在索引数据库中搜索排序

当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到

符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。

最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

2、搜索引擎的使用技巧

对于搜索引擎的使用,简单的就是输入你的语言想法。通过提交获得,这中间就要求你懂得搜索引擎的一个搜索因素。就是搜索关键字或关键词。这个一般不会被大众用户所了解,普通用户只是简单的思考就形成一种搜索习惯。比较准确一点的话就是关键词组,例如:考试模拟题,上海到北京线路等等这些就是关键词组,再比较专业一点的就是关键字,这个主要是一些特殊定义的词,例如:北京旅游,上海酒店,成人高考,一心一意等等。

另一方面就是搜索引擎的专业使用,主要是搜索引擎命令搜索和搜索引擎的分类搜索。搜索引擎的命令搜索主要有查看网站收录情况,使用site:命令;查看网站的外链情况,使用domain:或者link:命令等。搜索文档等,使用filetype:文档格式

(DOC,PDF,XLS,PPT等);还有使用函数符号搜索,使用加号(+)或者减号(-)号等来匹配内容;其次还有很多函数符号的使用,如:&,intitle,inurl,tag,“”,(),related,url,image等等。另一方面就是类型搜索,如:百度文档搜索,百度音乐搜索,谷歌文档,字典搜索,地图,交通搜索等等。

搜索引擎的使用有很多比较巧妙的东西,很多都可以灵活运用,也可以综合使用。如:在指定的网站中搜索某一类的东西:site:lvmama.com 欢乐谷 ,这里是在驴妈妈网站搜索关于欢乐谷的东西;site:lvmama.com 欢乐谷&攻略 ,这里是在驴妈妈网站搜索包含欢乐谷和攻略的信息。Inurl:bbs欢乐谷 这里是指在所有包含欢乐谷的信息,条件是同时要在url中出现bbs,这里还有一层意思是指,将bbs本身定义为论坛,这里总的意思也就是只在论坛中搜索包含欢乐谷的信息。

3、中文引擎前5名:

百度

谷歌

Bing(必应) 搜搜

雅虎全能搜索

英文引擎前5名:

4、不少于20个搜索引擎名称及链接地址

(1) 百度

(2) Google中文

(3) Alltheweb(Fast)

(4) Openfind中文

(5) 北大天网

(6) Google

(7) Alltheweb(Fast)

(8) Altavista

(9) Inktomi

(10) Openfind

(11) Northernlight

(12) Wisenut

(13) Teoma

(14) Gigablast

(15) Inktomi/MSN

(16) 搜狗

(17) Bing(必应)

(18) 雅虎全能搜索

(19) SOSO搜搜

(20) 有道

(21) 即刻搜索

(22) 盘古搜索

(23) 爱问搜索引擎

(24) o123网址之家

(25) 120ask有问必答

5、Goldbach's conjecture的详细介绍网址及英文简介

中文网址:http://baike.baidu.com/view/1808.htm

英文网址:http://en.wikipedia.org/wiki/Goldbach's_conjecture

英文简介:Goldbach's conjecture is one of the oldest unsolved problems in number theory and in all of . It states:Every greater than 2 can be expressed as the sum of two . A Goldbach number is a number that can be expressed as the sum of two odd primes. Therefore, another statement of Goldbach's conjecture is that all even integers greater than

4 are Goldbach numbers.

The expression of a given even number as a sum of two primes is called a Goldbach of the number. For example,

4 = 2 + 2

6 = 3 + 3

8 = 3 + 5

10 = 7 + 3 or 5 + 5

12 = 5 + 7

14 = 3 + 11 or 7 + 7

Mona Lisa的详细介绍网址及英文简介

中文网址:http://baike.baidu.com/view/27894.htm

英文网址:http://www.newworldencyclopedia.org/entry/Mona_Lisa

英文简介:Mona Lisa (also known as La Gioconda) is a sixteenth century portrait painted in oil on a panel by during the . The work is owned by the French government and hangs in the in , with the title Portrait of Lisa Gherardini, wife of Francesco del Giocondo.

The painting is a half-length portrait and depicts a woman whose expression is often described as enigmatic. The ambiguity of the sitter's expression, the monumentality of the

half-figure composition, and the subtle modeling of forms and atmospheric illusionism were novel qualities that have contributed to the painting's continuing fascination. Few other works of art have been subject to as much scrutiny, study, mythologizing and parody.

It is one of the great icons of Western painting, perhaps the best known painting in the entire world

6、使用引擎名称及链接:Google

检索词(至少2个):文本挖掘(Text Mining),知识发现(knowledge Discovery)

检索表达式:文本挖掘(Text Mining)*知识发现(knowledge Discovery)

第一个检索词的检索结果(摘录至少5条):

1. Text mining

2. KNOWLEDGE MANAGEMENT, DATA MINING, AND TEXT MINING IN MEDICAL

INFORMATICS

3. Survey of Text Mining: Clustering, Classification, and Retrieval ...

4. The Text Mining Handbook: Advanced Approaches to ...

5. Text mining with Information Extratction

第二个检索词的检索结果(摘录至少5条):

1. From Data Mining toKnowledge Discovery inDatabases

2. An Internet-enabled Knowledge Discovery Process

3. Knowledge Discovery and Data Mining: Concepts and Fundamental Aspects *

4. Knowledge Discovery from data

5. Trends inData Mining and Knowledge Discovery

按以下内容给出一篇由检索表达式得到的检索结果:

[Title] From Data Mining toKnowledge Discovery inDatabases

[Author] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth

[Organization] American Association for Artificial Intelligence

[Journal] 1996 37

[Key words] Data mining knowledge discovery Databases

[Abstract] Data mining and knowledge discovery indatabases have been attracting a significantamount of research, industry, and media atten-tion of late. What is all the excitement about?This article provides an overview of this emergingfield, clarifying how data mining and knowledgediscovery in databases are related both to eachother and to related fields, such as machinelearning, statistics, and databases. The articlementions particular real-world applications,specific data-mining techniques, challenges in-volved in real-world applications of knowledgediscovery, and current and future research direc-tions in the field.


相关内容

  • 网络信息组织对传统信息组织的借鉴
    [内容提要]本文以网络信息组织继承和发展传统信息组织的方法为切入点,从四个方面论述了网络信息组织对传统信息组织的借鉴,这四个方面包括用体系分类法完善信息资源分类体系:用分面分类法改进网络信息组织:用分类主题一体化改造网络信息组织:建立一套科 ...
  • 网络营销的发展现状
    网络营销的发展现状.困境与出路浅析 网络蕴藏市场无限,孕育商机万千,网络营销极具发展前景,必将成为21世纪企业营销的主流.网络营销作为一种全新的营销方式,与传统营销方式相比具有明显的优势,但也存在着某些不足,企业应该扬其所长,避起所短,合理 ...
  • 小学五年级上册信息技术教案(最新版)
    2014-2015学年第一学期五年级 信息技术教案 学期教学工作计划 一.学情分析 五年级学生对学习计算机有一定的出,基本知识与技能的掌握情况还比较理想,但大部分学生在计算机的应用方面还嫌狭窄,学生对于网络都比较好奇,本学期在继续激发学生学 ...
  • 初中信息技术八年级上册备课笔记
    义 务 教 育 实 验 教 科 书 信 息 技 术 八年级上 备 课 资 料 目 录 第一单元 网络与生活 第一课 我看网络 第二课 上网准备 第三课 我的E世界 第四课 因特网探源 第五课 因特网的未来 第二单元 网上交流 第六课 电子邮 ...
  • 生活变化大搜索教学设计
    <生活变化大搜索>教学设计 一.教材分析 本节课是七年级下册第二单元第一课的第一框,要求学生通过学习本课,认识我国的基本国情,感受身边以及国家方方面面的巨大变化,明确改革开放和建设社会主义市场经济带来的巨大成就,并能积极探索这些 ...
  • 关于搜索引擎的作文500字
    关于搜索引擎的作文500字 搜索引擎大排名 今天我上查资料时,突发奇想:"什么搜索引擎最好?" 这个我和同学郁鸿升一直有争执,他认为是百度,而我认为是Google(谷歌).他的依据是他认识的人都用百度,而我的理由是谷歌不 ...
  • 网络营销试题库2
    二.判断 21 只有企业自己建立网站平台进行商务活动,才能拥有在自己的网络商店. 22 品牌是一种信誉.传统的优势名牌一定是网上的优势名牌. 23 网络营销对网络商务信息收集的要求是及时.准确.适度.经济. 24 在问卷的设计中应越全面越好 ...
  • 搜索引擎营销策划方案
    搜索引擎营销策划方案简介 搜索引擎营销策划方案简介 目 录 网络营销策划方案 : (流量.页面优化相关性.Alexa排名.PR值.SEN[百度相关搜索].长尾) 一.网站分析 1.网站流量分析 (1).流量来路统计 (2).浏览页面和入口分 ...
  • 实验一 初识管理信息系统
    管理信息系统实验大纲 王海荣 实验一 初识管理信息系统 1.实验目的 1)初步认识管理信息系统,建立对管理信息系统的感性认识: 2)认识管理信息系统给组织和个人带来的影响: 3)了解管理信息系统的分类及所包含的主要功能: 4)了解管理信息系 ...