认识世界的窗口--搜索引擎 - 范文中心

认识世界的窗口--搜索引擎

09/20

周五晚和Kevin http://blog.iynew.com/ 聊天的时候,突然间想起来要看《The Search: How Google and it‘s Rivals Rewrote The Rules of Business and Transformed Our Culture》,并且帮我找到中文的电子版,在他的鼓励之下,我用周六一整天地时间看完了这本书。虽然说本书的风格很适合我的调调,但是当看到晚上快要睡觉的时候,还是有一种恶心的感觉(我8点钟起床没有洗脸就开始看,差不多对着屏幕一口气看了16个小时。),我本来打算看完之后马上就写读后感的,结果昨天一整天都不想动弹,在扑克游戏和帝国时代中荒芜了一天时间。

在本篇开头,先列几个有用的资源,大家可以参考。http://battellemedia.com/ ,作者John Battelle的Searchblog,对作者感兴趣的,可以找到有用的资料。http://book.sina.com.cn/nzt/fin/Search/index.shtml 搜:通向世界的巨型引擎(选载),新浪提供的在线电子版。在此一并提醒读者,网上广泛流传的可下载电子版e书,内容是很不完整的,该版本可能对大家有误导。这本书的中文版翻译的相当好,但是译者我并不熟悉,有熟悉两位译者的可以给做个补充介绍。同时,请能找到本书英文电子版的网友告知一下地址。

Battelle写作本书的视角主要是从文化的角度来探讨搜索引擎对我们生活的影响,而不是从技术的角度或者说技术评论的角度。作者是文化人类学专业的科班出身,并且从事过传媒工作和有过失败的IT创业经历,这些背景奠定了这本书的基调。我觉得可以把这本书当作科技史来看更好一些,主要是详尽的搜索引擎发展史和一些IT产业的规律,中间穿插了一些含义平淡的小故事,虽然使整本书的张弛程度不太一致,但是增加了趣味性和使人感到放松一些。纯粹搞技术的人,容易陷入细节,并且觉得许多事情不值得一提,缺少科幻和想象的一面;而现在许多的技术评论家尤其是国内的,都是一帮即没有技术经历,又缺乏文化底蕴和思考的急功近利之徒,他们仅仅觉得写技术评论容易赚到钱便把文学的笔抛掉摇身一变写起技术来了,写出来的东西可想而知。

搜索引擎是大家现在耳熟能详的一个词,但是对于许多普通读者,可能并不能明确其含义。其实可以说搜索引擎是信息检索的一个子概念,一般大家把web空间的信息检索称之为搜索引擎,或者说把Internet的索引称之为SE;信息检索大家可能都比较熟悉一些,请大家回想一下大学图书馆的书目检索系统,我指的是那种汗牛充栋、抽屉式的目录卡片,这是使用很广的一种检索形式,时至今日还很有生命力,大家对它的感知可能更加形象一些。而引擎呢?我最先接触的是数据库引擎这个抽象概念,总是会不由的联想到汽车发动机的活塞,在计算机学科当中,engine这个词被广泛使用,一般表示一种较为基础的底层技术,其可以推动许多上次应用的开展,蕴涵着驱动力的概念。(补充一句,大家可以用Lucene和Nutch这两个技术工具的差异来理解信息检索(Information Retrivial)和搜索引擎(Search Engine))

人类意图数据库,是作者贯穿本书始末的一个概念。指通过分析搜索引擎查询日志,然后发现当前社会上关注的热门话题,被称之为世界的思想。这点内容其实是SE的后续数据处理当中,附带产生的一点小产品,从技术层面上而言,没有什么好说的;但是却是很有意义和趣味性的一组统计数据,反映着一种社会心理趋向。据说Google美国总部的前台的接待处有一个大屏幕,上面实时的显示着当前google的查询关键词,当你看到这么一笔笔数据像流水一样从眼前流过,而每一个关键词都代表一个思维着的大脑的兴趣点时,那种美妙和神奇的感觉,放佛google是上帝,是世界思维的大脑中枢一样。而点击流,尤其是可以被个性化进行信息跟踪的点击流,无疑有着更加深刻的含义。想象一下,在原来的图书馆管理当中,每个读者的借阅记录是绝对保密资料,要看到这些记录需要公安等司法程序才可以看到。而当上网甚至变得比上床更加重要的今天,你的每一次鼠标点击都被记录下来,当对这些数据经过恰当有效的分析,可以还原和把握你思维的脉络。如果被善加利用,预测指导和辅助学习完全成为可能,这是一件很伟大的事情。

当Google掌握着上述信息的时候,我们再次想起其承诺:“Don‘t be evil”是一件多么重要的事情。如果没有这样的承诺和大家对其的信任和好感,便会拒绝其采集这样的个性数据;如果这样的数据被用作别样的目的,你可能会有被上帝之手作弄的感觉。

其实,我个人不讳言隐私,因为我觉得自己基本上没有见不得阳光的事情;而且,作为一个完整的人,在人同此心、心同此理的情况下,你以为是隐私并基于一种谨慎的自我保护本能而不愿意讲述的事情,在一个阅历丰富的人眼里,就跟透明的一样,没有什么秘密而言。我现在看人,一般把人分为两类,可交流的和不可以交流的;可交流的一个重要方面是做人要透明,我相信透明可以消除许多的人际误会和鲁迅笔下和闰土之间的那层可悲的障壁。而许多人借口隐私,其实是因为自己的阴暗面过多,而自我感觉上不得台面;如果是这个样子的,而你感到有自惭的话,我觉得还是可以交流的;如果,因此得到一些利益而还在那里捂着嘴偷着乐的话,我认为这种情况就是不可交流了。不可交流的人是不可救药的。

上升到社会层面,书中对此有不少的论述。这篇blog的读者可能都对发生在中国的“Google症状”有过切身的感受。在原文当中是这样说的:“看到搜索和互联网可能带来的危险,中国政府采取了许多非常措施来对互联网实施审查,并建立一个防火墙的技术基础设施,来自动过滤具有煽动性信息的网站。对于Google而言,中国似乎是个复杂的问题。她的政治和道德文化使你缺乏认同感,可是她的市场大到让你不能忽视。”我一直以为民主和自由是社会健康运转的有效保障,而Internet和SE是推动这一点的有效工具。被索罗斯奉为圣经的《开放社会及其敌人》(Open society and It‘s Enemy)给我们描述未来社会的一幅发展形态,而我也相信开放社会将是世界各国殊途同归的一个理想。开放社会,公众事务的完全透明和平民的知情权这些都可以有效的遏制社会的阴暗面。如果Google的运营恰当,将会给这个世界增添许多阳光。

关于搜索引擎发展史的文章,以前也看过不少,但是许多文章的展开都是浅尝辄止,没有深入。当我看到SEO(Search Engine Optimization)在1997年就已经泛滥,并使许多SE头痛的时候,我对此感到很意外,我以为SEO最早也就是2004年的事情呢。

作者给我们还原出了一幅SE的原生状态的图画,SE从无到有的从一种及其原始的形式发展起来,任何一点细小的改进都是经过一种接力式的发展演化而来。而在一般的文章当中,许多都是出于一种公司宣传的目的,到处暗示自己的某种富有革命性的创意为专利所有,实在不是客观的事实。

关于google的文化,我们看到了太多关于Google文化的报道,那是一种理想的桃花源式的工作环境,是每一个职业人的无比向往的地方。当我在smth上发现专门开了一个版面来讨论关于google的技术话题的时候,当我看到Career版有一个女生因为应聘Google的AdWords的市场职位失败而写下5000字长文表达自己那种失望的感情的时候,当我看到许多人问Google是神吗的时候,我知道Google在许多人的心目中已经是神了。而作者在这本书中揭示了另外一面,Google的高层决策是非常专#制的,会因为Page不喜欢听音乐,而不会涉及在线音乐的任何业务;同样存在着领导风格特立独行和不近人情的一面。不过Google可能做的比许多雇主都好罢了,毕竟许多时候需要一手持矛,另外一只手持盾,并恰当明确的知道何时该用那一只手出招。而且民主是一种效率低下的工作方式,当一个人的思维确实可以笼罩一大片人的时候,并幸运的被验证确实符合客观事实的时候,专#制也是一种需要。

搜索引擎的善恶,这是个有趣的话题;前边在一篇小文章上看到,有关于搜索引擎可以做这种二分法,假设人性是恶的,产生了像Google这样的通用综合性搜索引擎,全部依靠机器以及算法来对信息作梳理和分析,以便给出一个客观的评价;并需要在防范SEO等恶意的信息误导等方面下很大功夫。而假设人性是善的,则产生了像Baidu的知道这样子的依靠人工参与分享知识的编辑型搜索引擎,类似还有sina的iask等。在这里,我想起恩格斯的一句话:指出人性是善的,是说出了一种伟大的思想;而指出人性是恶的,是说出了一种更加伟大的思想。所以,我认为大行其道的还是那种假设人性是恶的搜索引擎;因为这才更加符合现实。在这里,对恶这个字眼也请不要过分敏感,善和恶都是推动事物前进的力量;从个人视角来看,应当无善无恶。

通过本书对搜索史的新认识或者说对科技史的进一步理解,我对现在许多小的创业型公司深感担忧,并且几乎打消了自己的一个创业的想法。如今的产业,已经发展的相当成熟,小作坊式的创业型公司已经没有自己的生存空间,如果你不是有明确超前预期的好想法,或者有自己瞄准的非常专业的细分市场,确保自己能做到市场第一,就不要贸然涉足其间。看看Google的身后,有多少“一将功成万骨枯”的例子。IT中软件业和互联网业的突出特点,就是产品的copy和服务并行扩容几乎没有任何成本,所以会赢家通吃。

看完这本书,写到这里;似乎还有许多意犹未尽和欲言又止的地方。不过写的很累了,需要去弄点吃的了;如有后续感想再写续篇。通过本书我充分的认识到,许多的东西发展的很快,而自己需要不停的追赶;世界在我眼前改变了模样,然而时机不等人;从事搜索引擎行业,抓住这个认识世界的窗口,是值得激情去投身其间的。


相关内容

  • 信息检索网络工具资源作业2-2
    第2章网络工具资源作业2 (doc 上交命名规则:[1**********]张欢欣-信息检索2-2) 一.常用功能熟悉 1. (A )地图检索不支持全世界领土覆盖区域的查询. A 谷歌 B 百度 2. 北京天安门城楼东西长度约(B )米. ...
  • 网络管理与维护学期报告
    前言 通过这学期网络管理与维护的学习,让我了解了许多网管软件,与一些相关命令.首先从概念上分析网络安全技术是指致力于解决诸如如何有效进行介入控制,以及如何保证数据传输的安全性的技术手段,主要包括物理的安全分析技术,网络结构安全分析技术,系统 ...
  • 初中信息技术八年级上册备课笔记
    义 务 教 育 实 验 教 科 书 信 息 技 术 八年级上 备 课 资 料 目 录 第一单元 网络与生活 第一课 我看网络 第二课 上网准备 第三课 我的E世界 第四课 因特网探源 第五课 因特网的未来 第二单元 网上交流 第六课 电子邮 ...
  • 高一信息技术月考试卷
    高一信息技术月考试卷(共100分) 班别: 座号: 姓名: 一.单项选择题(每题2分,共22分) 1.有五台计算机组成一局域网,使用哪种网络连接结构,可以保证在任意两条计算机之间连接用的网线断开时,这五台计算机依然可以互相保持连通?( ) ...
  • 高中信息技术必修知识点汇总
    主题1 信息的获取 高中信息技术必修知识点汇总 一.信息及其特征 1.信息的基本概念 "信息"一词通常是指数据.消息所包含的内容和意义.信息的表现形式有多种,如:图片.声音.动作.表情.文字等.当今世界的三大要素:物质. ...
  • 20**年全国专业技术人员计算机应用能力考试科目模块全真模拟试题答案
    全国专业技术人员计算机应用能力考试科目模块全真模拟试题答案 全国专业技术人员计算机应用能力考试全真模拟考试系统(中文windows xp 操作系统) 上机模拟考试试题(第一套) 第一套 1. 请将Windows XP中文版注销. 点击左下角 ...
  • 电子商务实训操作课程标准
    <电子商务综合实训>课程标准 一.性质和任务 本大纲适用于电子商务员的培训,通过实践培训使学员技能达到相当于国家职业技能四级. 二.实训目标 通过培训,学员能够掌握计算机基本操作和网络的使用方法,熟悉网页设计(FrontPage ...
  • 生活变化大搜索教学设计
    <生活变化大搜索>教学设计 一.教材分析 本节课是七年级下册第二单元第一课的第一框,要求学生通过学习本课,认识我国的基本国情,感受身边以及国家方方面面的巨大变化,明确改革开放和建设社会主义市场经济带来的巨大成就,并能积极探索这些 ...
  • 普通高中信息技术会考模拟题
    普通高中信息技术会考模拟题(十五) 1.现代的计算机系统属于 体系 A比尔 2.信息处理是指用计算机对原是数据进行 的处理过程 A.输入和输出 B.收集.储存.分类.加工.输出 C.加工和输出D.分类和加工 3.是事物运动的状态和方式,它的 ...
  • 有意义的暑期支教实践报告
    中学暑期支教 一.实践目的 给山区孩子暑期义务补课.激发孩子门的学习热情和奋起的精神,为他们的心灵打开一扇通向外界的窗口.给山区孩子带去最新的社会科学知识,普及他们计算机基础知识,其实,教育不应是一桶水,应该是一把火,一把点燃孩子心灵的火. ...