数学研究的对象是数量和空间的关系 - 范文中心

数学研究的对象是数量和空间的关系

08/25

开复简介:

李开复,祖籍四川,1961年12月3日出生于台湾,曾与妻子(谢先铃)女儿(李德宁、李德亭)居住美国西雅图,现迁居北京。 1966 - 1972 台湾就读小学

1972 - 1979 美国田纳西州就读初中、高中

1979 - 1983 美国纽约哥伦比亚大学计算机系学士

1983 - 1988 美国卡内基梅隆大学计算机系博士

1988 - 1990 美国卡内基梅隆大学计算机系助理教授

1990 - 1996 美国苹果电脑公司(语音组经理、多媒体实验室主任、互动多媒体部全球副总裁)

1996 - 1998 美国SGI 电脑公司(网络产品部全球副总裁、Cosmo 子公司总裁)

1998 - 2005 美国微软公司(微软中国研究院院长、自然互动部全球副总裁)

2005- 2009-9-4 Google(Google 全球副总裁、中国区总裁)

获得奖项和荣誉:

1988 美国商业周刊最重要发明奖(语音识别)

1989 世界Othello 对弈冠军

1991 电气和电子工程师协会最佳论文奖

2000 电气和电子工程师协会院士

2000 西安交通大学名誉教授

2004 中国科学院研究生院名誉教授

2006 美国百人会会员

李开复给中国学生的一封信:从诚信谈起

李开复给中国学生的第二封信:从优秀到卓越

李开复给学生第三封信:要成功自信与快乐

李开复给中国学生第四封信:大学4年应这样过

李开复给中国学生的第五封信:致学生的父母

李开复给学生第6封信:选智慧用中庸拒绝极端

李开复给学生第七封信:21世纪最需要7种人才

Kaifu Lee谈算法 算法是计算机科学领域最重要的基石之一,但却受到了国内一些程序员的冷落。许多学生看到一些公司在招聘时要求的编程语言五花八门就产生了一种误解,认为学计算机就是学各种编程语言,或者认为,学习最新的语言、技术、标准就是最好的铺路方法。其实大家都被这些公司误导了。编程语言虽然该学,但是学习计算机算法和理论更重要,因为计算机语言和开发平台日新月异,但万变不离其宗的是那些算法和理论,例如数据结构、算法、编译原理、计算机体系结构、关系型数据库原理等等。在“开复学生网”上,有位同学生动地把这些基础课程比拟为“内功”,把新的语言、技术、标准比拟为“外功”。整天赶时髦的人最后只懂得招式,没有功力,是不可能成为高手的。

算法与我

当我在1980年转入计算机科学系时,还没有多少人的专业方向是计算机科学。有许多其他系的人嘲笑我们说:“知道为什么只有你们系要加一个„科学‟,而没有„物理科学系‟或„化学科学系‟吗?因为人家是真的科学,不需要画蛇添足,而你们自己心虚,生怕不„科学‟,才这样欲盖弥彰。”其实,这点他们彻底弄错了。真正学懂计算机的人(不只是“编程匠”)既

能用科学家的严谨思维来求证,也能用工程师的务实手段来解决问题——而这种思维和手段的最佳演绎就是“算法”。

记得我读博时写的Othello 对弈软件获得了世界冠军。当时,得第二名的人认为我是靠侥幸才打赢他,不服气地问我的程序平均每秒能搜索多少步棋,当他发现我的软件在搜索效率上比他快60多倍时,才彻底服输。为什么在同样的机器上,我可以多做60倍的工作呢?这是因为我用了一个最新的算法,能够把一个指数函数转换成四个近似的表,只要用常数时间就可得到近似的答案。在这个例子中,是否用对算法才是能否赢得世界冠军的关键。 还记得1988年贝尔实验室副总裁亲自来访问我的学校,目的就是为了想了解为什么他们的语音识别系统比我开发的慢几十倍。在与他们探讨的过程中,我惊讶地发现一个O(n*m)的动态规划(dynamic programming)居然被他们做成了O(n*n*m)。更惊讶的是,他们还为此发表了不少文章,甚至为自己的算法起了一个很特别的名字,并将算法提名到一个科学会议里,希望能得到大奖。当时,贝尔实验室的研究员当然绝顶聪明,但他们全都是学数学、物理或电机出身,从未学过计算机科学或算法,才犯了这么基本的错误。我想那些人以后再也不会嘲笑学计算机科学的人了吧!

网络时代的算法

有人也许会说:“今天计算机这么快,算法还重要吗?”其实永远不会有太快的计算机,因为我们总会想出新的应用。虽然在摩尔定律的作用下,计算机的计算能力每年都在飞快增长,价格也在不断下降。可我们不要忘记,需要处理的信息量更是呈指数级的增长。现在每人每天都会创造出大量数据(照片,视频,语音,文本等等)。日益先进的纪录和存储手段使我们每个人的信息量都在爆炸式的增长。互联网的信息流量和日志容量也在飞快增长。在科学研究方面,随着研究手段的进步,数据量更是达到了前所未有的程度。无论是三维图形、海量数据处理、机器学习、语音识别,都需要极大的计算量。在网络时代,越来越多的挑战需要靠卓越的算法来解决。

再举另一个网络时代的例子。如果要找附近的咖啡店,那么搜索引擎该怎么处理这个请求呢? 最简单的办法就是把整个城市的咖啡馆都找出来,然后计算出它们的所在位置与你之间的距离,再进行排序,然后返回最近的结果。但该如何计算距离呢?图论里有不少算法可以解决这个问题。这么做也许是最直观的,但绝对不是最迅速的。如果一个城市只有为数不多的咖啡馆,那么这么做应该没什么问题,反正计算量不大。但如果一个城市里有很多咖啡馆,又有很多用户都需要类似的搜索,那么服务器所承受的压力就大多了。在这种情况下,我们该怎样优化算法呢?

首先,我们可以把整个城市的咖啡馆做一次“预处理”。比如,把一个城市分成若干个“格子(grid)”,然后根据用户所在的位置把他放到某一个格子里,只对格子里的咖啡馆进行距离排序。问题又来了,如果格子大小一样,那么绝大多数结果都可能出现在市中心的一个格子里,而郊区的格子里只有极少的结果。在这种情况下,我们应该把市中心多分出几个格子。更进一步,格子应该是一个“树结构”,最顶层是一个大格——整个城市,然后逐层下降,格子越来越小,这样有利于用户进行精确搜索——如果在最底层的格子里搜索结果不多,用户可以逐级上升,放大搜索范围。

。。。

通过这个小例子,我们看到,应用程序的要求千变万化,很多时候需要把一个复杂的问题分解成若干简单的小问题,然后再选用合适的算法和数据结构。

并行算法:Google 的核心优势

上面的例子在Google 里就要算是小case 了!每天Google 的网站要处理十亿个以上的搜索,GMail 要储存几千万用户的2G 邮箱,Google Earth要让数十万用户同时在整个地球上遨游,并将合适的图片经过互联网提交给每个用户。如果没有好的算法,这些应用都无法成为现实。在这些的应用中,哪怕是最基本的问题都会给传统的计算带来很大的挑战。例如,每天都有十亿以上的用户访问Google 的网站,使用Google 的服务,也产生很多很多的日志(Log)。因为Log 每份每秒都在飞速增加,我们必须有聪明的办法来进行处理。我曾经在面试中问过关于如何对Log 进行一些分析处理的问题,有很多面试者的回答虽然在逻辑上正确,但是实际应用中是几乎不可行的。按照它们的算法,即便用上几万台机器,我们的处理速度都根不上数据产生的速度。

那么Google 是如何解决这些问题的?首先,在网络时代,就算有最好的算法,也要能在并行计算的环境下执行。在Google 的数据中心,我们使用的是超大的并行计算机。但传统的并行算法运行时,效率会在增加机器数量后迅速降低,也就是说,十台机器如果有五倍的效果,增加到一千台时也许就只有几十倍的效果。这种事半功倍的代价是没有哪家公司可以负担得起的。而且,在许多并行算法中,只要一个结点犯错误,所有计算都会前功尽弃。 那么Google 是如何开发出既有效率又能容错的并行计算的呢?Google 最资深的计算机科学家Jeff Dean认识到,Google 所需的绝大部分数据处理都可以归结为一个简单的并行算法:Map and Reduce (http://labs.google.com/papers/mapreduce.html) 。这个算法能够在很多种计算中达到相当高的效率,而且是可扩展的(也就是说,一千台机器就算不能达到一千倍的效果,至少也可以达到几百倍的效果)。Map and Reduce的另外一大特色是它可以利用大批廉价的机器组成功能强大的server farm。最后,它的容错性能异常出色,就算一个server farm 宕掉一半,整个farm 依然能够运行。正是因为这个天才的认识,才有了Map and Reduce算法。借助该算法,Google 几乎能无限地增加计算量,与日新月异的互联网应用一同成长。

算法并不局限于计算机和网络

举一个计算机领域外的例子:在高能物理研究方面,很多实验每秒钟都能几个TB 的数据量。但因为处理能力和存储能力的不足,科学家不得不把绝大部分未经处理的数据丢弃掉。 可大家要知道,新元素的信息很有可能就藏在我们来不及处理的数据里面。同样的,在其他任何领域里,算法可以改变人类的生活。例如人类基因的研究,就可能因为算法而发明新的医疗方式。在国家安全领域,有效的算法可能避免下一个911的发生。在气象方面,算法可以更好地预测未来天灾的发生,以拯救生命。所以,如果你把计算机的发展放到应用和数据飞速增长的大环境下,你一定会发现;算法的重要性不是在日益减小,而是在日益加强。

算法与数学

数学是一种用来表达人类对自然的认识,并互相交流这种认识的语言(这是我的看法,当然每个人对数学都有自己的理解)。而算法,就是一种机械地解决问题的方法,根据算法解决问题时不需要任何智慧(这里可能用词不当,因为强人工智能学派认为智慧就是一种复杂的算法) ,只要照着做就可以了,所以现在的计算机能够执行算法而且也只能执行算法。发明创造各种算法是为了让我们研究数学的时候不需要总是依据他的客观物理含义,比如我们做1987+1234567的时候,通常使用的是按位计算,这是按照一定的规则(算法)一步一步做下去的,而不是考虑它的物理含义:有1987个苹果,然后又拿来了1234567个,一共是多少个,但是小孩子刚学加法的时候要扳着手指头计算,从这点还可以看出加法的本来物理意义。 所以我觉得,数学是上帝创造的,它表现了一种客观实在;而算法是人类创造的,它是方便人类研究数学这种客观实在的工具。

算法的发展和形式系统是分不开的,数学发展到20世纪初的时候,数学家开始研究数学的本质(其实早就开始了,不过20世纪初是鼎盛时期),大家发现,我们的数学体系完全是基于一种符号的演算体系,所有数学体系都变成了“由几个基本公理奠基,然后规定几个规则,按照这些规则推导出来所有的定理”这种公理化体系。这就是形式系统。 形式系统中的推导过程就是一个个的算法。比如求积分的方法,开根号的方法,加法,乘法,...etc 。大家就提出疑问,是否存在一种算法,可以证明一个命题是对是错,如果存在的话,我们只要找到这种算法就一劳永逸了。这个问题是由希尔伯特在1900年巴黎国际数学家会议上提出的希尔伯特第十问题。但是可惜的是,天才的图灵证明了这种一劳永逸的算法是不存在的,这说明了算法不是一切,也不能够解决一切!后来大家又发现很多不可计算问题,这些问题根本不能用算法来解决。比如Pi 的小数点后面是否存在1000个连续的7,要回答这个问题,必须不停地计算Pi, 但是Pi 是无限不循环小数,如果算到某一位发现了1000个连续的7,我们可以说命题成立;关键是,如果该命题确实不成立,我们却无法通过计算证明该命题不成立,还必须永远的算下去!这是一个很奇怪的现象,如果单纯靠算法,我们居然无法知道某个命题是否成立!后来大家又发现很多这类不可计算问题,这时候我们才知道,原来算法可以解决的只是自然中极少数的一部分问题。


相关内容

  • 数学课中蕴含的数学思想
    数学课中蕴含的数学思想 一.数形结合的思想方法 数与形是数学教学研究对象的两个侧面,把数量关系和空间形式结合起来去分析问题.解决问题,就是数形结合思想."数形结合"可以借助简单的图形.符号和文字所作的示意图,促进学生形象 ...
  • 小学数学校本培训材料
    小学数学中常用的思想方法 数学思想和数学方法的教学要求教师必需较好地重视并掌握有关的数学思想和数学方法.数学思想方法是以数学为工具进行科学研究的方法.纵观数学的发展史我们看到数学总是伴随着数学思想方法的发展而发展的.如坐标法思想的具体应用产 ...
  • 对幼儿园数学活动组织与实施的研究
    对幼儿园数学活动组织与实施的研究 -----庄河辰光幼儿园教研活动方案 一.问题的提出 数学--是现代科学技术的基础和工具,是普通教育中一门重要的基础课程,也是幼儿园五大领域中的一项内容,是具有较强的理论性和实践性的活动.<幼儿园指导 ...
  • 20XX年深圳市中考数学考试说明
    2011年深圳市初中毕业生学业考试·数学学科说明 深圳市初中数学学业考试,是义务教育阶段的终结性考试,目的是全面.准确地评估初中毕业生达到<全日制义务教育数学课程标准>(以下简称<标准>)所规定的数学毕业水平的程度, ...
  • 计量经济学复习重点
    1 计量经济学复习重点 第一章 1. 计量经济学的性质 计量经济学是以经济理论和经济数据的事实为依据运用数学和统计学的方法 通过建立数学模型来研究经济数量关系和规律的一门经济学科. 研究的主体出发点.归宿.核心经济现象及数量变化规 ...
  • 数学课程的实施策略
    数学课程的实施策略(重点教学与评价) 课堂教学是落实小学数学课程标准.达成小学数学课程目标的主要途径和基本环节.课堂教学应根据具体的教学内容,注重课程目标的整体实现,重视学生在学习活动中的主体地位,注重学生对基础知识.基本技能.基本思想.基 ...
  • 基于因子分析的旅游产业经济效应评价指标体系的构建
    [摘要]本文在总结国内外已有旅游产业经济效应研究的基础上,对区域旅游产业经济效应研究进行一个系统的文献综述.并从旅游经济规模.旅游经营效果.旅游就业贡献.旅游基础动力四个维度着手,从而探寻构建一个可比较.可分析的永州市旅游产业经济效应指标体 ...
  • 物流成本知识点
    物流成本分析 物流成本分析是在成本核算及其他资料的基础上,运用一定的方法,揭示物流成本水平变动的原因,进一步查清影响物流成本变动的各种因素,并计算出企业的物流成本效率指标. 物流成本控制 物流成本控制是根据计划的目标,对影响物流成本的各种因 ...
  • 多体系统动力学简介20**年1202
    多体系统动力学研究对象--机构 工程中的对象是由大量零部件构成的系统.在对它们进行设计优化与性态分析时可以分成两大类 一类为结构 --正常工况下构件间没有相对运动(房屋建筑,桥梁等) --关心的是这些结构在受到载荷时的强度.刚度与稳定 一类 ...
  • 康托尔 集合论
    康托尔 康托尔, G.F.L.Ph.(Cantor,Georg FerdinandLudwig Philipp)1845年3月3日生于俄罗斯圣彼得堡:1918年1月6日卒于德国萨克森的哈雷.数学.集合论. 康托尔的祖父母曾居住在丹麦的哥本哈 ...