科学评价标准的理论研究

作者：王善波

山东大学学报：哲社版 1995年02期

　　科学评价标准问题一直是科学哲学讨论的主题之一，美国科学哲学家吉里尔(R.Giere)明确指出：“五十年来科学哲学家已尽全力阐明(1)科学理论的性质及(2)作为选择一个理论优于其它理论的标准”，①只是每个科学哲学家、各个流派讨论科学评价标准的角度与侧重点不同。不过，我们必须承认这样的一种事实：要给出一个共性的即贯穿于所有类型的评价，且又具有实际操作性的科学评价标准是不可能的。

　　 1.几种有代表性的观点

　　从逻辑经验主义到波普学派，其科学评价思想几乎为科学评价标准的讨论所充斥，他们的评价标准的内容为：首先，科学评价标准属于逻辑标准；其次，经验原则，即经验是理论的唯一评判者，只不过逻辑经验主义坚持经验证实，而波普坚持经验否证。

　　库恩关于科学评价标准的含义是复杂的、多重的，并且相互间很不协调，一方面，就其一范式内部的理论评价，他承认科学评价标准是存在的，并提出了精确性、一致性、广泛性、简单性及有效性作为评价规则，但这些规则是“含糊的和易变的（他把它们比喻为象‘行动要小心’之类简单而又无用的格言），他倾向于赋予它们一个很小的作用。”②库恩在此坚持理论评价和选择的不完全决定性，走向相对主义，指出：“在相互竞争理论之间每个个别的选择取决于客观和主观因素的混合，取决于共同遵循的标准和个人标准的混合。”③但库恩认为一个范式中理论评价的最终结局应当与科学共同体的信念，或科学权贵分子的裁决相一致。另方面，由于范式之间的不可通约性，以范式整体作为科学评价客体时没有科学评价标准可循，范式之间只存在革命，不存在进步。

　　费耶阿本德在关于科学评价标准的多元化讨论中，不承认有共性标准的存在，但他对多元的评价标准的具体内容又谈得很少，于是给人们一种印象：费耶阿本德取消了评价标准，取消了科学评价问题。拉卡托斯就持这种观点。④本文认为，费耶阿本德的确有取消评价问题的企图与努力，但他同时明确主张评价标准的多元性，相互之间没有优劣之别，高低之分。

　　拉卡托斯是立足于“研究纲领”来谈他的多元化的评价标准。首先，预见标准：如果一个研究纲领能对新的经验事实作出更多的解释和预言，具有更强的预测力，则该研究纲领有更大的前途，这一标准使得拉卡托斯将时间因素引入科学评价之中，可谓科学评价思想发展的一大贡献。正由于此，人们往往只侧重拉卡托斯的这一评价标准，而忽视其它。再者，取代标准：a)新理论（T＇)比旧理论（T＇)具有更多的经验内容，b)新理论（T＇)能解释旧理论（T)的经验内容，并得到观察与实验的确证。最后，进化规则：a)不要急于淘汰处于萌芽状态的研究纲领，因为它有时即使是进步的也往往一时难以作出预言或得到确证，如早期的波动说。b)一个原已退化的研究纲领可能新生而转化为进步的研究纲领，如光的微粒说在牛顿时代居统治地位，但后来为惠更斯等人的波动说取代而居退化阶段，直到二十世纪初爱因斯坦的光量子假说的提出才又得以重见生机。他批判了波普等人的“即时理性”的观点。由此可发现，拉卡托斯关于评价标准的内容是丰富的，并蕴含着许多辩证思想，但又是最有争议的：“他的确避免了逻辑经验主义及波普的过于狭窄的标准，但由于拉卡托斯的评价标准过于宽大而有些软弱。”⑤

　　 L.劳丹(Larry Laudan)也对科学评价标准进行了研究。他批判了库恩和拉卡托斯的观点，指出“库恩没能看到概念问题在科学争论中范式评价中的作用。如果说库恩提出范式选择和评价范式‘进步性’的合理标准的话，那些标准也只是传统的实证论标准”。⑥同样劳丹认为拉卡托斯的进步概念完全是从经验着眼的，这与库恩相同，拉卡托斯的另一致命弱点是，科学评价标准是对构成每个研究纲领的理论系列的经验内容的比较和量度，对此格伦鲍姆(A.Grunbaum)也指明，要为科学理论一五一十地规定经验内容的量度在字面上可以，实际中根本不可能。⑦针对以上缺陷和不足，劳丹把问题分为经验问题和理论问题，指出：“可以以如下方式定义理论的评价方法：一个理论的总解题有效性可由对该理论所解决的经验问题的数目和重要性及由此理论生成的反常问题和概念问题的数目和重要性的估算来确定。”⑧劳丹进一步提出“研究传统”作为他的评价单元，在此基础上他的科学评价标准包括以下内容：a)一个研究传统的可接受性取决于它最新理论的解决问题的有效性。b)研究传统的进步性有两种测度：“研究传统的总进步——将一个研究传统之最久远形式的理论的合适性与此研究传统之最新理论作比较，即能确定研究传统的总进步”，⑨及“研究传统的进步率——指给定时期中研究传统的一时合适性的变化”⑩。c)一个研究传统的前景或合理的可寻求性决定于该研究传统显示出来的进步。劳丹以上思想在以后他与R.劳丹、A.多诺万合作主编的学术论文集《科学体察》中进一步系统化，坚持一个理论的评价取决于多种因素(“2.1”至“2.11”)(11)，并从科学史中对之进行有力的事实论证，譬如该书中的霍恩斯(Michael J.Hones)撰写的《弱电统一与理论评价》，莱耶曼(R.Laymon)的《迈克尔逊—莫雷实验与理论评价》等论文就做了这项工作。

　　 2.科学评价方法与科学创作方法的分化

　　导致科学评价标准混乱局面的一个很重要原因就是科学评价方法没有从人们通常所谈的科学方法即科学创作方法中分化出来而成为一个独立的层次，这有些象近代科学若不从自然哲学的母体中分化出来就必然导致整个知识体系的紊乱一样。科学评价标准在人们的印象中内容很丰富，但又有些模糊不清，因而成为科学哲学中最为棘手的课题之一。本文认为要对科学评价标准有一个正确的清楚的认识就必须首先确立科学评价方法的独立地位，任何一种东西若没有自己应有的自主性，就很难正常运转。随着科学评价活动及理论的深入，科学评价主体同科学创作主体（科学家）的分化，科学评价客体同科学创作客体（科学对象）的分化，科学评价方法也必然随之从科学创作方法中分化出来，形成自己独特的运动机制。科学评价标准包含于科学评价方法之中，是科学评价方法的集中表现，科学评价方法是谈科学评价主体如何对科学评价客体进行评价，这就存在一个遵循的规则或标准的问题，不阐述科学评价标准的科学评价方法是不妥当的。

　　 3.科学评价标准的层次结构

　　科学评价标准作为一个系统具有不同的层次性，并且每一层次上的评价标准也是多元的。

　　一般的科学评价标准这是科学哲学中所论述的评价标准，该标准受到某些科学家的批评，甚至否定，科学家认为科学中一切正常运行，无需哲学家来操心，不存在象科学哲学家所谈的评价标准或规则，这些观点都是从自己的知识背景而发的片面之见。一般的科学评价标准讨论的是整个科学发展过程中进行科学评价所遵循的规则，它适合于各种不同的具体学科，并且它的研究为各种不同的科学域(domain of science)中具体的科学评价标准的建立提供理论基础和方法论指导。

　　具体的科学评价标准这是指在各门具体学科中进行科学评价时所运用的评价标准。它随科学域的不同而具有自己的特殊性，如物理学中某些科学评价标准很难适合于社会学领域中。对某一特定的科学域，其科学评价标准涉及许多具体的参量，具体的变化，具有可实际操作性，这些都是一般的科学评价标准所没有的，下面所谈的Bromley报告就属于对具体的科学评价标准讨论的情景。

　　就评价标准的实用性，有的学者提出了关于科学进步的“科学的某种实际的可检测的目标”及“科学总体上的实用性”(12)的评价规则或标准，来力图克服人们曾指责过的波普、拉卡托斯等人的评价标准的含糊性，但这种不分层次性而强加一个“实用性”的漂亮外壳的作法是徒劳无益的，科学评价标准并不以这一漂亮外壳而变得实用起来，科学家也并不以这一漂亮外壳而对之大加赞赏，而恰恰相反，这种不分层次的简单拚凑只能招来更加严厉的指责。因为在一般的科学评价标准层次上很难具有实用性，而实用性只能作为具体的科学评价标准的一个重要特征，这可从下面的分析中发现。

　　 4.作为具体科学评价标准的范例：Bromley报告

　　 1972年，美国国家科学院的物理学研究会出版了一项三卷本的研究成果：《物理学概观》，因它是耶鲁大学的D.Allin Bromley教授领导下进行的，所以称此研究为Bromley报告，(13)这是第一次在某个主要的科学域中阐述科学评价标准问题，其中它设计了三个总标准，其中二个是内在优越性和外在优越性，这些总标准被细分为14个亚标准，其中5个是内在的，9个是外在的。第三个总标准是结构，此标准考虑到了物理学研究的社会结构，及这个结构如何通过承受物理学亚领域中的问题而受到影响。在该结构标准中所概括的讨论实例有：在该领域中产生进步所需的主要新手段的程度；为保持活力或者为获得一个关于主要资金投资的合适的科学申报所迫切需要的支持该领域的程度；对某学科兴旺的持续必须的作为其中一部分存在的该领域维持的程度。每个领域的优越性可被总结为14个成份的直方形，每个成份即为一个亚标准，其分量是通过委员会投票测验而决定，委员会对优越性或标准的分配展现在下图中。根据内部标准和外部标准，主要物理学亚领域中通常的评审团的级别的直方形也展现于其中，附加于这些直方形上的直线为每个亚领域提供一个特征性标志。这些标志自然地划分为三个层次，同时强调了随亚领域的成熟而发生的从内在区域向外在区域，即从内部标准向外部标准的转化。

　　 1.探究的成熟度

　　 2.所提出的问题的意义

　　 3a.基本规律的发现的潜力

　　 3b.发现广泛的科学应用的共性的潜力

　　 4.对最有能力的物理学家的吸引力

　　 5.对其它科学的潜在贡献

　　 6.对其它科学领域的潜在激发力

　　 7.对工程学、医学、应用科学的潜在贡献

　　 8.对技术的潜在贡献

　　 9.立即应用的潜力

　　 10.对社会目标的潜在贡献

　　 11.对国家声望与国际合作的贡献

　　 12.对国防的贡献

　　 13.对大众教育的贡献

　　图(1)：作为具体评价标准的Bromley报告

　　 Bromley报告关于具体科学评价标准的详细讨论具有重大的实际意义和认识意义，为我们正确理解具体科学评价标准的内容提供了一个优秀的模式，首先它所建立的评价标准是多元化的，有三个总标准，共分14个亚标准，其次该评价标准建立的方法和途径是统计规律的运用，即取决于该委员会成员的判断及平均评分如何，具有相当的可靠性，最后它采用了动态的标准建构方式，开始是该学科的内在标准，但随该学科的成熟，该学科便转向科学评价的外在标准。

　　 5.一般性科学评价标准

　　科学哲学家对科学评价标准的讨论基本上是针对这种一般性科学评价标准而发的，该标准存在于整个科学发展的图景之中。

　　 5.1 一般性科学评价标准是变化的吗？

　　从逻辑经验主义到波普的否证论，拉卡托斯的“研究纲领”，从本格(M.Bunge)的精确哲学到普特南(H.Putnam)的科学实在论等等，他们在论及科学评价标准时暗含了这样一种确定无疑的信念：一般性科学评价标准是不变的。逻辑经验主义认为其经验证实原则是不变的；波普虽然主张科学是进化的，但他的否证度和逼真度的评价标准是不变的；拉卡托斯虽然极力将统一的逻辑标准从科学评价标准中驱除出去，而把时间因素引入科学评价之中，但却没有把时间因素引入到科学评价的标准中，他的研究纲领的取代及进化标准是不变的。库恩和费耶阿本德力图冲破这种观念，他们谈的相对评价标准却象沙滩上的一个空贝壳一样缺乏丰富的内容。L.劳丹、图尔敏等人在这种方向上做了一些有意义的工作，图尔敏将科学评价标准在“生态学方式”的基础上得以说明，认为评价标准也是不断进化的；劳丹则坚持把特定时代的历史标准与理性决定的超历史的一般标准相互结合的双重标准，这在目前来说还是相当深刻的。本文认为，一般性科学评价标准是随科学发展的不同历史阶段而具有不同的内容，贯穿所有历史阶段的绝对评价标准是不存在的，对此的任何寻求和企图都是徒劳的。

　　 5.2 基于评价单元的评价标准的内容

　　在科学哲学史上，许多科学哲学家花了大量的精力与时间来建造他们各自的评价单元，虽然这些评价单元有这样或那样的缺陷和不足，譬如，无论是拉卡托斯的“研究纲领”、库恩的“范式”、劳丹的“研究传统”等评价单元从根本上说带有点“先验”的味道，但他们的这种寻求评价单元的努力方向是值得肯定的，本文认为，科学评价的评价单元为科学理论体，它是指科学家或科学共同体从事科学活动并创立科学理论（或理论系列）而构成的过程性有机体，或表达为：

　　面对以这样的科学理论体为评价单元(The unit of evaluation)进行评价，其评价标准应包括以下内容：

　　 a.潜评价单元阶段的评价标准

　　在科学的发展中若存在着某种评价单元，则必然有该评价单元的自然生成、建立及发展过程，处于生成和建立过程中的评价单元称为潜评价单元，此时科学评价是以将其显化为目的，其中伴随着该评价单元在科学发展中的地位和作用的澄清。该阶段科学评价标准确立的依据是构成该评价单元的各要素的素质及相互间的作用方式与性质。

　　 Ⅰ：就科学共同体，其评价指标（或标准）有：

　　 ①该科学共同体的学术气氛及开放程度。

　　 ②该科学共同体的学术带头人的素质（如德才兼备）

　　 ③所处的社会或环境对该科学共同体的支持程度。

　　 ④若该科学共同体已存在一段时间，则它在这段时间内所创立的科学理论的质与量如何。

　　这几方面表现得越优（可通过学术界多数专家的公评完成），则该科学共同体越优秀，如现代物理学中的哥本哈根学派。

　　 Ⅱ：就科学网（由科学理论、科学方法、科学目的等共同构成）(14)，首先，科学网的内因化评价标准，当人们面对同一论域中的两个科学网作出比较和选择时，其构成要素的比较与评价是极其重要的，若在同一科学域中，某一科学网RS[,1]中的“理论”为T[,1]T、[,2]、T[,3]等构成的理论系列，另一科学网RS[,2]中的“理论”为T＇[,1]、T＇[,2]、T＇[，3]等构成的理论系列，无论T[,1]较T＇[,1]、T[,2]较T＇[,2]、T[,3]较T＇[,3]，还是T[,1]T[，2]T[,3]间的合作与配合较T＇[,1]T＇[,2]T＇[,3]间的合作与配合，都具有逻辑自洽性、数学化、简单性、协调性或和谐性等，则作为其中的理论因素，RS[,1]优于RS[,2]。同样，科学网中的“方法”、“目的”及构成要素之间的整体配合或合作都可作类似的比较与评价。譬如，人们接受哥白尼学说而抛弃托勒密的地心说的一个重要原因是，托勒密的理论体系极其复杂与繁琐，共有几十个本轮与均轮。其次，科学网的形式化评价标准。就特定科学域而言，与科学共同体同时发生作用的科学网是多个并存，其中必定有一个主科学网RS[,0]，其它科学网处于次要地位，是RS[,0]的一种推演和应用，对RS[,0]既有保护作用，又有引发危机的可能性。某科学网地位的确定是通过评判该科学网与其它科学网相互作用的方式和性质来进行和完成的。若某科学网的思想、方法及目的对其它科学网具有最强的渗透力，影响力，则该科学网为主科学网。一旦确定了主科学网RS[,0]，那么其它次科学网的表现形式及其认识论地位就可断定（见图(2)），其中次科学网中的理论肯定发生变化，虽然变化和程度不已，但其适用的科学方法、追求的科学目的有的全部沿用RS[，0]的，有的只沿用RS[,0]中的一个，有的则全部不沿用RS[,0]的。

　　图(2)科学网的形式化标准

　　下面举一个例子加以说明：

　　在牛顿时代，各科学学派林立，多种科学网并存，而构成的科学理论体（即评价单元）数目众多，其中有代表性的例如：

　　 A：牛顿学派创立的牛顿力学网（多个并存），如，牛顿本人创立的科学网：

　　惠更斯创立的科学网：

　　前者为RS[,0]后者则为RS[,1]中的第一种形式。

　　 B：天文学领域中如哈雷所创立的科学网：

　　哈雷研究并确定了在1337年到1698年间出现的二十四颗彗星的轨道要素，其结果刊于1705年的《哲学学报》。

　　 C：光学领域中，牛顿于1704年出版的《光学》中采用并建立的科学网，

　　及由胡克、惠更斯等人建立的科学网：

　　两种科学网互争，相互取代，直到二十世纪初光的量子学说的确立（爱因斯坦），两种科学网才得以有机结合，不过当时前者属于次科学网中的第一种形式即方法与目的皆沿用主科学网的；后者属于次科学网中的第四种形式，其方法与目的都没有采用主科学网的，而是自己独创的，它将对主科学网起破坏作用。

　　从不同科学域中的A、B、C等几种并存的科学网相互作用、相互渗透的方式与性质看，A是主科学网RS[,0]。

　　由上面Ⅰ、Ⅱ的分析，若评价单元1中的科学共同体1优于评价单元2中的科学共同体2，科学网1相应地优于科学网2，并且科学共同体1与科学网1间的相互作用又较为和谐，“配合”更为密切，那么评价单元1必定优于评价单元2。

　　 b.显评价单元阶段的评价标准

　　通过a我们可完成评价单元由潜到显的转化，转化过程可能经历几年、几十年甚至几个世纪。但在转化过程结束后科学评价的标准又是如何呢？

　　横向标准指在既定时期内评价单元具有的评价标准，若评价单元在该时间内取得的阳性证据（指对科学网起支持作用的证据）越多，则其可靠性越强；相反，若取得的阴性证据（对科学网的反面证据）越多，则该评价单元的可靠性越差；若只取得一些中性证据（对科学网既不起支持作用，也不起否定作用的证据），则该评价单元的可靠性保持不变，不过这种情形很少。

　　纵向标准无时间因素的限制，一个评价单元如果有很好的演化潜力，则：

　　 ①被证实的预见的新颖度高，这可由预见本身与人们通常所处的背景知识之间的差距来衡量，或有时可凭理论本身与背景知识的差距来衡量，如爱因斯坦的狭义相对论和广义相对论本身就很难被当时人们所理解和认识。

　　 ②所取较高质量的阳性证据过程维持时间长，而所取得的阴性证据很少，或其阴性证据本身就是伪证据。

　　 ③解决问题的潜力大，即解决问题的数量多，有效性高。

　　 ④该评价单元往往作为其它评价单元建立的样板

　　一个评价单元若具有一定的可靠性，但并不一定有好的演化潜力；有好的演化潜力，但目前可靠性不一定表现得好，这决定了科学评价需要一个过程。一个优秀的评价单元应是两者集于一体的评价单元。

　　因此，一般性科学评价标准同样是变化的，不同阶段有不同的评价标准，而且是多元化的。

　　注释：

　　 ①Ronald N.Giere,"The Cognitive of Science"Nancy J.Nersessian(ed.),"The Process of Science",Martinus Nijhoff Publishers,Dordrecht,1987,P.142

　　 ②Larry Laudan:"Science and Values",University of Califorma Press,1984,P.30

　　 ③T.Kuhn,"The Essential Tension",chicago:University of Chicago Press,1977,P.325

　　 ④I.Lakatos,"The Problem of Appraising Scientific Theories:Three Approaches",in `Mathematics,Science and Epistemology',ed.John Worrall and Gregory Currie,Cambridge University Press.1987,P.107-110

　　 ⑤舒炜光、邱仁宗主编：《当代西方科学哲学述评》，人民出版社，1987，第154页。

　　 ⑥Larry Laudan,"Progress and Its Problems",University of California Press,1977,P.73

　　 ⑦A.Grunbaum,"Can a Theory Answer More Questions than One of 27.(1976).Its Rivals?The Britism Journal For the Philosophy of Science",Vol.27.(1976).

　　 ⑧⑨⑩Larry Laudan,"Progress and Its Probems",University of California Press,1977,P.68,P.68,P.105

　　 (11)Arthur Donovan.Larry Laudan & Rachel Laudan(ed.):"Scrutinizing Science:Emprical Studies of Scientific Change",Kluwer Academic Publishers.1988.P.31～32

　　 (12)林定夷：《论科学进步的目标模型》，《中国社会科学》，1990年第1期，第3-18

　　 (13) Alvin M.Weinberg:"Criteria for Evaluation,a GenerationLater",in Ciba Foundation Conierence:"The Evaluation of Scientific Reasearch",1989.John Wiley & Sons Ltd,Chichester,UK,P.3-8

　　 (14)这里“科学网”沿用L.劳丹的网状模型(The Reticulated Model),参见L.Laudan,"Science and Values',University of California Press,1984,p.62-66

科学评价标准的理论研究

相关内容

热门内容