知识网络的结构与演化 - 范文中心

知识网络的结构与演化

09/12

知识网络的结构与演化

——概念与理论进展

刘向/马费成/陈潇俊/陈柏彤/贾茜

2012-10-26 14:45:12 来源:《情报科学》(长春)2011年6期

【英文标题】Structure and Evolution of Knowledge Network:Concept and Theoretical Developments

【作者简介】刘向(1983-),男,湖北黄石人,博士研究生,主要从事知识管理与复杂性科学研究.,武汉大学,信息资源研究中心,湖北武汉430072;马费成,武汉大学,信息资源研究中心,湖北武汉430072;陈潇俊,武汉大学,信息资源研究中心,湖北武汉430072;陈柏彤,武汉大学,信息资源研究中心,湖北武汉430072;贾茜,武汉大学,信息资源研究中心,湖北武汉430072

【内容提要】知识网络的结构及演化研究是探索知识的发展脉络和创新趋势的基础,本文从拓扑结构和演化机制两个方面综述了知识网络的理论研究进展。首先,回顾了知识网络及相关概念的来源和相互关系,将当前的知识网络研究划分为物理统计和概念认知两种研究思路,比较了两种思路在研究内容和方法上的差别;然后,从结构的不均匀性、小世界特征和微观结构三个方面归纳了知识网络的拓扑结构研究,从相应结构特征的生成机理和演化模型归纳了知识网络的演化问题研究;最后,指出了当前研究的不足和未来的研究重点。

It is the foundation for exploring the history and innovation trends of knowledge of the study of structure and evolvement of knowledge networks, this paper reviewed the theory research by the content of topology and evolvement mechanism of knowledge network. First, it looks

forward the history of the concepts, divide the contemporary study to two perspectives: physical statistics and concept cognitive, and compare their differences in content and method. Then, it analysis the network's topology by three aspects: non-proportioned structure, small-world characteristic and partial structure, and proposes the formation

mechanism and evolvement model of those structure. The last, it points the shortage and the following research point.

【关 键 词】知识网络/结构/演化/概念/理论进展Key words: Knowledge network; Structure; Evolution; Concept; Review

1 引言

当代科技日新月异,知识与信息快速增长,学科领域纷繁复杂,知识门类在高度分化的同时不断趋向综合,已逐步演化为一个复杂的网络体系。面对如此庞大而复杂的网络结构,人们要理清其中知识发展的脉络,对知识的创新领域和发展趋势做出准确的判断也变得越来越困难。这一情势已经危及到人类的知识生产、利用和再创造活动,学术界形象地称其为情报危机[1]。

上世纪50年代人们即开始对知识网络进行研究。SCI创始人Garfield很早便意识到科学引证网络(Citation Network)可以反映科学知识之间传承、发展的关系,并且尝试利用引证网络研究科学知识发展的历史、脉络和结构[2];Bernal,Price,Leake和Shryock等学者均表示对这一想法的认同,针对几个领域的引证网络分析也证实了其有效性[3]。Price借助物理统计的方法对引证网络的拓扑结构及人们的引证行为进行了分析,通过对文章参考文献的时序分布的研究,

指出引证过程中经典理论和研究前沿(Research Front)的区分[4]。1981年,英国情报学家Brookes又提出了认知地图(Cognitive Map)的构想,他认为可以将紧密相连的若干学科领域的固有联系表示成概念联结网络,每一片段情报都成为网络经脉之上的一个要素,从而形成表示科学认知结构的知识发展脉络,他还利用加拿大学者Farradan的关系索引和数据库,针对液晶领域的引证数据绘制出了认知地图的雏形[5]。对于Brookes的认知地图构想,马费成对其进行了高度评价,认为认知地图如果成功构建,可以有效遏制人类的情报危机,也会使情报学研究取得突破性进展[6];赵蓉英、邱均平等学者认为这一构想指明了未来知识组织的最高目标[7-9]。

基于类似的想法,人们探索了分析知识网络结构和知识发展脉络的多种方法和工具,例如科学知识图谱(Mapping Knowledge Domains)[10]、概念地图(Concept Map)[11-13]、合作网络(Collaboration Network)[14]、知识超网络(Knowledge Super-network)[15]等。然而,这些研究更多的关注于知识网络的可视觉形态或相互关系的描述上,多是定性的概念模型和实证性研究思路。知识网络是一个复杂的、时变动态系统,当前的方法在揭示知识发展的动态演变过程及洞察知识的创新领域和发展趋势上遇到困难。

研究知识网络的拓扑结构及演化过程是厘清知识的发展脉络、探测和追踪创新领域及发展趋势的基础。然而目前此方面的研究却较少,即使有,也只是在统计物理学、复杂网络、动力系统等类期刊中零散的涉及,如Physical Review Letter、Physical Review E、Nature、Science、Physica A、etworks等,情报和知识管理学者对此方面的研究还是较少的。基于这样的一种现状,本文对知识网络的结构及演化方面内容进行梳理和总结,分析当前的研究中的不足,并提出未来的研究重点。

2 基本概念

知识网络目前还没有明确的定义,它是一个集合概念,指的是与知识、信息及知识间联系有关的一类网络。在知识网络中,节点(Vertex)一般代表知识单元的存储单位,由考察的粒度不同,可以取为书刊、论文、专利、情报片段或词等;边(Edge)即表示知识单元之间的连接关系,在引证网络、词网络中即是引证关系,在共现网络(共词、合著、合作等网络)中即是共现关系。

往知识网络中添加新节点且与网络中已存节点进行连接即可描述为新知识的产生和对旧知识的继承。引证网络中知识节点的加入与连接具有时间上的先后次序关系,故引证网络是无环(Acyclic)的有向网络(Directed Networks);而Web信息网络中网页信息由于可以反复更新和相互链接,所以多数是有环的,如下图1所示。

图1 左图为引证网络,右图为web信息网络

如果不考虑节点之间的连接边的方向性,则是无向网络(Undirected Network);如果给每条边都赋予相应的权值,那么该网络就称为加权网络

(Weighted Network);而如果节点包含状态属性,并且节点的状态和网络都是动态演化的,那么就形成动态网络(Dynamic Network)。目前针对知识网络的研究更多是基于无向网络,较少考虑网络中边的方向性和加权特征,应用动态网络来进行知识网络研究的就更少。然而有向网、加权网和动态网能更贴近知识网络的发展实际,对这几个方面的研究也需要进一步加强,如图2所示。

图2 无向网络图(左) 有向网络图(中) 动态网络图(右)

知识网络结构的基本描述量主要包含平均路径长度(Average Path Length)、聚类系数(Clustering Coefficient)和连接度(Degree)等。特征路径长度即平均路径长度,指网络任意两个节点之间最短路径的平均值,用以衡量节点之间的距离。网络聚类系数衡量网络的聚类特征,是所有节点聚类系数的平均值,而节点的聚类系数指的是此节点及其相邻节点形成的三角形的数量与三元组的数量的比值。节点的出度(Out-degree)是此节点指向其它节点的边的数目,入度

(In-degree)则是其它节点指向该节点的边的数目,连接度是出度与入度之和。

3 理论来源与发展思路

3.1 两种研究思路

物理史学和情报学家Price在1965年发表于Science、情报学家Brookes在1981年发表于Journal of information science的著名文献[4-5]反映和奠定了当前知识网络领域上的两种最主要研究思路。Price的研究基于物理统计的方法,侧重于对实际知识网络的拓扑结构和演化特征进行客观描述和分析,其统计对象通常是实际存在的知识载体,例如文献、书刊等;而Brookes的认知地图构想则立足于认知的角度,他从关联检索中获得灵感,将知识对象的粒度由文献定位到更微观、更抽象的情报单元,以及由情报单元组成的情报空间,虽然他进行的实证研究也是利用引文数据,然而更重要的是指明了基于认知、对微观情报单元进行考察的研究方向。

立足点和研究对象的不同导致了上述差异,也带来了研究方法上的不同。上述两种工作思路各有所长,前者对于大规模网络的统计分析具有很好的优势,且由其研究对象的实在性和唯一性,也便于从客观的角度分析知识网络的演化过程;后一思路与人类的认知行为、使用语言和思想表达相关,虽然能更好刻画人类的认知活动和过程,但是由于自然语言在语义上的含混性、多义性和交叉性,使得依此思路的知识网络结构与演化的研究困难较大。此后,在知识网络及相关问题上的研究也基本上延续了这些差别。

3.2 理论发展

Price的研究思路立足于对知识网络的统计分析,避免了对自然语言的语义进行判断处理,只是关注网络的拓扑结构及生成过程,其研究对象具有客观性和可比性,目前在网络的结构及生成机制方面取得了一些成果。大多数统计物理学、力学、动力系统、系统工程背景的专家学者均采用这一研究思路。其中代表性的研究有如下几种。

(1)表现知识的前承后接关系的引证网络[4]、这是最早提出的一种知识网络形态,它的主要研究对象是文献(学术文献、专利文献、网页信息等),以及文献之间的引证、耦合(Coupling)和共现(Co-occurrence)关系等;

(2)表现语言词汇互为诠释关系的词网络(Words Network)、共词网络

(Co-words Network)[16],这方面的研究起源与词典分析,知识对象的粒度较引证网络小,但是研究方法与引证网络的研究基本相似,不过由于自然语言词汇的多义性和含混性,词网络较引证网络就更复杂;

(3)针对知识创造主体合作关系的合著网络(Co-author Network)[17]、合作网络[14],合作关系隐含着知识在团体、组织之间的流动,把知识研究的对象扩展到了拥有知识的人、项目和组织,基本可以列入共现关系网络的类别;

(4)针对多层次、多主体关联结构的知识超网络[15]、广义合作网络

(Generalized Collaboration Network)[18],前述几种网络的研究对象大致都是单一的,而知识超网络、广义合作网络则将不同层次、不同类别的相关知识对象融合到了一起,例如知识超网络即包含概念、文献、作者、组织等做多方面关联内容。

Brookes的研究思路基于认知角度,希望结合人类的认知过程简洁明了的描述概念和主题的关系及发展脉络,与思维、语言等要素是结合在一起的。大多数情报学、心理学、教育学和管理学专家学者采用这一研究思路。代表性的研究有如下几种。

(1)针对语义、主题和概念关联的语义地图(Semantic Map)[19]、认知地图

[5],它们与词网络的表示有些相似,但是侧重于人类认知过程,基于知识学习、理解的知识网络构建,不是简单的词汇关联关系;

(2)表现认知过程及思维发展的思维导图(Mind Map)[20-21]、概念地图

[11],它们起源于教育和心理的实践领域,和认知地图的意思是很相近的,但是偏重于人类思维发展过程,网络其中不光包含知识单元,还包含组合规则、命题、等级、判断等要素,形成的是一个可直观理解的认知结构图;

(3)侧重知识结构形态描述及知识可视化的知识地图(Knowledge Map)[7]和科学知识图谱[10],早期的知识地图主要用于可视化的描述知识的地理和组织分布、知识流动等,现阶段的科学知识图谱也注重于知识的形象化表示。

当然,不能一概而论,上述研究中包含大量相互交叉、相互渗透的内容,比如科学知识图谱、词网络即是介于二种思路之间的。按照当前的发展特征来说,方法上呈现综合化趋势,例如文献[22]的研究。

由上可以看出:①Price所开创的物理统计视角下的研究思路是自然科学的研究方法,对知识网络的拓扑结构和演化机制的统计分析和模型研究目前也都取得了一些进展,本文也主要是对这个方面的研究成果进行综述。②Brookes所提出的认知视角下的研究构想则略偏向于人文社会科学的研究方法,进行的多是定性分析,提出的也多为概念模型,创新的想法较多,然而一致的、客观可比的数量性研究成果却很少,关于知识网络拓扑结构及演化模型方面的研究也较少。

本文对于认知视角下的知识网络研究不作详细评述。关于这方面的知识网络

理论综述和学术研究可以参考文献[7-9]、[11-13]、[21-22],其中[7-9]探讨了知识网络的相关概念的演进过程及其中的哲学发展规律;[11-13]系列专门针对概念网络进行了评述、分析和实证,研究了个人结构化知识图示的构建;[21-22]系列基于共词网络方法探讨了知识概念结构,分析了科学知识体系的网络结构和知识单元的增长模式,从词汇维度定性解释了科学知识网络的形成与演化机理。

4 知识网络结构

如前文所述,情报学领域对知识网络拓扑结构的研究早在上世纪50年代就已经开始了,例如Garfield引证网络分析法的提出[2],Price等人对引证网络连接度满足负幂分布的发现[4]等,然而之后却就没有太大进展了。直到1998年动力系统专家Wattz & Strogatz的小世界网络(Small-world Networks)[23]和1999年物理学家Barabási & Albert的无标度网络(Scale-free Networks)[24]的提出,对于各种类型实际复杂网络(Complex Networks)的验证性和应用性研究蓬勃兴起。当前对于知识网络的探讨也多是基于这一背景,所采用的方法也多是Price、Wattz & Strogatz、Barabási & Albert所共同采用的物理统计和动力系统方法。

4.1 连接不均匀性与马太效应

知识网络中节点连接分布的不均匀性。Price 较早开始了对引证网络

(Citation Network)的研究,对引证网络中引证关系的较小规模的统计分析,发现引证网络中论文被引次数,即知识节点入度(in degree)满足指数为2.5-3.0的幂率分布(power law distribution)[4]。Redner更大规模的统计分析也验证了这一结论的正确性,他通过统计ISI(Institute for Scientific

Information)1981年至1997年的783,339篇文献及Physical Review D上20年的24,296篇文献,指出引证网络的入度具有指数约为3的幂率尾(power-law tail)[25]。此外,de Castro & Grossman[26]、Newman[27]、Broder[28]、Barabási[29]等对合著网络、共词网络、web信息网络的统计分析也发现了其中的幂率分布特征。而关于引证网络中的出度,Vazquez对期刊文献的统计分析指出满足指数分布(Exponent Distribution)[30]。

虽然幂函数和指数函数两种类型分布具有截然不同的性质,然而它们所表现的“富者更富”(Rich get Richer)的特征是相同的,部分节点具有极高的连接度,而大量的节点的连接度则很低,都体现了网络的极大不均匀性。早期情报学界将它们统一理解为马太效应(Matthew Effect)的影响,并不作幂率分布和指数分布作细致的区别。

4.2 小世界结构

知识网络中节点的关联性方面研究较重要的是其中的小世界特征,即短平均路径长度和高聚类系数。Cancho & Sole构造了英文词汇网络,统计发现网络的平均路径长度为2.67,聚类系数为0.437,具有小世界特征[31]。刘知远对汉语词汇网络也进行了分析,发现网络的平均路径长度介于2.63-2.75之间,而聚类系数则在0.535和0.619之间,同样具有小世界特征[32]。此外,Newman[27],Ferrer-i-Cancho[33]等通过统计分析,发现引证网络、共词网络、合著网络均具有小世界特征。国内学者王晓光[34]、韦洛霞[35]、刘盛博[36]、林敏和李南等[37]也分别统计分析了网络信息交流(博客)网络、共词网络、合著网络和合作网络等,证实了中文网络中普遍存在的小世界结构。

鉴于小世界现象在情报学领域的普遍存在性,马费成将之归纳为情报空间的基本原理之一,并且指出知识小世界原理是情报相关性的具体表现,短特征路径长度和高聚类系数实现了大世界向小世界的转换,而WS模型不仅证实了信息相关性存在的普遍性,也找到了实现联系的一般方式[38]。

关于小世界网络的应用性研究,徐升华和杨波运用基于多主体建模开发平台Netlogo构建基于小世界网络的知识转移网络的仿真模型,指出在小世界网络的条件下,主体行为与组织知识转移的效率能达到较高的水平[39]。夏昊翔等提出一个综合网络演化和网络中知识传播的动态网络建模框架暨元模型,开发了一个计算机仿真实验平台原型,以辅助采用基于Agent建模范式的科研合作网络演化和知识传播研究[40]。

4.3 微观拓扑结构

随着复杂网络研究的进一步深化,更细致的网络微观结构特征也相继被人们提出来。Milo & Shen等提出了复杂网络的基本组成单元——模体(Motif)[41],指的是一组物理上或功能上连接在一起的、共同完成一个独立功能的节点,它描述的是网络的局部特征,是网络的基本模块,例如,www上相似主题的网页或网站等。王晓光研究了期刊论文(主题词)共词网络的拓扑结构,发现网络内存在一个超大的主体区块,该区块内的任意节点之间都是相互可达的,而主体区块之外存在大量独立的小区块,他认为小区块的形成主要原因是文章作者在标引文章主题时使用了不规范的关键词,由此导致这些词汇没有与主区块建立联系[22]。杨洪勇和王福生统计了科研合作网络节点度和模体的连接度,指出二者均满足幂率分布[42]。

同时,人们又发现复杂网络往往具有自相似(Self-similarity)的结构,部分和整体具有很明显的相似性,如此一来,便可以把大规模复杂网络研究化约到单一结构的模体研究上来。Song等人的研究表明,许多实际网络,包括www网络、社会网络等,在某种长度—标度(Length-scale)下确实是自相似的[43]。此外,等级网络(Hierarchical Network)[44]、超家族(Superfamily)[45]、富人俱乐部(Rich Club)[46]等网络结构形态也分别从不同的视角在简化网络的结构研究。

还有一些较为零散的研究。Barabási等对科学家合著网络的无标度特征进行分析,通过一个简单算法即时提取演化网络结构图,研究发现网络的内部联系在决定标度和网络拓扑中的重要作用[29]。Csárdi提出了研究科学引文和合作网络的一种新方法,这种方法依赖于KERNEL和节点属性的标量功能,可随机增减顶点和边,可方便的用于理解演化网络的动态性[47]。杨玉兵和潘安成分析了强联系网络、重叠知识与知识转移的关系后,论证了强联系网络可以通过其内部的重叠知识对组织知识转移产生影响作用[48]。席运江和党延忠在个人知识存量结构分析的基础上,提出了个人知识存量的加权知识超网络模型,分析了多对象、主体的知识网络结构及模型,并对知识点的获取和度量方法进行了探讨[15]。于洋等针对目前只根据专家经验定性判断知识传播趋势的不足,进一步提出了一种利用超网络模型分析知识传播趋势的定量方法[49]。

5 网络演化

5.1 不均匀连接度的生成机制

较早的研究是宽泛的针对马太效应的作用机理的。Simon构造了针对词频分

布、期刊分布、作者分布的形成过程的Beta分布模型,此分布模型的极限形式为负幂函数[50];而后,针对引证网络的连接度,Price借助Polya模型构建了知识增长的积累优势(Cumulative Advantage)过程模型[51],模型的极限形式也是负幂函数。

5.2 小世界结构的演化机理

小世界结构说明了知识网络中知识元素之间普遍的相关性和快捷的联动性,那么这种结构又是如何形成的呢?这种结构形成的机理是什么?对于小世界网络的生成机理,Wattz & Strogatz提出了的小世界网络的构建算法[23],即WS模型:(1)从规则图开始:考虑一个含有N个点的最近邻耦合网络,它们围成一个环,其中每个节点都和与它左右相邻的各K/2节点相连,K为偶数;(2)随机化重连:以概率p随机地重新连接网络中的每个边,即将边的一个端点保持不变,而另一个端点取为网络中随机选择的一个节点。其中,任意两个不同节点之间至多只能有一条边,并且每个节点都不能有边与自己相连。由此而形成高聚类、短特征路径长度的小世界网络。

WS模型通过在规则网络中进行断链和随机重连而生成小世界网络,这一模型体现了实际网络连接关系的随机性和规则性并存,反映规则网络、随机网络和小世界网络之间的过渡关系;然而WS模型构造算法中的断链随机重连过程可能会破坏网络的连通性,针对这个问题,Newman & Wattz又提出了小世界网络的改进构造算法(NW模型),以随机加边过程取代随机重连过程以确保网络的连通性,即在构造算法的第二步只往网络中添加新边,而不需要将以往的连接断开

[53]。此后,人们还提出了小世界模型的一些其他变形[27]。值得一提的是,Barabási & Albert构造的无标度网络也具有短特征路径长度的特征,然而这一网络的聚类系数却很小,与随机网络近似相等[24]。

上述小世界网络构造模型与知识网络的演化过程均存在很大的差异,主要可以归纳为以下三点:(1)知识网络是一个动态增长的网络,不管是引证网络、词网络,还是共现网络,知识节点和知识连接都在增长,而上述小世界网络构造模型均是起始于一个既定知识节点的规则网络,没有考虑节点的增长;即使是重视边增长的共现网络,也需考虑节点增长的情况,既定规模的初始网络模式不符合

知识网络的实际特征。(2)知识网络中边的连接一般立足于确定的知识基础和学科领域,人们创造的新知识节点通常会连接特定领域范围内的旧知识节点,而并不是如WS、NW模型中的简单的随机连接。(3)知识网络的高聚类系数特征是演化过程中形成的,而不是如WS、NW模型中那样一开始便确定了的。

5.3 演化模型

考虑知识节点连接数的增长特征,BA模型是连接数为常数的平稳增长模型,而引文网络的连接数(即参考文献数量)是非平稳增长的。Biglu对SCIE上近40年的抽样数据统计表明,篇均参考文献数量由1970年的8.4篇上升到2005年的34.63篇,拟合曲线近似线性增[54]。而Krapivsky & Redner对《物理评论》在110年里发表的文章的统计发现,每篇文章引用的参考文献数目随文章发表时间呈对数增长[55]。对于这一类问题,Dorogovtsev提出了幂率增长(Power Law Growth)模型[56],Shi & Chen等提出了对数增长(Logarithmic Growth)模型

[57],梳理分析与实验仿真发现均生成满足某一非平稳指数的无标度网络。

知识网络一般具有高聚类性,具有局域演化的特征。这是由于专家学者一般是工作于特定的研究领域,故而引证过程一般是针对特定领域的引证。针对此类问题,Li & Chen提出了基于局域世界的演化网络模型,此模型的择优过程并不针对网络全局,而是基于随机选取的局域世界,仿真结果显示,随着局域世界的扩大,网络连接度分布由指数分布向幂率分布过度,作者指出这一模型对于解释国际贸易中的区域性贸易组织和互联网中的局域网连接是有效的[58]。实际上,这一模型也可以推广到知识网络的研究中来。

此外,还有一些与知识网络相关的演化模型被提了出来。比如Albert &

Barabási提出的组合演化模型[59],Dorogovtsev等人提出的原始吸引模型

[60],Liu等人提出的随机和择优混合模型[61]等,更详尽的内容可以参考Newman,Boccaletti & Latora等的综述文章[27,62],以及汪小帆、李翔和陈关荣的著作[63]。

6 研究评论与发展趋势

6.1 研究评论

对于当前知识网络的结构与演化的研究,细节上的问题在正文中多以做出评述,这里不再赘述。以下从方法和内容两个方面,对此领域国内外的研究做出评论,重点指出研究中的不足之处。

在研究方法上,需要重视以下几个方面的问题。

(1)目前情报学领域专家学者对知识网络的研究更多还是基于Brookes所提出的认知视角,多是描述性、实证性的研究;而关于知识网络的拓扑结构和演化模型的研究,则多是物理、动力系统领域学者进行复杂网络研究过程中提出来或简单涉及到。从上述综述中可以看到,基于物理统计和动力系统的方法所取得的成果是很大的,情报学学者需要充分重视研究方法上的吸收和改进。

(2)动态网络和加权网络方法涉及也较少,知识网络是一个动态发展的网络,动态网络和加权网络的方法可以更准确的描述知识网络的发展过程,然而基于这两个方面知识网路的研究却几乎是空白。

在研究内容上,以下几个方面的研究还需要加强:

(1)当前针对知识网络的研究更多的关注于知识网络结构的可视觉形态和相互关系的描述上,对于知识发展的动态过程和演化机理的研究过少。网络生成过程和演化机理是进行知识可视化的基础,对此方面的研究需要大力加强。

(2)对知识网络结构的研究,特别在微观结构方面,研究成果非常少。目前对知识网络结构的研究仅集中在几种特征之上,比如小世界、无标度等,更进一步的结构分析较少。复杂网络研究领域目前提出了很多针对大规模网络结构分析的方法和工具,比如模体、社团等,可以尝试着用来分析知识网络。

(3)对知识网络演化模型的研究。小世界网络和无标度网络的演化模型虽然可以部分反映知识网络的演化特征,但是与知识网络的实际演化过程还是存在很大的差距,这一点在正文中也已经指了出来。

6.2 研究趋势

上文中所提到的当前研究的不足之处,均可以作为未来的研究重点。不过从知识网络研究的长远发展来看,以下几个问题值得系统的进行考察:

(1)知识网络的生成机制。知识网络的生成机制研究关注于形成知识网络的关键因素以及要素之间的相互关系。对于这些内在性因素与作用机制的考察,是分析知识发展脉络的基础,是研究知识创新趋势形成过程的基础;对知识网络结构及生成机制的探讨也是将外在结构与内在作用机理联系起来的纽带,从而形成表里互相诠释的作用。

(2)知识网络的演化过程及演化模型。演化过程既反映知识网络的时序结构变迁,又体现知识和概念的内在涵义流变,演化模型是知识网络内在作用模式及作用过程的抽象表达。对演化过程的探讨是分析知识网络结构的基础,是探讨知识热点形成及创新趋势形成的基础。

(3)知识演化网络中研究热点和创新趋势的形成过程。对于知识创新趋势,当前主要是通过基于时序词频统计和聚类分析的办法,得到知识的研究热点和发展重点[14],然而这只是一种事后的方法,其实质只是得到过去的发展动态,带有显著的时滞效应,很难用它来预测知识的创新与发展趋势。因为事物在其初创期或发展初期,往往并不表现出明显的数量上的优势,通过量的统计办法是难以觉察知识的创新与发展趋势的。为了克服这一问题,人们又想到通过词频的即时变化率来进行分析,华裔美国学者陈超美基于这种想法开发了Citespace知识可视化工具[64],然而这也受到知识领域发展规模等因素的影响。知识热点和创新趋势体现了知识创造主体的一致行为,这一过程促成了知识创造者的协同工作,也增加了知识创造的盲目性和狭隘性。对知识发展热点的形成过程进行研究,是开展科学研究、指导知识生产的重要依据,这是知识管理、情报学领域长久以来的一个核心问题。

7 结语

知识网络是研究知识关联关系、探索知识发展脉络、追踪知识创新趋势的有效途径,而对知识网络结构及演化规律的研究则是这一问题的根本。当前关于知识网络结构及演化模型等方面的研究只是零散地分布在物理、动力系统、复杂网络等领域专家学者的研究成果之中,本文归纳总结了这一方面的成果,希望其中

好的方法、研究思路能为情报学、知识管理领域专家学者所掌握和使用。

本文首先回顾了知识网络及相关概念的来源和相互关系,将当前的知识网络研究划分为物理统计和概念认知两种研究思路:其一是以Price为代表的物理与动力系统专家所提出的物理统计与动力系统分析思路,这种思路对于分析大规模知识网络的拓扑结构和演化模型具有独特的优势;另一是以Brookes为代表的情报、心理、教育和管理学者所提出的认知演进视角的分析思路,此种思路反映了人类学习和认知活动的本质特征。并且,比较了两种思路在研究内容和方法上的差别。然后,从结构的不均匀性、小世界特征和微观结构三个方面归纳了知识网络的拓扑结构研究,从不均匀结构的生成机理、小世界结构的形成过程及演化模型归纳分析了知识网络的演化问题;最后,指出了当前研究的不足和未来的研究重点。

【参考文献】

[1]马费成,等.信息管理学基础[M].武汉:武汉大学出版社,2002:29.

[2]Garfield E. Citation Indexes for Science[J]. Science, 1955,(122):108-111.

[3]Garfield E. Citation Indexing—Its Theory and Application in Science, Technology, and Humanities[M]. Philadelphia: ISI Press, 1983: 69-123.

[4]Price D J. Networks of scientific papers[J]. Science,

1965,(149):510-515.[5]Brookes B C. The foundations of information science(Part IV)[J]. Journal of Information Science, 1981,(3): 3-12.

[6]马费成.论布鲁克斯情报学基本理论[J].情报学报,1983,2(4):318-321.

[7]赵蓉英,邱均平.知识网络研究(I)—知识网络概念演进之探究[J].情报学报,2007,26(2):198-209.

[8]赵蓉英.知识网络研究(II)—知识网络的概念、内涵和特征[J].情报学报,2007,26(3):470-476.

[9]赵蓉英,张洋,邱均平.知识网络研究(III)—知识网络的特征探析[J].情报学报,2007,26(4):583-587.

[10]Borner K, Mane K K. Mapping topics and topic bursts in PNAS[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(1):5287-5290.

[11]马费成,郝金星.概念地图在知识表示和知识评价中的应用(I)——概念地图的基本内涵[J].中国图书馆学报,2006,32(3):5-9.

[12]马费成,郝金星.概念地图在知识表示和知识评价中的应用(II)——概念地图作为知识评价的工具及其研究框架[J].中国图书馆学报,2006,32(4):22-27.

[13]马费成,郝金星.概念地图及其结构分析在知识评价中的应用(Ⅲ):实证研究[J].中国图书馆学报,2006,32(5):9-16.

[14]Barabási A. L., Jeong H., Néda Z., Ravasz E., Schubert A., Vicsek T.. Evolution of the social network of scientific collaborations[J]. Physica A: Statistical Mechanics and Its Applications, 2002,(311): 590614.

[15]席运江,党延忠,廖开际.组织知识系统的知识超网络模型及应用[J].管理科学学报,2009,12(3):12-21.

[16]刘则渊,尹丽春.国际科学学主题共词网络的可视化研究[J].情报学报,2006,25(5):634-640.

[17]晏尔伽,朱庆华.我国图书馆、情报与文献学领域作者合作现状——基于小世界理论的分析[J].情报学报,2009,28(2):274-282.

[18]Zhang P., Chen K., He Y., et al.. Model and empirical study on some collaboration networks[J]. Physica A, 2006,(360):599-616.

[19]Lambiotte, J., et al.. Multirelational semantic maps[J]. Educational Psychology Review, 1989,1(4):331-366.

[20]Buzan T., Buzan B.. The Mind Map[M]. New York: Plume, 1996:80.

[21]王晓光.科学知识网络的形成与演化(I):共词网络方法的提出[J].情报

学报,2009,28(4):599-605.

[22]王晓光.科学知识网络的形成与演化(Ⅱ):共词网络可视化与增长动力学[J].情报学报,2010,29(2):314-322.

[23]Watts, D. J. and Strogatz, S. H.. Collective dynamics of 'small-world' networks[J]. Nature. 1998,(393): 440-442.

[24]Barabási A L, Albert R. Emergence of scaling in random networks[J]. Science, 1999,(286): 509-512.

[25]Redner S. How popular is your paper? An empirical study of the citation distribution[J]. Eur. Phys. J. B., 1998,(4):131-134.

[26]de Castro, R. and Grossman, J. W.. Famous trails to Paul Erdōs[J], Mathematical Intelligencer, 1999,(21): 51-63.

[27]Newman M E. The structure and function of complex networks[J]. SIAM REVIEW. 2003, 45(2): 167-256.

[28]Broder, A., Kumar, R., Maghoul, F., Raghavan, P., Rajagopalan, S., Stata, R., Tomkins, A., and Wiener, J.. Graph structure in the web[J]. Computer Networks, 2000,(33): 309-320.

[29]Barabási A. L., Jeong H., Néda Z., Ravasz E., Schubert A., Vicsek

T.. Evolution of the social network of scientific collaborations[J]. Physica A: Statistical Mechanics and its Applica tions, 2002,(311): 590-614.

[30]Vazquez A. Statistics of citation networks[J]. Arxiv Preprint Cond-mat/,2001,(5):3.

[31]Cancho R F I, Sole R V. The Small World of Human Language[J]. Proceedings of the Royal Society of London Series B-Biological Sciences, 2001, 268(1482): 2261—2265.

[32]刘知远,郑亚斌,孙茂松.汉语依存句法网络的复杂网络性质[J].复杂系统与复杂性科学,2008,5(2):1-9.

[33]Ferrer-i-Cancho R, Solé RV. The small world of human language[J]. Proceedings of the Royal Society of London. Series B, Biological Sciences, 2001, 268(1482):2261-2265.

[34]王晓光.博客社区内的非正式交流:基于网络链接的实证分析[J].情报学报,2009,28(2):248-256.

[35]韦洛霞,李勇,李伟,等.汉字网络的3度分隔与小世界效应[J].科学通报,2004,49(24):2615-2616.

[36]刘盛博.中国科技管理领域科技合作复杂网络分析[J].情报学报,

2010,29(1):177-183.

[37]林敏,李南,季旭,等.研发团队知识交流网络的小世界特性分析与证明[J].情报学报,2010,29(4):732-736.

[38]马费成.论情报学的基本原理及理论体系构建[J].情报学报,2007,26(1):3-13.

[39]徐升华,杨波.基于小世界网络模型的知识转移网络特性分析[J].情报学报,2010,29(5):915-919.

[40]夏昊翔,王国秀,宣照国,等.针对科研合作网络演化建模的基于Agent实验平台原型[J].情报学报,2010,29(4):634-640.

[41]Milo, R., Shen-Orr, S., Itzkovitz, S., Kashtan, N., Chklovskii,

D., and Alon, U.. Network motifs: Simple building blocks of complex networks[J]. Science, 2002,(298): 824-827.

[42]杨洪勇,王福生.科研合作网络中的模体涌现模型[J].情报学报,2009,28(4):606-609.

[43]Song C, Havlin S, Makse H A. Self-similarity of complex networks[J]. Nature, 2005,(433): 392-395.

[44]Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z., and Barab?

觃si, A.-L.. Hierarchical organization of modularity in metabolic networks[J].Science. 2002,(297): 1551-1555.

[45]Milo, R., Itzkovitz, S., Kashtan, N., et al.. Superfamilies of evolved and designed networks[J]. Science, 2004,(303):1538-1542.

[46]Zhou S, Mondragon R J. The rich-club phenomenon in the Internet topology[J]. IEEE Communication Letters, 2004, 8(3): 180-182.

[47]Csárdi G, Strandburg K, Zalányi L, Tobochnik J and Péter ?魪rdi. Estimating the dynamics of kernel-based evolving networks[C].

Proceedings of the Sixth International Conference on Complex System, 2010.

[48]杨玉兵,潘安成.强联系网络、重叠知识与知识转移关系研究[J].科学学研究,2009,27(1):25-29.

[49]于洋,党延忠,吴江宁,邓秋红.基于超网络的知识传播趋势分析[J].情报学报,2010,29(2):356-361.

[50]Simon H. A. On a class of skew distribution

functions[J].Biometrika, 1955, 42: 425-440.

[51]Price D J. A general theory of bibliometric and other cumulative advantage processes[J]. J. Amer. Soc. Inform. Sci. 1976,(27): 292-306.

[52]Bianconi, G. and Barabási, A.-L.. Bose-Einstein condensation in complex networks[J]. Phys. Rev. Lett. 2001,(86):5632-5635.

[53]Newman, M. E. J. and Watts, D. J.. Renormalization group analysis of the small-world network model[J]. Phys. Lett. A1999,(263): 341-346.

[54]Biglu, MH. The influence of references per paper in the SCI to impact factors and the matthew effect[J]. Scientometrics, 2008, 74(3): 453-470.

[55]Krapivsky P L., Redner S.. Network growth by copying[J].Physical Review E, 2005,(71): 18.

[56]Dorogovtsev, S. N. and Mendes, J. F. F.. Effect of the

accelerating growth of communications networks on their structure[J]. Phys. Rev. E 2001,(63): 25,101.

[57]Shi DH, Chen QH, Liu LM. Markov chain-based numerical method for degree distribution of growing networks[J]. Phys. Rev. E, 2005,(71): 36,140.

[58]Li X, Chen G. A local world evolving network model[J].Physica A, 2003,(328): 274-286.

[59]Albert, R. and Barabási, A.-L.. Topology of evolving networks:

Local events and universality[J]. Phys. Rev. Lett. 2000,(85): 5234-5237.

[60]Dorogovtsev, S. N., Mendes, J. F. F., and Samukhin, A. N.. Structure of growing networks with preferential linking[J].Phys. Rev. Lett, 2000,(85): 4633-4636.

[61]Liu Z. H. et al.. Connective distribution and attack tolerance of general networks with both preferential and random attachments[J]. Physics Letters A, 2002,(303): 337-344.

[62]Boccaletti S., Latora V., Moreno, Chavez M., Hwang D. U.. Complex networks: Structure and dynamics[J]. Physics Reports, 2006,(424): 175-308.

[63]汪小帆,李翔,陈关荣.复杂网络理论及其应用[M].北京:清华大学出版社,2006:27-46.

[64]Chen, C. Visualizing semantic spaces and author co-citation networks in digital libraries[J]. Information Processing & Management, 1999, 35(3): 401-420.


相关内容

  • 产业专业化.多样化对城市群经济增长的影响
    第33卷第179期财经理论与实践(双月刊) V01.33NO.179 2012年9月 THETHEORYANDPRACTICEOFFINANCEAND ECONOMICS SeP. 2012 ・经济管理・ 产业专业化.多样化对城市群经济增长 ...
  • 网络英语及其与词汇演化的关联
    网络英语及其与词汇演化的关联 常朝霞 [摘要]: 20世纪50年代计算机的发明和过去30年内因特网的出现以来,我们已经开始拥抱崭新的信息时代,特别是最近的20年内,IT(信息技术) 产业发展迅速, 不可避免地在经济,政治,文化等领域和社会生 ...
  • 科学知识的不同建构理论
    作者:邱德胜 中国人民大学学报 2013年10期 一.三种建构理论 20世纪70年代以来,伴随着SSK(科学知识社会学)的兴起与演化,传统科学哲学视科学乃自然之镜的科学观受到多方的质疑和挑战,并涌现一系列新的观点,社会建构论.异质建构论.实 ...
  • 网络话语分析
    网络话语分析 (2013-10-24 10:38:52)转载▼ 标签: 文化 网络 社会学 话语分析 分类: text 内容提要:网络流行语不仅活跃在网络交往行为中,而且已经流出网络进入现实生活之中.生动活泼的网络流行语显示了网民对社会生活 ...
  • 03130现代科学技术基础
    河北省高等教育自学考试课程考试大纲 课程名称 现代科学技术基础 课程代码 03130 第一部分 课程性质与学习目的 一.课程性质与特点 本课程是高等教育自学考试开设的专业基础课之一.现代科学技术极大地推动了社会生产力的发展,使人类走向信息时 ...
  • 如何避免交通工程投标中的重大偏差
    ValueEngineer'ingNo.6,2008价值工程2008年第6期 如何避免交通工程投标中的重大偏差 HowtoAvoidintheTrafficEngineeringBidtheSignificantDeviation 王文清W ...
  • 复杂性科学对会计研究的方法论意义
    摘要:复杂性是指涌现性属性不可由确定性图灵机上的多项式时间算法归约到低层组分属性与运动规律的系统认识论特征.由于认知的反身性,社会系统逻辑地具有其普遍规律不可解的复杂性特征,并决定了社会经验的历史性与不可测性,导致对社会规律的经验检验的不可 ...
  • 演化经济学面临思维转向:从生物演化到社会演化
    [摘要] 目前演化经济学中占主导地位的是生物演化思维,它使用生物学隐喻和还原论方法,将自然主义和社会达尔文主义引入到社会经济现象的分析中.但实际上,人类世界与自然界之间存在巨大差异,这表现在行动主体.演化特性.演化动力.演化进程以及演化结果 ...
  • 国家创新系统:对实施科技发展道路的新探索
    作者:陈劲 自然辩证法通讯 1995年02期 更快地发展科学技术,以促进经济.社会的持续发展,是我国发展战略上一个极为重要的议题.在科技发展中,科技发展道路的实施具有独立的重要地位. 对发展中国家来说,这一问题的重要性还在于如何实现所谓的G ...
  • 知识禀赋对国际贸易结构的影响分析
    中图分类号:F740 文献标识:A 文章编号:1009-4202(2011)08-000-01 摘 要 知识经济条件下,知识禀赋对国际贸易在不断地产生影响,并且这种影响效应是渗透在国际贸易的各方面,特别是国际贸易的结构方面其不仅促进国际贸易 ...