贝叶斯判别分析在违约率预测中的应用 - 范文中心

贝叶斯判别分析在违约率预测中的应用

04/10

贝叶斯判别分析在违约率预测中的应用

孟庆福

谢亚鹏

尹铁岩

违约率、挽回率和违约相关性是运用现代模型度量信用风险的三个主要参数,其中违约率是这些参数的关键和出发点。本文运用Bayes判别分析对我国上市公司违约进行预测,从而实现对违约率的替代度量,这对于现代模型在我

国普遍应用无疑具有重要的现实意义。

一、模型设计

贝叶斯统计的思想是,假定对研究对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一组样本,用样本来修正已有的认识(先验概率分布)从而得到后验概率分布,各种统计推断都通过后验概率分布来进行。将贝叶斯统计思想用于判别分布,就得到贝叶斯判别方法。

设有n。个上市公司来自组仃。(d=1,2,…,后),共有儿=∑忍。个上市公司

作为研究样本,判别变量数为P,则上市公司u划分为组丌。的原则是u属于组7r。的后验概率最大,即:

P(7r。f戈。)=.max,P(7ri

概率为:

z。),i=1,2,…,南(1)

假设判别变量服从多元正态分布,并具有等协方差矩阵,则u属于7r。的后验

P(7r。I戈。)=1——∑—生—上

∑”xP(一11D2。;)

exp(一÷D:。)

(2)

其中,q。和qi分别是属于组7r。和组7ri的先验概率;D。。和D。i分别是u到组仃。和组7『i的广义距离。式(1)的求解等同于求式(2)中分子的最大值,或是其自然对数的最大值,即:

囡竺翌兰竺翌!兰

k=1ng。一÷D:。=lnq。一丁1(算。一面Ⅱ),∑1石。一训

=(∥。∑一1)菇。一尹1口’∑-I菇-。+lng。

此可见,贝叶斯判别方法下的判别方程是线性方程。

(3)

式(3)中第一项括号中的表达式为判别方程的系数,后面的表达式为常数项。由

二、研究样本的选取

截至2003年年底,在我国上海、深圳证券交易所上市的公司中共有123家曾被宣布为ST(以下称为ST公司),其中2003年宣布为ST的有67家。在这67家上市公司中,有51家是由于财务状况异常而被sT的,其余16家上市公司由于其他状况异常而被ST,因此,应该从样本中剔除。同时,我们另外选取了51家非ST上市公司作为参照对象(以下称为非sT公司),选取这些非ST公司的原则是:

1.满足同行业、同时期、同规模的要求。“同行业”指的是与ST公司属于同一行业;“同时期、同规模”指的是对应的非ST公司在同一时点上与ST公司在资产总额规模上相当,即选取所有非ST公司中与sT公司总资产规模最接近的公司进人样本。我们认为,这样的选取原则可以较好地满足可比性的要求,使模型更具有普遍性。

2.满足时间性的要求。为了获得足够的数据进行比较分析,同时也为了保持模型预测的可靠性,我们选取sT公司被“特别处理”前2年的财务数据作为样本,并要求样本必须具有一定的时间连续性和可比性。我们将2003年被ST的公司列为“组1”,相对应的非ST公司列为“组2”。

三、变量的选取

判别模型所使用的变量在两组样本中的均值应该具有显著的差异。经过筛选(筛选过程略),最终有10个变量纳入了本文的判别模型,这些变量的情况具体见表l。

表丑

属性

慕盘情河

变量

Z2

最终纳入模型的财务比率列表

财务比率每股净资产

属性

变量

#15

财务比率资产负债率

偿债能力

成长能力

a:6

每殷未分配利润净资产收益率

』2l

净资产增长率每股经营现金流量

获利能力

Jc7at"12

x22

总资产收益率总资产周转率

现金流量

并24

经营能力

Z13

营运资金总资产比

现金总债务比

兰三竺坌竺坚兰竺苎!窒I!:!I

四、参数估计和结果检验

在Bayes方法下,我们使用最终选取的10个财务比率作为变量。这样,我们就可以直接将样本数据带人上面设计的模型并运行程序,所得到的结果见表2、表3和表4。

表2

组别

先验概率表

先验概率

未加权

o.500o.5001.ooo

5J51

102

样本数

加权

5】.ooo51.ooo102.ooo

总计

表3

蛀大概率分组

样本号

判别P(G=g分组

样本综合统计表(实际分组1)

z分值非标准化典型判别函数值

—1.762一0.647—0.802—0.347—0.874一O.1280.4560.200—3.703一1.191一1.487—1.57l——0.608一O.8180.056—2.122一1.014—0.190一1.932一1.7150.113—2.338—1.020—2.858O.197—1.909

272829303l3233343536373839404l42434445464748495051

最大概率分组

样本号

判别P(C=g分组

11

z分值非标准化典型判别函数值

—2.0IO—0.277—4839—0.556—0.993—0.703一O26lO.013—0458—2.396一0.947—2.951—0.786—0.855一O683—1.380一1.061

马氏平方距离

O.5ll0.1600.0600.4910.0300.8460.349O.7197.055O.02lO.1930.274O.1930.0520.984J.】56O.00I0.7340.78204460.872

马氏平方距离

0.9270.59314.3800

241

D=d、0.9760.7950.8430.6740.8620.5660.7220.6031000

D=d)0.9850.64l

23

1l

000

0.7620.889O8130.6330.50707230.9930.87909980.8380.85708070.9470.90209410.534O.6210.9850.893O.7150.885O.857

56789101l1213141516171819202】2223242526

0.003O.1190.6181.0690.3481.820O.0lO3.6250.0680.037O.133O.11l0.0000.0740.9650.657O.8920.OOlO.37l0.005O.038

ll21

lllll

22

ll

0.9240.9570.964O.7810.8470.5290.9880.8930.5980.9830.9730,5590.99308940.9970.6020982

ll

2jll11

ll

1l

318

—0.065—0.236—1.992—1.011一0438一O.975——0.854

1ll

1l

ll

667

0.OOl3.2780.7230.743

21

囡竺至兰竺兰兰兰

表4

最大概率分组

样本号

判别分组

5253

54

样本综合统计表(实际分组2)

z分值非标准化典型判别函数值

2.4960.400—0.4760.686—0.657

最大概率分组

样本号

判别P(G=g分组

7879808l82838485868788899091929394959697989910010l102

2222

,-

z分值非标准化典型判别函数值

0.3271.5771.0500.2291.330O.8780.8343.4153.1743.0460.5291.80407240.9090.2861.5961.0441.00702820.580O.7121.316O.1330.2551.775

P(G=g『

D:d)0.9950.69807310.80807980.9810.8830.9320.97l0.51805820.9250.8340.781O6170.99907400.92509220.97907780.6780.9750.9lO0.6980.970

马氏平方距离

2.10004190.326O.13l01520.69l00070.04004061.0260.7920.0230.0760.1940.6734.59403000.024O.018O.6100.2020.48004920.00304190.373

马氏平方距离

O.519O.2810.0000.6690.0800.0290.0465.6054.5243.9940.2690.5730

104

D=d)0.6650.9650.900O.6180.9420.8630.8520.9990.9990.9980.7520.9780.82008700.6450.9660.8990.8920.643O.77lO.8160.9400.5690.6300.976

2l2

5556

57

8792

5859606l62636465666768697071

72

0.9661.2461.684—0.034一O.1571.1980.7720.6070.2273.19l0.5001.20l

22222

221

22

22222

O.0190580O.30l00000.0020.586O.2180

112

22

182222

7—

7—

1.8280.5980.3541749

7374757677

22

0.07208360.6280529

22

1.1030.4001.658

22

由于在SPSSl0.0中假设有效样本的先验概率是相等的,因此,在把样本分为两组的情况下,每个样本进入每个分组的先验概率都是0.5。表2给出了所有样本实际分组情况以及按Bayes判别方法得到的分组情况。P(G=g系式:

D=d)表示后验

概率,其中D表示前面提到的广义距离,d表示马氏距离。由于存在下面的关

D:(石)=d:(名)+g。+h。

其中,g。=ln

l芝2

o::萋至:,__,_至:≥}相等

o,若gl-…孤:÷

一1’…,矗

,一21nq。,若q.,…,口。不全相等

^a

2{

因此,在各组先验概率和协方差矩阵相等的情况下,D=d。第一组有6个ST

第二部分财政与金融研究网

公司被误判为非sT公司,误判率为11.8%;第二组有4个非sT公司被误判为sT公司,误判率为7.8%。这两个指标都是令人满意的。

Bayes判别方法最大的优点就是能够得出样本违约的后验概率,再加上令人满意的误判率水平,我们就可以利用这个后验概率来替代上市公司的违约率。近年来,国际上信用风险度量和管理的方法已经取得了长足的进步,开发出了很多新模型和新方法。例如,以期权理论为基础的KMV模型,以VaR方法为基础的Credit—Metrics模型,还有以保险精算为基础的死亡率模型等。在所有这些模型中,违约率都是度量信用风险不可缺少的数据。在我国,信用体系还未完全建立起来,与信用风险防范相关的数据规模很小,这些在国际上已经成熟的信用风险度量方法无法应用到我国的实证分析中,这已经成为我国信用风险度量的阶段性难题。本文中这种用后验概率替代违约率的方法虽然只是暂时性的,但却可以在现有数据不全的条件下把这些新方法应用到我国信用风险度量中来,从而推动我国信用风险管理的

发展。

参考文献

1.Daykin,Hall.1994.

Pentikainen,Pesonen.PracticalRisk

TheoryforActuaries.New

York:Chapman

and

2.石晓军、陈殿左:《信用治理:文化、流程与工具》,机械工业出版社2004年版。

贝叶斯判别分析在违约率预测中的应用

作者:作者单位:

孟庆福, 谢亚鹏, 尹铁岩

相似文献(0条)

本文链接:http://d.g.wanfangdata.com.cn/Conference_6605487.aspx

下载时间:2010年5月19日


相关内容

  • 多元统计分析方法简介
    多元统计分析 多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律的一门统计学科.多元统计分析就是讨论多个随机变量理论和统计方法的总称.多元统计分析方法是建立在多元统计分布基础上的一类处理多元统计数据的方法的总称,多元统计方法是同时 ...
  • 各种算法介绍
    各种分类算法比较 最近在学习分类算法,顺便整理了各种分类算法的优缺点. 1决策树(Decision Trees)的优缺点 决策树的优点: 一. 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义. 二. 对于决策树,数据 ...
  • 用于不确定性分析的高斯过程响应面模型
    第20卷第1期 2011年3月 计算机辅助工程 ComputerAidedEngineering V01.20No.1Mar.2011 文章编号:1006-0871(2011)01.0101.05 用于不确定性分析的高斯过程响应面模型 设计 ...
  • 概率论发展史
    17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论. 早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大 ...
  • 基于行为与时间特征的垃圾邮件检测方法
    第14卷第5期 解放军理工大学学报(自然科学版) V01.14No.5 2013年10月 Journalof PLAUniversityofScienceand Technology(NaturalScienceFAkion) Oct.20 ...
  • 医科类本科数学基础课程教学基本要求
    高等学校理工科 教学指导委员会通讯 2006年第4期(总第35期) 2006年4月 医科类本科数学基础课程教学基本要求 数学与统计学教学指导委员会 一.前 言 数学是研究客观世界数量关系和空间形式的科学.它不仅是一种工具,而且是一种思维模式 ...
  • 模型初步解释
    1. 回归分析模型:研究一个变量与另一个或者另外多个变量之间的相关关系. 一元线性回归,首先作出X ,Y 的散点图,来确认是否可以用直线拟合:其次,用最小二乘法估计出模型参数:最后通过模型可决系数,解释变量前系数的显著性来判断模型是否通过. ...
  • 甘肃酒泉风电基地风电预测预报系统
    第33卷第16期2009年8月25日 电力系统自动化 Automation ofElectric PowerSystems V01.33No.16 Aug.25,2009 甘肃酒泉风电基地风电预测预报系统 马彦宏1,汪宁渤1,刘福潮1,刘光 ...
  • 一级建造师-[建设工程经济]DOC及重点标注
    <建设工程经济>科目考试大纲及讲评 一.整体情况说明: 掌握的内容"☆"占70%:熟悉的内容"◇"占20%:了解的内容"△"占10%. 全部知识点117条,其中掌握67 ...
  • 电气工程案例
    电气工程案例报告 电网故障诊断 学号: 班级: 运用时序贝叶斯知识库的电网故障诊断方法 电网故障诊断在故障元件识别.故障后快速恢复.防止连锁跳闸等方面起着重要作用.已有神经网络.模式匹配.Petri 网等人工智能方法用于电网故障诊断.贝叶斯 ...