您现在的位置是:首页 > 行业 > 金融 >
基于数据仓库银行信用评级模型构建
2009-09-08 18:02:00作者:佚名来源:
摘要基于数据仓库,利用RBF神经网络,建立了银行信用内部评级系统,提出了企业信用主题数据模型和风险评估模型的练习过程。实证结果表明,该模型对银行信用评估可取得较好的效果。 ...
一、引言
近年来,商业银行的风险治理成为国际国内金融界关注的焦点。商业银行在运营过程中面临的金融风险主要有信用风险、利率风险、汇率风险、流动性风险和操作风险等,其中信用风险占有非凡的地位。信用风险指的是借款人由于种种原因,不愿或无力偿还银行贷款本息,使银行贷款无法收回,形成呆账损失的可能性。在现代商业银行经营中,信用风险是影响其安全高效运营的主要原因。
风险治理是一种主动的事前行为,而不是事后的补救。应通过分析现有的数据,大量运用数理统计模型识别、衡量和检测风险,利用大量历史数据建立数据仓库,依靠数据挖掘手段了对数据仓库中数据信息进行深度加工和利用,挖掘出数据模型来猜测和防范未来的风险,进行风险量化治理。数据挖掘是通过自动或半自动的工具对大量的历史数据进行探索和分析的过程,其目的是发现其中有意义的模式和规律。数据挖掘不是一种现成的产品,而是一门技能。数据挖掘的建模方法分为线形回归、逻辑回归、神经网络、遗传算法和分类树等。
由于我国商业银行目前在处在转轨阶段,一方面由于信息残缺不全,另一方面由于传统的统计方法假定条件的局限性,使我国信用风险评估难以达到满足的效果。
人工神经网络是20世纪50-60年代产生,80年代以来发展起来的一种处理复杂非线性问题十分有效的手段,目前已在模式识别等领域得到广泛的应用。
现有数十种神经网络方法,实际工作中大都采用BP网络,一些文献将其应用于银行信用风险评估取得了较好的效果。但同时BP网络也存在局限性:由于BP网络用于函数逼近时,权值的调整是用梯度下降法,存在局部极小和收敛速度慢的问题;已学习好的网络的推广问题;网络的隐含节点个数的选取尚缺少统一而完整的理论指导等。而RBF网络在逼近能力、分类能力和学习速度等方面均优于BP网络。利用RBF网络来完成函数逼近任务,并且将结果与BP网络以及采用改进BP算法的前向网络的练习结果作比较,发现RBF网络所用的时间最短。
本文将结合数据仓库与RBF神经网络构建银行信用内部评级系统。
二、数据仓库
数据仓库并非是一个仅仅存储数据的简单信息库,因为这实际上与传统数据库没有两样。数据仓库实际上是一个“以大型数据治理信息系统为基础的,附加在这个数据库系统之上的,存储了从企业所有业务数据库中获取的综合数据,并能利用这些综合数据为用户提供经过处理后的有用信息的应用系统”。假如说传统数据库系统的重点与要求是快速、准确、安全、可靠地将数据存进数据库中的话,那么数据仓库的重点与要求就是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成为有规律的信息之后,再供治理人员进行分析使用。
数据仓库必须随时间变化而不断增加新的内容,进行新的分析和综合。一方面,数据仓库中需要不断捕捉信息系统中变化的数据,将它们追加到数据仓库中;另一方面,数据仓库中包含大量的综合数据,这些综合数据中很多是和时间有关的。需要随时间变化不断进行综合。就信用评级而言,委员会规定商业银行要随时跟踪客户财务状况的变化,至少每年对客户进行一次评级。因此,数据仓库也要随时变化。利用上1年的企业评级数据及专家对评级的调整,建立和调节评级模型,来猜测分析客户今年的评级情况。
三、RBF神经网络径向
基函数网络是单隐层的3层前向网络,输入层节点传递输入信号到隐层,隐层节点的基函数对输入信号在局部产生响应,当输入信号逼近基函数的中心范围时,隐层节点将产生较大的输出。由此可见,RBF网络具有局部逼近能力。
四、数据模型
数据仓库中数据的采集需要从各种业务应用系统和治理信息系统中获取,如交易系统、信贷治理信息系统、客户关系治理信息系统等系统抽取数据,然后按照统一的数据标准,经过ETL放入数据仓库的企业信用主题系统中存储、展示。在数据仓库中可以根据需要,建立多个应用主题,其中根据信用评级的需要建立的企业信用主题中的数据模型如下:
在银行信用评估中,多采用指标打分法,影响客户信用评级的指标有很多。在本文中采用反映客户财务状况、经营状况最客观、最主要的6个指标:
资产酬率=利润总额+财务费用/年平均总资产
资产负债率=总负债/总资产
速动比率=流动资产-存货/流动负债
流动比率=流动资产/流动负债
利息保障倍数=经营活动现金流量净额/利息支出
应收账款周转率=销售收入净额/应收账款平均余额+应收票据平均余额
其中:流动比率和速动比率反映企业的偿债能力,表现放贷企业拥有债权的安全程度及贷款企业到期偿还债务的能力,假如贷款企业到期无法偿还债务,将面临破产的危险;应收账款周转率用于衡量企业在资产治理方面的效果;资产负债率反映企业的总负债在总资产中所占的比例。资产酬率反映贷款企业经营能力;利息保障倍数反映贷款企业按时还息的能力。
为了消除行业之间指标的差异性,同时对输入指标进行“归一化”处理,指标的评价采用的是“功效记分”方法,。功效记分是在选定的指标体系基础上,对每一个指标都确定一个满足值和不答应值,然后以不答应值为下限,计算各指标实际值实现满足值的程度,并转化为相应的功效分数:
指标的功效分数=指标的实际值-指标的不答应值/指标的满足值-指标的不答应值
指标的功效分数,即是该指标的评价得分。
指标的实际值比满足值好,指标的功效分数得1分,比不答应值差得零分。有的指标是较高为好,如盈利指标,有的是较低为好,如资产负债率。某银行部分行业的指标参考值如表1所示。
根据上述6个分析指标,RBF模型有6个输入节点,一个输出节点。输出节点输出客户的评估级别,在本文中分为3个级别,分别对应数值1,2,3。
五、案例
本文收集了某银行160个不同行业的贷款客户在2004年6月下旬的数据样本,去除其中17个不合格数据样本,剩下的143个数据样本中128个样本用于建立评估模型,15个样本用于进行模型检测。该银行将贷款客户的信用评级分为是10级,分别为:AAA级、AA级、A级、BBB级、BB级、B级、CCC级、CC级、C级、D级,其中D级客户已处于实际违约状态,在模型中不考虑。这样,我们将AAA-A定为1级,BBB-B定为2级,CCC-C级定为3级。1.练习神经网络。设定网络学习的误差为GOAL=0.01,RBF网络的分布SPREAD=1.0。
当神经元个数neurons=100个时,SSE=3.27185;当neurons=125时,SSE=0.0127,满足学习的误差要求,RBF网络练习完毕。
2.网络检测。将先前预备的15个企业的指标数据用于RBF网络检测。
误差符合要求,因此这个RBF神经网络模型就是从数据仓库中挖掘出的信用评级模型。六、结论本文研究了利用数据仓库结合RBF神经网络用于银行信用内部评级系统的建立,并利用我国商业银行的实际数据,对风险评估模型的效果进行了检验。实证结果表明,基于RBF神经网络的信用评级模型克服了人为因素的主观性,体现了评估的客观性、科学性,并且从仿真的结果来看,对银行信用评估可取得较好的效果。同时,在数据仓库的基础上,此数据模型可根据不断增加的新数据来进行调整,以适应社会的发展、金融投资的变化。(lynn)
(本文不涉密)
责任编辑:
下一篇:中信电子银行陈树军谈网银安全