《商场现代化》杂志

杂志等级

期刊级别：国家级期刊收录期刊：万方收录(中) 上海图书馆馆藏国家图书馆馆藏知网收录(中) 维普收录(中)

本刊往期

全部文章

2014030期	2014029期
2014028期	2014027期
2014026期	2014025期
2014024期	2014023期
2014022期	2014019期
2014018期	2014017期
2014016期	2014015期
2014014期	2014013期
2014012期	2014011期
2014010期	2014009期
2014007期	2014006期
2014005期	2014004期
2014003期	2014002期
2014001期	2013034期
2013032期	2013031期
2013030期	2013029期
2013028期	2013027期
2013026期	2013025期
2013024期	2013023期
2013022期	2013021期
2013020期	2013019期
2013018期	2013017期
2013016期	2013015期
2013014期	2013013期
2013012期	2013011期
2013010期	2013009期
2013008期	2013007期
2013006期	2013005期
2013004期	2013003期
2013002期	2013001期
2012036期	2012035期
2012034期	2012033期
2012032期	2012031期
2012030期	2012029期
2012028期	2012025期
2012024期	2012022期
2012021期	2012020期
2012019期	2012018期
2012017期	2012011期
2012010期	2012009期
2012008期	2011017期
2011012期	2011011期
2011009期	2011008期
2011007期	2011006期
2011005期	2011004期
2011003期	2011002期
2011001期	2010021期
2010020期	2010019期
2010018期	2010017期
2010016期	2010015期
2010014期	2010013期
2010012期	2010011期
2010010期	2010009期
2010008期	2010007期
2010006期	2010005期
2010004期	2010003期
2010002期	2010001期
2009033期	2009026期

站内搜索

友情链接

暂无链接

首页 > 杂志论文 > 基于聚类分析解决银行申请贷款问题研究

杂志文章正文

基于聚类分析解决银行申请贷款问题研究

发布时间：2024-07-05 浏览次数：33 返回列表

闫华竹　中央民族大学

[摘　要]为了解决申请贷款问题，需要对客户的审贷信用进行评级，此评级过程主要使用了数据挖掘中的聚类分析的方法。通过对客户基本信息的挖掘和聚类分析，可以得出客户申贷的信用级别，从而对客户的审贷问题进行分级处理。

[关键词]信贷风险　聚类分析　数据挖掘

一、方法介绍：聚类分析

聚类分析能够将一批样本数据，在没有先验知识的前提下，根据数据的诸多特征，按照其在性质上的亲疏程度进行自动分组，且使组内个体的结[来自WwW.lw5u.com]构特征具有较大相似性，组间个体的特征相似性较小。

K-Means聚类也称作快速聚类，属于覆盖型数值划分聚类算法。它得到的聚类结果，每个样本点都唯一属于一个类，而且聚类变量为数值型，并采用划分原理进行聚类。

二、数据挖掘——K-Means模型

搜集数据阶段主要是对某银行的客户信息数据进行整理和汇总，重点选取那些影响客户申贷评级的那些指标，例如客户的年龄、收入、资产、债务、贷款量、风险、信用等级，按时还贷习惯等等。这些指标都是笔者通过访谈银行相关部门的工作人员，通过获取相关经验得出的指标，此外这也是国际通用的对客户信用评级的常用指标。通过对某银行客户信息进行整理和汇总，得出20个典型客户的申请贷款信息资料。

数据挖掘的过程中，首先需要构建k-means模型，这就需要相关clementine软件操作，对数据集进行模型导入。经过k-means模型分析后，这组数据被分为四组，数据集按组别重新排列。分析结果显示了四类所包括的样本数分别为6、1、7、6个样本，以及各变量的均值和标准差。如果聚类变量是分类型的，则显示各类别的百分比。对各类特征的描述是聚类分析结果中不可或缺部分，viewer卡以图形矩阵的形式直观显示了各类各变量的特征。

在这些评判指标中，重要指标有五个，分别是信用等级、年龄、结果、资产和风险。对重要指标分别进行分析，可以得出各组的重要客户特征。

通过对各组“信用等级”情况比较分析中，我们发现cluster-3样本的信用等级都是绿，cluster-1中5个样本的信用等级是绿、1个是黄，cluster-4中3个样本信用等级是红、1个是绿、2个是黄，cluster-2样本的信用等级都是黄，如图2-5。同样地，对各组“年龄”情况进行比较分析，cluster-3样本的4个中年3个老年人，cluster-1中6个样本都是年轻人，cluster-4中6个样本都是年轻人，cluster-2样本的年龄是中年；再对各组 “结果”进行比较分析，cluster-3和cluster-1的样本都按时还款，cluster-4样本中1个不履行还款、3个延时还款、2个按时还款，cluster-2的样本都延时还款；对各组“资产”情况进行比较分析，cluster-3样本的资产平均值是513929.35，cluster-1样本的资产平均值是25256.85，cluster-4样本的资产平均值是37474.30，cluster-2样本的资产平均值是91111.30。

针对四组样本的情况，凭借以上五个重要指标，笔者对四组提出批贷建议，如表。对于cluster-3批准贷款，对于cluster-4不批准贷款，而对于cluster-1和cluster-2，银行需要限额批准贷款，以防控风险事件的发生。

三、结论

通过聚类分析研究，把某银行20个典型客户情况进行分类，分成了四组。然后针对五个重要指标信用等级、年龄、结果、资产、风险，对四组情况进行比较分析。我们发现第三组的信用等级为绿、结果按时、风险低、资产量最大，对于这样的客户银行可以放心的批准其贷款；第四组的客户风险高、年龄小、存[来自WWw.lw5u.com]在不履行还款现象、信用等级存在红50%，对于这样的高风险客户银行应不予批准贷款；对于第一、二组的客户，他们存在延时还款现象、信用等级存在黄色，风险中、高现象，对其可以批准贷款，但是贷款额度需要设定一定限制。

参考文献：

[1]《Clementine数据挖掘方法及应用》，电子工业出版社.薛薇，陈欢歌.2012,9

[2] 聚类分析技术在中国移动客户消费模式中的应用研究.李颖慧.2010,3

[3] 高世光，基于模糊聚类的数据挖掘技术研究.国防科技大学.2002,1