
毕业论文(设计)大数据技术在pp平台风险管控中的应用.doc
11页大数据技术在P2P平台风险管控中的应用07年开始,P2P网贷进入中国,一肓没有走进大众视野,肓到13年,互联网金 融概念爆发,P2P网贷步入发展元年,以每天一家新平台的速度增长,互联网金融开 始全面进入市场15年,由于制度缺失和行业不规范等原因,P2P迎来了行业内的洗 牌风暴,陷入危机中的平台纷纷破产跑路随着P2P金融日益发展,其中暴露的征信、 风险控制、资金链管理问题亟待解决,本文试以大数据思想和数据挖掘方式,运用马 尔可夫链‘logistic模型,探究P2P金融如何通过相关征信系统数据,选择资金需求方, 控制资金流,建立征信机制,以减少资金风险,完善行业体制关键词:P2P平台风险控制;互联网金融;大数据技术;金融数据挖掘;1. 绪论 11.1. 研究背景和意义 错误!未定义书签1.2. 研究目标和主要内容 错误!未定义书签1.2.1. 研究FI标 错误!未定义书签1.2.2. 主要内容 错误!未定义书签1.3. 教学软件现状与设想: 错误!未定义书签1.3.1. 教学软件的优点: 错误!未定义书签1.3.2. 教学软件需面对的几个问题 错误!未定义书签1.3.3. 对教学软件的设想 错误!未定义书签。
2. 教育软件的运行平台及技术选择 12.1. 运行平台的比较: 错误!未定义书签2.2. 开发语言以及开发工具的比较: 22.3. 对教育软件的运行平台及技术选择: 错误!未定义书签3. 概要设计 23.1. 功能设计 错误!未定义书签32框架结构设计 错误!未定义书签4.1. 3.2.1软件结构层次 错误!未定义书签4.2. 游戏流程设计 错误!未定义书签3.3 •脚本设计 错误!未定义书签1. 文字脚本 错误!未定义书签4. 详细设计 34.1. 数据组织 错误!未定义书签4.1.1. 工厂模式 错误!未定义书签4.2. 事件的传递与处理 65. 总结与展望 错误!未定义书签6. 参考文献 97. 致 谢 错误!未定义书签1.绪论作为互联网的重要分支,P2P平台在我国的迅速发展,填补了小微企业融资贷款 业务的空白,同时给个人投资提供了高收益的投资渠道,在中国发起了一场互联网金 融革命但作为高收益产品,其背后的高风险也不容忽视根据网贷之家的统计,只 15年2月一个月内,出现问题的平台有58家,远超去年同期,在P2P雨后春笋一般 涌现的浪潮过后,网贷市场迎来了彻底的洗牌,平台出现了跑路高潮,其中,更不乏 注册资本千万,甚至上亿的平台,问题网贷平台的运营时间也有变长的趋势,一家上 线已经4年的平台,也陷入了提现危机中,面临资金链断裂崩溃的局面。
中国的网贷 行业,门槛低、模式多、缺少监管,导致平台资质良莠不齐,频繁出现坏账、提现困 难、停业、跑路等等问题简单来说,P2P风险大致分为两类:平台自身管理漏洞和借款人风险其中,平 台自身漏洞包括:非法集资风险,非法洗钱,房贷风险,运营管理风险,虚假平台风 险和声誉风险等,如在江苏苏州侦破的“乐天堂”开设赌场案中,抓获第三方支付平 台“快钱”公司的高级管理人员梅某经查,梅某与境外赌博集团勾结,协助境外赌 博集团流转资金30余亿元,“快钱”公司从中获利1700余万规避这类风险,更多的 是从管理和顶层出发,出台相关监管措施规范行业行为而借款人风险则是因借款人 无法按时还本付息,从而形成坏账,如何规避这类风险将是本文讨论的重点根据融 360发布的P2P评级报告显示,P2P行业整体坏账率上升(超过3%),已经造成数目 庞大的坏账绝对数额,因此,如何控制坏账规模,选取优质借款人就成了大数据技术 首先要分析解决的问题,并对此提出量化可操作的稳定解决方案2.国内外文献综述2. 1.国外文献综述P2P网贷起源要追溯到穆罕默徳•尤努斯的“小额贷款”的服务,这服务是专门 提供给因贫穷而无法获得传统银行贷款的创业者。
随着互联网技术的发展,小额贷款 服务可以通过网络来实现国外在信息不对称等网贷问题有相当的研究Magee(2011)U为P2P网贷平台的核心优势就是可以让借款人以低于银行利率借 到资金,且不需要通过担保或抵押投资者也能获得不错的回报Bruett (2007)认为“团贷”在解决信息不对称问题上更具成效传统金融机构对道 德风险的监控一直很重视,降低贷款违约风险((Hartley; 2010), “团贷”小组成员之间 是连带责任,这就使他们之间进行相互监督,降低违约率2. 2.国内文献综述在国内,2013年是P2P兴起的“元年”P2P为人所知的时间较短,关于它的研 究相对集中在P2P公司、咨询公司以及信用评级公司,而国内文献对于P2P的风险 控制研究较为有限赵丽(2014)定性分析了 P2P风险,并从监管主体、立法、行业透 明度、信用体系等多方面对风险控制提出解决方案;唐嘉悅和郝萌(2014)应用AI1P 方法,系统建立了一套P2P风险指标评价,在各因素权重的基础上,提出了我国P2P 风险的管理措施和监管模式;程灿(2015)从资金池流向出发着重分析P2P资金池风 险和假标风险2. 3.国内外文献总结这些硏究大多从宏观层面出发,对P2P风险控制提供指导性意见。
当前的研究缺 乏从微观角度去分析P2P,为不同类型的风险提供不同的解决方案,本文从P2P平台 角度出发,关注其风险中的坏账、信用评级等、资金流控制部分,通过建立相关数学 模型为其风险管控提供建议3. P2P网贷理论概述3.1. P2P网贷的特点[1] 1. 1 •“长尾”理论根据维基百科,“长尾” (The Long Tail)这一概念是由《连线》杂志主编Chris Anderson在2004年十月的"长尾” 一文中最早提出,用来描述诸如亚马逊和Netflix 之类网站的商业和经济模式长尾”实际上是统计学中幕律(Power Laws)和帕累托分 布(Pareto distributions)特征的一个口语化表达长尾理论主要包括三个方面的结论:1、产品种类的长尾比我们想象的要长;2、 我们现在可以有效的开发这个长尾市场;3、一旦集合起来,所有利基产品可以创 造一个很大的市场过去人们只能关注重要的人或重要的事,在网络时代,由于关注 的成木大大降低,人们有可能以很低的成木关注正态分布曲线的“尾部”,关注“尾部” 产生的总体效益甚至会超过“头部”互联网平台构筑了金融活动的“长尾基础”,我们通过成本几乎可以忽略不计的工 具来创造资源一一数字“物资”造就“富足经济”。
P2P借贷目标客户就是小微企业主 及缺乏信用记录的优质客户,他们不适合使用传统风险评估模型进行信用评估,故而 是银行等金融机构不愿也不能很好服务的“长尾”客户1.2.供应链金融理论供应链金融是指围绕核心企业,管理上下游中小企业的资金流和物流,通过获取 各类信息,将风险控制在最低的金融服务,实现了单个企业的不可控风险转化成供应 链企业整体的可控风险P2P网贷平台可为上下游企业提供灵活的中小金额贷款,可为企业降低原材料采 购成木以及客户资源获取成木由于核心企业的关系,平台对上游供应商的把握能力 较强,供应商会提供真实的业务票据,贸易真实性、业务风险比较容易把控与监管3. 2. P2P网贷的前景与发展首先,我国民间借贷所占比例很大,穆迪公司近期发布的数据显示,影子银 行总资产在2014年己经超过四十万亿元,占国民生产总值的65%o 2014年中国民间 金融市场规模超过五万亿除去小额贷款等非银行金融机构的以外,中国狭义上的民 间借贷规模己经超过五万亿,可见,金融市场的增长空间还是很大的其次,从中小企业融资需求来看,我国小微企业融资约束严重资料显示,我国 经济总量中,销售收入,工业生产总值由中小企业创造的经济财富所占比例分别占40% 和60%,提供了大量的就业机会。
据有关数据统计:规模小于五十人的小微企业中, 中国东部区域约11.3%的企业面临资金不足,融资受到约束,中国西部比东部更严重, 像北京这样的城市更是高达40%o由于银行等传统金融机构的单位信贷投放成本高、 审核严格,对小额信贷的动力不足微小企业融资困难,而传统民间借贷利率较高长久来看,小微企业的融资需求 将给p2p带来巨大的市场空间,但具体规模难以估算bookmark0 3. P2P网贷面临的主要风险一、 监管和法律问题由于p2p不属于传统金融机构,没有专门的监管机构对其进行监管和引导,处于 监管真空的阶段,法律法规也不够健全在运营的规范性上、信息披露的及时性上都 存在法律漏洞进一步完善法律体系显得十分必要二、 信用风险问题作为p2p面临的最主要的风险,信用风险包括p2p平台对投资人的违约和借款人 的违约风险平台可能会向投资人提供担保,约定给予一定的收益如果平台最后没 有履约就形成了 p2p平台信用风险故建立有效稳定的信用评级机制是绝对必要的三、 运营管理问题我国p2p行业中大多数企业的成立时间并不长,企业家们也主要是互联网创业人 员,对于p2p的运营缺乏经验,平台体制不完善,内部控制体系也有待完善。
很多企 业缺乏整体的风险意识,在账户管理、借款人信用审核等方面缺乏有效的管理制度四、 资金流控制问题大多数平台都存在一定数量的坏账问题,如何平衡和控制其规模不使平台出现提 现困难,停业是亟待解决的问题bookmark0 大数据技术在P2P平台风险管控中的应用4.「降低坏账风险一一选择优质借款人1. 1・信用风险评价模型的取决因素筛选一一信息增益法首先给出参考模型,美国FICO信用分模型,将影响个人信用的因素分为五个方面:交易历史记录其中包括:各种金融交易账单,如财务公司的账单、信用卡的账单、 信用贷款的账单、抵押贷款的账单、分期付款的账单等交易信息记录;还有一些负面 的公共记录和报告事项,如宣布破产、财物抵押、司法诉讼等情况;还包括推迟、延 期归还欠款的违约行为,以及评分人出现延期支付的次数和账户数量借贷欠款余额其中包括:各种不同类型的借贷行为所产生欠款的余额;特定借贷 的还未归还的借款、以及未还款的账户数量;个人信用额度所占用的比率、分期付款 项目未还款金额与原借款总额的比率立信时间长度其中包括:最早开设个人信用账户的时间、每个账户的平均使用时 间;开设特别信用账户的时间和特别信用账户的使用时长。
新设信用账户其中包括:近期评分人拥有的新开个人信用账户的数量、开设时间;评分人的信用状况,最近被金融机构向信用报告机构申请查询的次数、间隔时长;评 分人出现支付违约问题后,相近的其他信用记录状况信用组合类型其中包括:评分人拥有个人信用账户的类型数量,各种类型账户开 设新账户的数量及比例;不同信用机构对评分人的个人信用记录查询的次数以及查询 的间隔时间;出现支付违约情况后,客户重新建立个人信用的现状这五部分因素按照各自在模型中所占的权重进行比例分配,交易历史记录占35%、 借贷欠款余额占30%、立信时间长度占15%、新设信用账户占10%、信用组合类型占 10%o公司可以根据实际情况,使用信息增益法,选择上述指标中的多项,或加入其它 指标,进行信息增益计算:信息增益是一种计算方法,是信息论中十分重要的理论,能有效计算某个系统中 新加入的信息变量给整个系统带来的信息增量,即每新增一项信息给系统的贡献量 由于指标体系中每个变量对被解释变量有不同的影响程度,有的影响很大而有些不明 显,因此本文通过信息增益的使用,计算出每个备选指标对被解释变量的贡献度,选 择对结果影响较大的,删除对结果影响小的。
在信息增益中,根据各选指标给被解释 变量带來信息量的多少决定指标的重要性,指标引入的信息越多越重要。
