电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

大数据在金融行业中的应用

9页
  • 卖家[上传人]:pu****.1
  • 文档编号:474754117
  • 上传时间:2023-08-06
  • 文档格式:DOC
  • 文档大小:167.50KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、数据掘金 -大数据在金融行业中的应用在当前大数据技术潮流中, 各行各业都在不断的探索如何应用大数据技术以解决企业面临的问题。 目前国内已有不少金融机构开始尝试通过大数据来驱动相关金融业务运营。如下是百分点就金融行业如何应用大数据技术提出我们的见解。按照我们的经验, 企业面向消费者的应用大致可以分为运营、 服务和营销三大类,在金融行业中这三类应用的典型例子有:运营类:历史记录管理、多渠道数据整合分析、产品定位分析、客户洞察分析、客户全生命周期分析等。服务类:个性化坐席分配、个性化产品推荐、个性化权益匹配、个性化产品定价、客户体验优化、客户挽留等。营销类:互联网获客、产品推广、交叉销售、社会化营销、渠道效果分析等。大数据技术在这些应用中都可以发挥价值, 其核心是通过一系列的技术手段,采集、整合和挖掘用户全方位的数据, 为每个用户建立数据档案, 也就是常说的“用户画像”。大数据可应用于金融行业实时数据分析,场景包括:在风险管理领域,可以应用于实时反欺诈、 反洗钱,实时风险识别、在线授信等场景;在渠道方面,可以应用于全渠道实时监测、资源动态优化配置等场景;在用户管理和服务领域,可以应用于在线和

      2、柜面服务优化、客户流失预警及挽留、个性化推荐、个性化定价等场景;在营销领域,可以应用于(基于互联网用户行为的)事件式营销、差异化广告投放与推广等场景。大数据在金融业统计分析类应用中的优势大数据在数据量、多种数据源、多种数据结构、复杂计算任务方面都优于传统的数据仓库技术,这里仅举两个例子:a) 大量数据的运算, 例如:两张 Oracle 里面表数据分别是 1000 多万和800 多万做 8 层 join,放在大数据平台运算比在Oracle 里面运算至少快 2倍多;b) 对于跨数据库类型的表之间的 join,例如一张 Oracle 的表和一张 sqlserver 的表,在传统的数据仓库中是没有办法 join 的。可以将数据通过 sqoop 等工具放到 HDFS上面。利用 hive,pig, impala,spark 等进行更快的处理。大数据协助银行实现其对客户的多维度分析有人指出,目前银行自身的数据难以完成客户全维度分析,那么应用大数据又能如何?首先, 有几个问题我们需要仔细思考: 什么叫客户“全维度” ?有没有可能做到“全维度”?按照百分点的理解,不存在对一个人的“全维度”的刻画,因为我

      3、们现实中都做不到。 您可以想象,一个人的 DNA 可以代表他的“全维度”吗?或者他的所有言论可以代表他的“全维度”吗?都不可以。我们期望的“全维度”实际上是想说最大可能的利用和挖掘手上的数据资源!基于上面的理解,我们认为银行在大数据平台建设过程中最需要考虑的是如何最大程度的整合所有数据源,特别是行内自有数据源,并且针对业务需求做出有价值的分析应用。其次,假设银行要引入第三方数据,这些数据怎么利用?这些数据如何和行内数据整合发挥价值?这些数据又如何转化为客户“全维度”分析?显然的,第三方数据也不是直接就能“全维度”的,还是要经过一系列的数据分析和挖掘。对银行客户了解、并且契合银行业务的数据一定来自于银行业内!任何外部的数据都需要经过大量的转换和业务解读才能直接在银行中使用。如果需要第三方数据支撑,银行必须找到对金融业务有相当理解,并且已经按照银行业务诉求分析好的数据才是有价值的。最后,按照我们的理解和实践经验,银行只需要把第三方数据看做一个数据源即可,“全维度”的关键还是如何整合所有数据源并进行深度挖掘。在百分点的实际案例中,我们有一套自己的方法论,包括数据的集成、清洗、脱敏、多渠道整合

      4、、用户画像标签建模、用户画像整合、用户画像服务等几个步骤。第三方数据是在集成阶段就解决的问题,后面各阶段关注点都在如何整合、挖掘和应用这些数据。相比传统技术,大数据技术的优势如下:a) 大数据技术更关注过程数据、行为数据、非结构化数据,可以真正做到“全方位” ;b) 大数据技术在实时性、数据量和并发量上有明显优势,因为这些技术一开始就是为互联网、海量数据和高并发设计的;c) 大数据技术在组件化、水平扩展方面有明显优势,对业务升级和扩展支持更加平滑。如何选择大数据技术产品选择大数据技术产品最优先考虑的原则是什么?大家选择某一款大数据技术产品时,不能只关注某款产品有什么“高端”的功能,而应该关心是这款产品是否能给我们带来价值,能解决我们的业务痛点。所以大数据产品的关键不在于建一个大数据的平台,然后把数据进行采集和存储,而在于这些大数据产品能在哪些方面支撑我们的应用场景、 能从数据中分析出哪些有价值的观点、能基于数据产生哪些数据应用、如何为企业提供增值变现的能力。这一点,我们需要向互联网公司学习。大数据能够蓬勃发展正是因为互联网行业真正让大数据产生丰富的价值,如 Google 的精准广告,亚

      5、马逊的“千人千面”推荐等。金融是极度依赖信息化技术的行业,在这个行业中,业务场景可以分为下面几大类:1) 支撑类。例如海量数据的存储和查询等。2) 操作类。例如受众人群筛选、营销活动策划等。3) 战术类。人群分析洞察、产品舆情分析等。4) 战略类。运营分析报告、新业务拓展等。不存在一款产品可以支撑以上所有场景, 我们在产品选型时应该尽量考虑那些可以支撑更多场景的产品,至少应该了解:1) 该产品适合的直接场景是什么?2) 该产品上已经提供的应用有哪些,支撑了哪些场景?3) 该产品上可以衍生出哪些应用,能够支撑哪些场景?正是基于上述考虑, 百分点才推出了大数据技术、 大数据管理和大数据应用三层产品,每一层解决特定的业务问题, 但这些产品可以像搭积木那样轻松整合在一起。大数据平台建设1.1大数据平台硬件选型大数据的特点是数据量大但往往价值稀疏, 从大数据里提取价值就像是从大海里捞针,要想完成大海捞针的工作就必须提供性价比可接受的软硬件解决方案,开源 Hadoop 解决方案就是典型的代表,通过基于廉价 x86 架构服务器之上提供海量数据存储和分析解决方案赢得互联网界的青睐, 所以,这种通过软件

      6、层面来保证数据安全和稳定, 硬件基于标准 x86 标准服务器的解决方案是未来的主要方式。另外对于 x86 服务器的硬件选型也是需要考虑的, 从实践经验来看, 我们往往会综合数据量、 数据应用和成本提供一个平衡性的硬件配置, 然后基于平衡型的硬件配置依据任务作业情况, 调整硬件配置, 如 IO 密集型可能会使用 SSD&内存 ,CPU密集型任务则会选择高端 CPU等。1.2大数据平台建设最佳实践大数据平台建设中, Hadoop 体系所包含的生态系统,如:Hbase,Hive,snoop,pig,spark等子系统,那么如何根据各自的特性,通过组合方式来适应实际需求并应用到具体场景中呢?我们的最佳实践是利用互联网+大数据的技术架构,构建Lamda 架构,如图所示:1) 数据采集a) 传统业务系统数据库和数据集市、数据仓库的数据,均可以通过 Sqoop 等数据桥接的方式接入大数据平台, 同时可以将数据库日志、系统日志等非结构化文本数据通过 Flume 等组件接入大数据平台。b) 银行线上渠道(网站、 APP应用、微信公众号等)中的用户行为可以通过数据探头技术, Web 端及 H5 通过 JS

      7、、移动端通过 SDK部码,采集用户行为数据;银行线下渠道(柜面、 ATM 等)的用户行为数据,需从线下接入的系统数据中解构分析。c) 互联网公开数据,如论坛、微博、媒体资讯等,通过数据爬取技术进行数据采集。d) 也可以利用各种 API 接口接入其他合作方、第三方等的在线或离线数据。2) 数据分发通过 FTP或 Kafka消息队列将数据实时分发,分发后分开实时数据处理和离线数据存储和处理两条线,形成“人”字型的 Lamda 架构。3) 离线数据存储及处理基于 Hadoop 平台和 MpReduce 技术的离线数据处理,常用的是 HBase 列式数据库。4) 实时数据处理利用 Storm 或 Spark技术的实时数据处理,例如 Storm 是事实流式处理,Spark( Spark Streaming)是基于内存的实时批处理。5) 数据存储不同的数据类型、不同的业务场景,需要的不同的数据存储服务,在我们的产品中应用了 Redis、MongoDB、MySQL、ElasticSearch等多种存储服务。百分点基于此架构为银行提供服务的典型应用场景包括:1) 用户行为采集分析:利用数据探头( JS

      8、、 SDK,Nginx、ICE)、数据分发( Kafka)、离线数据存储及处理 ( HBase)、运营分析结果展现(MySQL)。2) 跨部门数据整合:利用数据桥接( Sqoop)、日志接入( Flume)、数据分发( FTP)、离线数据存储存储及处理( HBase、ES)。3) 离线用户画像和用户洞察(支持营销) :利用离线数据存储存储及处理( HBase、ES)。4) 实时用户画像及推荐:利用实时数据处理( Storm、 Spark)、数据存储( Redis、 MongoDB)。5) 实时反欺诈:利用数据接口(API)、数据分发(MQ)、实时数据处理( Storm)。1.3大数据平台和现有数据仓库的有效整合目前各行都有自己的数据仓库或数据集市平台,而大数据平台的引入又往往独立于数据仓库, 对于某些场景,将结构化数据与非结构化数据进行整体结合往往能够起到更好的效果, 如何能够将大数据平台和现有数据仓库进行有效整合?1) 非结构化数据处理与大数据应用的关系首先分享一下我们对“结构化”和“非结构化”的理解:狭义的理解:结构化就是指关系型数据,其余都是非结构化数据。广义的理解:结构化是相对于某一个程序来讲的, 例如视频对于播放器来说显然是结构化的,但是对于文本编辑器来说就是非结构化的。事实上,即使是人脑,处理的也都是“广义的”结构化数据。你可以想象,自己在注视一张照片时, 脑海中形成的一定不是一个一个像素点,而是抽象过的一些属性!按照我们上面的理解, 无论是语音、影像还是其它“狭义”的非结构化数据,只要我们有工具可以将这些数据转化成我们关心数据结构, 那就可以作为大数据应用的一个数据源, 后续由针对这类数据的的特定工具处理即可。 这里举一个例子:通常我们认为 HTML网页,例如电商的单品页面,是非结构化的,因为我很难从中提取出结构化字段,例如商品名称、价格等。但通过互联网抓取系统,我们可以将这些页面转化为结构化字段, 那么后续按照结构化数据处理即可。 语音、影响也是一样, 关键是我们期望从中提取什么信息, 用什么工具提取, 一旦提取成功,即可整合到大

      《大数据在金融行业中的应用》由会员pu****.1分享,可在线阅读,更多相关《大数据在金融行业中的应用》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.