
医保欺诈行为的主动发现.doc
32页医保欺诈行为的主动发现 【摘要】在医疗保险领域中,医疗保险是关系到国计民生和国家发展的重大问题,维持医疗保险基金的收支平衡、对基金运营进行有效监管,以保证基金安全运营对医疗保险的发展、完善和社会稳定发展有重要影响医保信息化构建了较为完整的医保数据仓库,为数据挖掘技术的应用打下了良好的基础本篇论文利用数据挖掘中的聚类分析方法,以及二元回归分析根据实际情况建立数学模型,分析医疗费用记录中医保欺诈记录骗保人进行医保欺诈时使用的方式主要有:冒用他人医疗保险证、卡就医;异地就医人员伪造或虚开医疗票据回来报销;“挂床”住院就医;要求医院开具本人不必要的诊疗项目或药品,由他人代作或代用等医保欺诈行为在本数据中反映主要有以下几类:一、病人消费等级高(消费等级:病人每张账单的平均消费额/该病人对应的病人科室的每张账单的平均消费额);二、消费频率大(消费频率:病人一个月总账单数/该病人对应的病人科室的总账单数);三、一张卡在一定时间内反复多次拿药;四、病人死后医保卡依旧有消费记录;五、一张卡多人使用;六、单张处方药数量大 七、单张处方药的费额大 八、病人一个月内平均每张账单药品数量大和价格高 ;九、一个月内买药的总消费额大;十、一个月内买药的总数量大十一、病人死亡后医保卡依旧有消费记录等。
本文重点分析以下三类:1.对于病人消费等级高和消费频率高的医保欺诈行为研究病人消费等级高和消费频率高的医保欺诈行为,用excel 和spss,access 通过分析数据属性的特征值,选择典型数据作为初始聚类中心,用spss进行k-means聚类分析工具进行聚类分析2.对于其他的医保欺诈行为如:病人死亡后,其医保卡被他人使用继续使用,本文首先从题目表2.1 病人资料pa_patmas 表PAPMI_DECEASED(死亡标志)字段中筛选出死亡病人的资料根据筛选出的死亡病人的ID 查找其医保卡消费情况,对比病人的死亡时间以及账单号的交易时间,若病人的死亡时间在前与交易时间,则为医保欺诈记录3.对于一张医保卡多人使用的医保欺诈行为本文首先从题目表2.1病人资料pa_patmas 表中对医保卡号一栏运用COUNTIF函数筛选一卡多用欺诈得出结果分为两种:1.一张医保卡两人使用;2.一张医保卡三人使用关键词:医保欺诈 数据挖掘 聚类分析k-means logistic回归分析 一、问题重述1.1 问题背景医疗保险是为解决公民或劳动者因为疾病和非因公负伤,丧失劳动能力后的治疗费用及服务,给予物质帮助的一种社会保险制度。
我国的医疗保险分为社会医疗保险和商业医疗保险商业医疗保险是投保人根据合同约定向保险公司支付保险费,当被保险人死亡、伤残、疾病或者达到合同约定的年龄、期限时,保险公司承担给付保险金责任的保险合同社会医疗保险是国家通过立法的形式对社会成员强制征缴社会医疗保险基金,用以对其中患有疾病、伤残者给予基本医疗保障的一种社会经济保障制度医疗保险欺诈行为是指违反医疗保险管理法规和政策,采用虚构事实、隐瞒真相以及其他方法,向医保基金管理机构骗取医保基金或医保待遇的行为这一行为具有两个基本特征:一是主观表现为直接故意,并且以非法占有医保基金或非法获得医保待遇为目的,二是实施手段主要是通过虚构事实和隐瞒真相,即故意虚构未曾发生的保险事故,或者对发生的保险事故编造虚假的原因或者夸大损失程度,以达到骗取医疗保险基金或医疗保险待遇的目的随着我国医疗保险事业的迅速的发展,我国医保的覆盖面不断扩大,包括了城保、镇保、个保、居保等等保证医疗保险资金正常运作,规避潜在运营风险的前提条件是判断出医保欺诈行为然而,利用数学建模的方法分析医保欺诈行为,建立医保欺诈行为的模型,可为评判医保欺诈行为提供科学的理论依据1.2 问题提出骗保人进行医保欺诈时通常使用的手段:1、医疗保险参保患者的欺诈、违规行为。
使用的方式主要有:冒用他人医疗保险证、卡就医;异地就医人员伪造或虚开医疗票据回来报销;“挂床”住院就医;要求医院开具本人不必要的诊疗项目或药品,由他人代作或代用等2、医疗保险机构(药店)的欺诈、违规行为使用的方式主要有:伪造、变造以及提供虚假病历、处方、疾病诊断证明和医疗费票据等一系列作假行为,如就医资格作假、病因作假、票据作假、处方作假、医疗明细作假、医疗文书作假、住院床位作假、医疗证明作假等等,无不与医疗机构的工作人员有关此外还有使用医疗保险基金支付应由参保人自费的医疗费用,较为严重的是将非医保支付病种(如车祸、工伤、打架斗殴等)改为医保支付病种;向参保人提供不必要的或过度的医疗服务3、医疗保险机构(药店)和参保患者合谋的欺诈、违规行为使用的方式主要有:虚开医保基金报销所需的入院证明、医疗发票、住院清单等医疗资料4、不法分子为了获取不当利益的欺诈行为使用的方式主要有:不法分子冒用医疗保险经办机构名义,虚构退返医疗保险金、社保卡发生故障、医保缴费交易出现故障、医保卡欠费封锁、医保卡透支以及涉嫌购买非法药品等虚假信息,要求参保人员提供身份证号码、医保卡号码及密码等个人信息,并要求其对某个银行账户进行转款等,试图骗取参保人员信息及钱财。
本文讨论医疗保险参保患者的欺诈、违规行为为一下几点:一、病人消费等级高(消费等级:病人每张账单的平均消费额/该病人对应的病人科室的每张账单的平均消费额);二、消费频率大(消费频率:病人一个月总账单数/该病人对应的病人科室的总账单数);三、一张卡在一定时间内反复多次拿药;四、病人死后医保卡依旧有消费记录;五、一张卡多人使用;六、单张处方药数量大 七、单张处方药的费额大 八、病人一个月内平均每张账单药品数量大和价格高 ;九、一个月内买药的总消费额大;十、一个月内买药的总数量大十一、病人死亡后医保卡依旧有消费记录等本文重点分析病人消费等级高和消费频率高的医保欺诈行为, 病人死亡后仍有消费行为和一张医保卡多人使用的情况二、问题分析聚类分析是数据挖掘的一种重要分析方法聚类分析(clustering analysis)是一种根据数据对象的属性将数据对象划分为相应的若干群组(Cclass)或者聚类(cluster)的过程,同时让聚类的结果满足相同簇中的数据对象差距尽可能的小,不同组中的数据差距尽可能的大聚类分析算法众多,从当前的研究状况来讲,可以将聚类分析算法大致分为如下几类: 即基于模型的方法(Model-based Method) ,基于层次的方法(HierarchicalMethod),基于网格的方法(Grid-based Method),基于划分的方法(PartitioningMethod)和基于密度的方法(Density-based Method)。
k-means 聚类算法是一种基于划分方法的聚类分析法,其通过计算数据对象和每个聚类簇心的距离选择与簇心最近的簇分配到其中,从而将数据分类是一种常用的描述任务的数据挖掘技术本文主要通过以下两个步骤来分析医保数据,找出可能的医保欺诈数据:1.参保人就医行为模式挖掘了解不同参保人就医行为的特征,可以深入认识部分参保人存在的共性2.医保欺诈检测根据分析可能的欺诈行为,并利用数据挖掘算法进行检测和验证对于可能的欺诈行为,本文重点分析病人消费等级高和消费频率高的医保欺诈行为, 病人死亡后仍有消费行为和一张医保卡多人使用的情况1.对于病人消费等级高和消费频率高的医保欺诈行为研究病人消费等级高和消费频率高的医保欺诈行为,用excel 和spss,access 通过分析数据属性的特征值,选择典型数据作为初始聚类中心,用spss进行k-means聚类分析工具进行聚类分析2.对于其他的医保欺诈行为如:病人死亡后,其医保卡被他人使用继续使用,本文首先从题目表2.1 病人资料pa_patmas 表PAPMI_DECEASED(死亡标志)字段中筛选出死亡病人的资料根据筛选出的死亡病人的ID 查找其医保卡消费情况,对比病人的死亡时间以及账单号的交易时间,若病人的死亡时间在前与交易时间,则为医保欺诈记录。
3.对于一张医保卡多人使用的医保欺诈行为本文首先从题目表2.1病人资料pa_patmas 表中对医保卡号一栏运用COUNTIF函数筛选一卡多用欺诈得出结果分为两种:1.一张医保卡两人使用;2.一张医保卡三人使用三、模型假设 1、医保卡号为1的病人为普通病人无欺诈嫌疑2、消费资料来自同一医院3、消费总额和消费数量为负数则视为冲账,取绝对值计算4、假设参保人健康状况正常,无重大疾病5、假设参保人经济情况正常,能够支付起正常的医疗费6、假设忽略一个月内极少部分病人转科室的情况7、假设用医保卡消费药品低于市场价四、符号说明符号意义Vmean属性数据的均值Vmedian属性数据的中位数Vvar iance属性数据的方差d属性数据的标准差DKL属性数据点距离的平均值K数据簇L数据簇Ni表示第1 个簇包含的对象数五、模型的建立与求解本文医保欺诈行为有:一、病人消费等级高(消费等级:病人每张账单的平均消费额/该病人对应的病人科室的每张账单的平均消费额);二、消费频率大(消费频率:病人一个月总账单数/该病人对应的病人科室的总账单数);三、一张卡在一定时间内反复多次拿药;四、病人死后医保卡依旧有消费记录;五、一张卡多人使用;六、单张处方药数量大 七、单张处方药的费额大 八、病人一个月内平均每张账单药品数量大和价格高 ;九、一个月内买药的总消费额大;十、一个月内买药的总数量大十一、病人死亡后医保卡依旧有消费记录等。
用excel 和spss,access 通过分析数据属性的特征值,选择典型数据作为初始聚类中心,用spss进行k-means聚类分析参保人员模型:属性编号 属性数据属性 1病人ID(PAPMI_ROWID1)主键2医保卡(PAPMI_NAME3)参保人员基本信息3年龄参保人员基本信息4性别参保人员基本信息5医保卡共用与否参保人员行为信息6消费等级参保人员行为信息7消费频率参保人员行为信息8单张处方药的最大数量参保人员行为信息9单张处方药的最大金额参保人员行为信息10一个月内平均每张账单药品数量参保人员行为信息11一个月内平均每张账单药品价格参保人员行为信息12一个月内买药的数量参保人员行为信息13一个月内买药的消费额参保人员行为信息5.1 病人消费等级高和消费频率高的医保欺诈行为研究病人消费等级高和消费频率高的医保欺诈行为,用excel 和spss,access 通过分析数据属性的特征值,选择典型数据作为初始聚类中心,用spss进行k-means聚类分析5.1.1 数据预处理用ACCESS和EXCEL同时处理分析表一表二的数据,寻找各数据之间的关联关系,求出各科室总消费额,各科室总账单数,从而得出各科室每份账单的平均消费额,再求出病人的总消费额病人的总账单数,病人每张账单的平均消费额。
+ + = + + = ìü ï ï=í ý ï ïîþ统计量消费值的绝对值N有效9853缺失0均值1.08927817中值.93323。






![河南新冠肺炎文件-豫建科[2020]63号+豫建科〔2019〕282号](http://img.jinchutou.com/static_www/Images/s.gif)





