
计算机软件及应用kpi预测试点收入与新用户.ppt
45页KPI预测模型预测模型(收入与新增用户)(收入与新增用户)二、收入预测模型一、项目背景三、新增市场占有率预测模型KPI预测模型预测模型(市公司试点)▪对收入、净增市场占有率、新业务收入、对收入、净增市场占有率、新业务收入、个人中高端客户保有率、全球通目标市个人中高端客户保有率、全球通目标市场占有率等进行实时预测场占有率等进行实时预测▪及时掌握市场和业务发展趋势及时掌握市场和业务发展趋势▪对可能存在不良状况进行预警,及时发对可能存在不良状况进行预警,及时发现原因以采取适当补救措施现原因以采取适当补救措施分析内容分析内容▪利用最新的数据,预测未来的利用最新的数据,预测未来的KPI指标指标值,以及全月的累计值:值,以及全月的累计值:–话费与固定费收入话费与固定费收入–新业务收入新业务收入–新增市场占有率新增市场占有率–中高端保有率–全球通中高端占有率分析过程分析过程▪数据探索数据探索–通过图表,寻找收入数列的增长规律▪建立预测模型建立预测模型–利用所知的规律,设计模型▪模型性能评估模型性能评估二、收入预测模型一、项目背景三、新增市场占有率预测模型收入指标与预测方式收入指标与预测方式▪本次预测的本次预测的““收入指标收入指标””包括包括–话费:语音通话费用–固定费:包括基本月租与新功能费–新业务收入:短信、彩信、彩铃等其它费用▪预测方式预测方式–取BI网站上公布的每日话费、固定费和总收入,作为历史数据来训练模型–话费、固定费和总收入分别用相应历史数据来预测–新业务费=总收入-话费-固定费数据探索数据探索▪通过各种图表来寻找数据序列中的规则,通过各种图表来寻找数据序列中的规则,以助于建模以助于建模–统计各项收入的总体数据表–观察各个指标的日序列线,寻找其中规律–观察各个指标的月增长线,寻找增长规律数据探索数据探索 -日收入的总体情况-日收入的总体情况 (样本为(样本为3--5月)月)话费话费 全球通全球通神州行神州行动感地带动感地带大众卡大众卡合计合计均值均值2565151.236507254.374656241.003503251.3517231897.95标准差标准差461491.41971070.26431779.21237638.531420133.82标准差%标准差%17.99%14.92%9.27%6.78%8.24%月租月租 全球通全球通神州行神州行动感地带动感地带大众卡大众卡合计合计均值均值 (不按天收) 1227825.471393260.022628036.22标准差标准差1394030.44558905.381857866.83标准差%标准差%113.54%40.11%70.69%新业务新业务收入收入 全球通全球通神州行神州行动感地带动感地带大众卡大众卡合计合计均值均值357670.21766695.59965277.31216792.952299408.939标准差标准差162638.1228640130.547653231.2044292509.21941437684.877标准差%标准差%45.47%83.49%67.67%134.93%62.52%总收入总收入 全球通全球通神州行神州行动感地带动感地带大众卡大众卡合计合计均值均值2919101.757239085.966855433.145115760.7622129381.60标准差标准差472281.761214500.232150937.04693816.613637710.71标准差%标准差%16.18%16.78%31.38%13.56%16.44%大众卡相对其他品大众卡相对其他品牌每日消费更稳定牌每日消费更稳定动感地带的月租波动感地带的月租波动感地带的月租波动感地带的月租波动大,需要更一步动大,需要更一步动大,需要更一步动大,需要更一步挖掘其规律,才能挖掘其规律,才能挖掘其规律,才能挖掘其规律,才能预测得准预测得准预测得准预测得准新业务的波动也新业务的波动也新业务的波动也新业务的波动也较大较大较大较大数据探索数据探索 -- 全球通日话费全球通日话费以以以以7 7天为周期的波动:天为周期的波动:天为周期的波动:天为周期的波动:每个星期的起伏很类似,周每个星期的起伏很类似,周未较低未较低以月为周期以月为周期以月为周期以月为周期的波动:的波动:的波动:的波动:每个月都是从每个月都是从低到高低到高数据探索数据探索 -- 全球通日话费全球通日话费由数据看到全球通用由数据看到全球通用由数据看到全球通用由数据看到全球通用户特征是工作日话费户特征是工作日话费户特征是工作日话费户特征是工作日话费远高于节假日远高于节假日远高于节假日远高于节假日数据探索数据探索 -全球通每月话费累计增长线-全球通每月话费累计增长线加速增长,加速增长,加速增长,加速增长,接近二次曲线接近二次曲线接近二次曲线接近二次曲线数据探索数据探索 -- 智能网日话费智能网日话费三种智能网品牌三种智能网品牌三种智能网品牌三种智能网品牌都显示出以都显示出以都显示出以都显示出以7 7天为天为天为天为周期的波动周期的波动周期的波动周期的波动数据探索数据探索 -- 智能网日话费智能网日话费与全球通用户相反,智与全球通用户相反,智与全球通用户相反,智与全球通用户相反,智能网上的卡类用户反而能网上的卡类用户反而能网上的卡类用户反而能网上的卡类用户反而在节假日更加活跃。
在节假日更加活跃在节假日更加活跃在节假日更加活跃数据探索数据探索 -- 各品牌每月话费累计增长线各品牌每月话费累计增长线智能网累计智能网累计智能网累计智能网累计话费接近线话费接近线话费接近线话费接近线性增长性增长性增长性增长数据探索数据探索 -- 动感地带固定费动感地带固定费1 1号、号、号、号、2828号是旧智能网用户号是旧智能网用户号是旧智能网用户号是旧智能网用户的扣费日,故收入高;的扣费日,故收入高;的扣费日,故收入高;的扣费日,故收入高;月末日租收入较低;月末日租收入较低;月末日租收入较低;月末日租收入较低;其它时段平稳其它时段平稳其它时段平稳其它时段平稳(大众卡也是类似规律)(大众卡也是类似规律)(大众卡也是类似规律)(大众卡也是类似规律)每天实时扣月租的品牌只每天实时扣月租的品牌只每天实时扣月租的品牌只每天实时扣月租的品牌只有动感地带与大众卡有动感地带与大众卡有动感地带与大众卡有动感地带与大众卡下图为动感地带每天月租下图为动感地带每天月租下图为动感地带每天月租下图为动感地带每天月租等固定费用收入等固定费用收入等固定费用收入等固定费用收入数据探索数据探索 -- 各品牌每日新业务收入各品牌每日新业务收入新业务同一新业务同一新业务同一新业务同一月内每天的月内每天的月内每天的月内每天的收入趋势没收入趋势没收入趋势没收入趋势没有明显的规有明显的规有明显的规有明显的规律律律律数据探索数据探索 -- 各品牌每日累计总收入各品牌每日累计总收入总收入是话费、总收入是话费、总收入是话费、总收入是话费、固定费与新业务固定费与新业务固定费与新业务固定费与新业务费的总和。
费的总和费的总和费的总和近乎直线增长近乎直线增长近乎直线增长近乎直线增长数据探索结论及建模目标数据探索结论及建模目标▪在建模时,将考虑到数据的以下特点:在建模时,将考虑到数据的以下特点:–话费与总收入近似线性增长–日话费收入具有周期性,全球通还有以月为周期的季节性–日租具有月周期性▪既要考虑往月的趋势,更要反映本月的既要考虑往月的趋势,更要反映本月的特点特点▪对日收入预测和全月累计预测分别建模对日收入预测和全月累计预测分别建模建模方法建模方法▪时序预测的建模方法时序预测的建模方法–季节性分解‐将序列按周期中的不同阶段拆成不同的序列–ARIMA时序预测模型‐AR(自回归) - 用近期的收入值辅助预测‐MA(移动平均) - 用近期的冲击值辅助预测▪在在TWMTWM中的线性回归模块来实现中的线性回归模块来实现建模时的输入数据建模时的输入数据▪构造宽表,包括各种变量构造宽表,包括各种变量–目标变量:当天的收入值–季节性变量‐星期标识‐扣费日标识–滞后变量‐例:前一天的收入值,前一周同期的收入值–移动平均量‐前一周的平均量▪不同的品牌和指标选择不同的变量不同的品牌和指标选择不同的变量▪平衡准确度与泛化能力,只选作用大的变量平衡准确度与泛化能力,只选作用大的变量模型训练与调优模型训练与调优▪模型训练模型训练–用3-5月的共92天的数据作为样本–构造合适的变量–不同品牌构建不同的数据集,分别建模▪模型调优模型调优–分析准确度–对比拟合所得序列与实际序列–残差分析–通过更改变量选择方案来调节模型性能建模结果建模结果 -- 每日话费准确度每日话费准确度▪每天话费预测:每天话费预测: 标准差标准差(元元)95%置信区置信区间间误差率误差率(95%置置信度信度)日收入日收入(元元) 全球通全球通152,000297,92011.92%2,500,000 智能网智能网1,083,6192,123,89214.16%15,000,000 神州行神州行677,0091,326,93820.41%6,500,000 动感动感289,694567,80012.08%4,700,000 大众卡大众卡188,045368,56810.53%3,500,000总话费总话费1,065,8142,088,99612.29%17,000,000在在在在95%95%的情况下,总的情况下,总的情况下,总的情况下,总话费误差在话费误差在话费误差在话费误差在±2,088,996之内之内之内之内建模结果建模结果 -- 拟合效果拟合效果 (全球通话费)(全球通话费)▪全球通每天话费的实际值与预测值对比全球通每天话费的实际值与预测值对比建模结果建模结果 -- 拟合效果拟合效果 (智能网话费)(智能网话费)▪智能网每天话费的实际值与预测值对比:智能网每天话费的实际值与预测值对比:建模结果建模结果 -- 残差(=实际-预测)残差(=实际-预测)▪通过图表分析残差,残差序通过图表分析残差,残差序列已接近随机噪声列已接近随机噪声–近似正态分布(均值为0)–无自相关无显著的自相无显著的自相无显著的自相无显著的自相关性:即残差关性:即残差关性:即残差关性:即残差的过去不能启的过去不能启的过去不能启的过去不能启示未来示未来示未来示未来残差的分布残差的分布残差的自相关图残差的自相关图建模结果建模结果 --日租准确度日租准确度( (固定费固定费) )▪每天日租预测:每天日租预测: 标准差标准差(元元)95%置信区间置信区间误差率误差率(95%置置信度信度)日收入日收入(元元)合计合计259,053507,74519.21%2,643,033 动感动感160,973315,50825.46%1,239,022 大众卡大众卡121,052237,26216.90%1,404,011建模结果建模结果 -- 拟合效果拟合效果 (日租)(日租)▪每天日租费的实际值与预测值对比:每天日租费的实际值与预测值对比:建模结果建模结果 -- 每日总收入准确度每日总收入准确度▪每天总收入预测:每天总收入预测: 标准差标准差(元元)95%置信区置信区间间误差率误差率(95%置信度置信度)日收入日收入(元元)总收入总收入1,421,2612,785,67212.60%22,103,427 智能网智能网1,400,1312,744,25714.31%19,181,388 神州行神州行948,1321,858,33925.69%7,233,752 动感动感512,5051,004,50914.69%6,838,120 大众卡大众卡344,572675,36213.22%5,109,516 全球通全球通233,520457,70015.66%2,922,039建模结果建模结果 -- 每月累计话费预测每月累计话费预测▪全月话费累计:全月话费累计: 标准差标准差(元元)95%置信区间置信区间误差率误差率(95%置置信度信度)月累计月累计(元元)总话费总话费2,708,3295,308,3251.00% 530,000,000 智能网智能网2,628,7665,152,3811.13% 455,000,000 神州行神州行2,066,1304,049,6142.02% 200,000,000 动感动感1,220,1882,391,5681.71% 140,000,000 大众卡大众卡1,190,9952,334,3502.12% 110,000,000 全球通全球通1,127,5432,209,9842.95%75,000,000建模结果建模结果 -- 每月累计固定费预测每月累计固定费预测▪月固定费月固定费 标准差标准差(元元)95%置信区置信区间间误差率误差率(95%置信度置信度)月累计月累计(元元)合计合计924,9641,812,9302.24%81,069,516 动感动感168,023329,3240.87%38,003,514 大众卡大众卡636,4051,247,3532.90%43,066,002建模结果建模结果 -- 每月累计新业务收入预测每月累计新业务收入预测▪全月新业务收入累计:全月新业务收入累计: 标准差标准差(元元)95%置信区间置信区间误差率误差率(95%置置信度信度)月累计月累计(元元)总收入总收入2,914,4255,712,2748.05%70,926,314 神州行神州行2,072,7714,062,63117.23%23,577,091 动感动感899,2221,762,4765.93%29,716,736 大众卡大众卡988,3891,937,24228.64%6,765,271 全球通全球通315,270617,9295.62%10,988,892▪注:通过所预测得的(总收入-话费-月固定费)注:通过所预测得的(总收入-话费-月固定费) 来计算新业务收入预测值来计算新业务收入预测值建模结果建模结果 -- 每月累计总收入预测每月累计总收入预测▪全月总收入累计:全月总收入累计: 标准差标准差(元元)95%置信区置信区间间误差率误差率(95%置信置信度度)月累计月累计(元元)总收入总收入2,776,9275,442,7770.80%677,998,117 智能网智能网3,473,6296,808,3131.16% 588,405,107 神州行神州行2,345,1514,596,4962.07% 221,932,012 动感动感1,474,9402,890,8831.38% 209,735,676 大众卡大众卡2,157,7724,229,2332.70% 156,737,419 全球通全球通1,359,1572,663,9482.97%89,593,010注:全球通收入不包括月租注:全球通收入不包括月租注:全球通收入不包括月租注:全球通收入不包括月租二、收入预测模型一、项目背景三、新增市场占有率预测模型指标与预测方式指标与预测方式▪““新增市场占有率新增市场占有率””即移动公司新增客即移动公司新增客户占东莞整体移动新增客户的比例户占东莞整体移动新增客户的比例 ▪预测方式预测方式–统计各品牌每天的新增数作为历史数据–先预测各运营商的每天和当月新增用户数–再计算新增市场占有率数据探索数据探索 – 移动日新增用户数移动日新增用户数▪移动用户日新增数移动用户日新增数智能网以智能网以智能网以智能网以7 7天为天为天为天为周期,但每周的周期,但每周的周期,但每周的周期,但每周的波幅不定;波幅不定;波幅不定;波幅不定;全球通较随机全球通较随机全球通较随机全球通较随机数据探索数据探索 – 智能网日新增用户数智能网日新增用户数▪将智能网的新增数序列按星期分解将智能网的新增数序列按星期分解–星期三至五的新增明显多于其它时间数据探索数据探索 – 竞争对手日新增用户数竞争对手日新增用户数▪联通、小灵通用户日新增联通、小灵通用户日新增联通联通联通联通GSMGSM、小灵通有、小灵通有、小灵通有、小灵通有周期性;周期性;周期性;周期性;CDMACDMA是平是平是平是平稳的随机波动稳的随机波动稳的随机波动稳的随机波动每日新增用户总体统计每日新增用户总体统计 ((2--4月)月) 全球通全球通神州行神州行动感地带动感地带神州大众卡神州大众卡移动合计移动合计均值422.2910433.807807.626004.6324668.34标准差223.972780.422429.441379.116397.15标准差%53.04%26.65%31.12%22.97%25.93% 联通联通GSM 联通联通CDMA 电信小灵通电信小灵通对手合计对手合计(折折算算)全市合计全市合计(折折算算)均值6348.67501.242331.0011585.5336253.87标准差1644.80116.392003.443426.028688.09标准差%25.91%23.22%85.95%29.57%23.96%相关性分析相关性分析 -- 发现有助预测的关系发现有助预测的关系▪自相关分析自相关分析–普遍有滞后1天的自相关–智能网有滞后1周的自相关,即有一定周期性建模结果建模结果 -- 日新增客户数准确度日新增客户数准确度▪单个品牌由于影响因素多,无法有效预测,只单个品牌由于影响因素多,无法有效预测,只预测移动新增数与市场总体新增数预测移动新增数与市场总体新增数▪日新增预测准度:日新增预测准度: 标准差标准差(个个)95%置置信区间信区间误差率误差率(95%置信置信度度)平均日新增平均日新增(个个)移动合计移动合计6,01611,79046.41%25,404全体合计全体合计7,29914,30639.25%36,447建模结果建模结果 -- 拟合效果(新增用户数)拟合效果(新增用户数)▪每天新增用户数的实际值与预测值对比:每天新增用户数的实际值与预测值对比:误差高度相关误差高度相关误差高度相关误差高度相关 ->->->->尽管两者的误差都不小,尽管两者的误差都不小,尽管两者的误差都不小,尽管两者的误差都不小,两者的比例较稳定两者的比例较稳定两者的比例较稳定两者的比例较稳定建模结果建模结果 -- 拟合效果(市场占有率)拟合效果(市场占有率)▪单天市场占有率的实际值与预测值对比:单天市场占有率的实际值与预测值对比:建模结果建模结果 -全月新增市场占有率-全月新增市场占有率▪所预测的所预测的““全月新增市场占有率全月新增市场占有率””的误差随时的误差随时间的变化曲线。
可见随着数据增加,全月新增间的变化曲线可见随着数据增加,全月新增市场占有率误差逐渐减小约市场占有率误差逐渐减小约1 1周后误差降到周后误差降到1 1个百分点之内个百分点之内。












