
省级话务网管三期改造整体介绍课件.ppt
27页省级话务网管三期改造系统省级话务网管三期改造系统陈丹陈丹2006-02提纲•三改整体思路•三改模块整体说明•实时性能监控•基站服务质量监控•告警功能拓展•局数据管理扩展•智能维护•彩铃网管•采集汇总监控三期改造总体思路•深化深化深化深化“ “三集中三集中三集中三集中” ”管理思路,管理思路,管理思路,管理思路,注重开发和整合本注重开发和整合本注重开发和整合本注重开发和整合本地操作维护层面所需功能地操作维护层面所需功能地操作维护层面所需功能地操作维护层面所需功能•提升支撑系统精细化管理能力,如资源细粒度提升支撑系统精细化管理能力,如资源细粒度提升支撑系统精细化管理能力,如资源细粒度提升支撑系统精细化管理能力,如资源细粒度管理,告警细分与故障分级管理管理,告警细分与故障分级管理管理,告警细分与故障分级管理管理,告警细分与故障分级管理•提升无线网络管理能力,体现差异化管理思路提升无线网络管理能力,体现差异化管理思路提升无线网络管理能力,体现差异化管理思路提升无线网络管理能力,体现差异化管理思路•面向网络保障和指挥调度,丰富上层应用面向网络保障和指挥调度,丰富上层应用面向网络保障和指挥调度,丰富上层应用面向网络保障和指挥调度,丰富上层应用, ,提提提提高快速响应能力高快速响应能力高快速响应能力高快速响应能力三改模块整体说明•2+3+1 新增2模块:实时性能监控基站服务质量 扩展3个模块:告警扩展(告警字段细分、退服专题)局数据扩展:业务的扩展智能维护:功能的加强、业务的扩展 1个功能专题:彩铃管理(规范还未明确)基本模块•实时性能监控•基站服务质量•告警扩展(告警字段细分、退服专题)•局数据扩展:业务的扩展•智能维护:功能的加强、业务的扩展实时性能监控-业务背景随着移动网络的快速发展,广大客户对网络可靠性的要求不断提高,网络维护部门对网络异常情况的响应速度提出了更高的要求,尤其是在春节、中秋等重大节日期间的应急通信保障和集中调度。
需要具备相应的维护手段来实现对性能指标的实时监控(如5-15分钟刷新周期,1-3分钟时延),实时监控的性能指标范围应更贴近网络保障和性能监控的实际情况,不仅包括性能指标,还涵盖主要资源使用率的指标实时性能监控-整体结构实时性能监控-底层采集•NEAgent::网元接入模块,和三期的一样,没有什么变化,只是做了一些大数据量情况下暴露出的一些问题•GP-KPI-Gather、各、各parser::GP-KPI-Gather进行网元指令发送,报告获取GP-KPI-Gather会根据各个厂家、网元类型的指令模板文件(放在/opt/BOCO.DAL/KPI/vendors/厂家/网元类型/instruction下),通过NETelnetD连接网元、发送指令、获取报告最后的报告原始文件放入/opt/BOCO.DAL/KPI/data/source/DCU(每个网元的DCU ID可以从LDAP中获取),然后调用各个厂家、网元类型的parser程序进行分析,把分析后的标准数据文件放入/opt/BOCO.DAL/KPI/data/dest/ready•GP-KPI-Forwarder:进行消息生成和发送。
从/opt/BOCO.DAL/KPI/data/dest/ready下获取数据文件,把处理的文件移到/opt/BOCO.DAL/KPI/data/dest/run下,同时根据各种KPI类型的xml schema文件(放在/opt/BOCO.DAL/KPI/vendors/厂家/网元类型/schema下)和网元相关的配置信息(放在/opt/BOCO.DAL/KPI/data/source/.[DCU ID]_属性,这些文件为隐含文件,要用ls –a查看)生成最终的KPI原始xml消息,送到KPIIN.Q最后完成后会把run下的相应文件移到finish目录下•GP-KPI-GetNeInfo::生成和采集网元相关的配置信息,放在/opt/BOCO.DAL/KPI/data/source下,供GP-KPI-Forwarder使用•GP-KPI-Maintainer::辅助模块,定期删除日志文件、清理超时的Gather进程•GP-KPI-GenCrontab::辅助模块,可以把上层定义的采集信息(采集网元、时间粒度等)生成crontab实时性能监控-底层模块说明实时性能监控-中层处理•KPITube::进行KPI的计算,生成最终的KPI消息,发送到MsgPlatformServer。
从KPIIN.Q中获取原始的KPI xml消息,进行计算,并进行KPI门限的判断,生成相应的告警,对应产生的告警通过WRITEFM.Q/TRANS.Q等队列传送给告警平台进行处理最后计算出来的KPI xml消息和告警消息都会发送到MsgPlatformServer进行分发,最终的KPI消息还要发送到KPIOUT.Q,供KPI2DB入库使用这个模块会用到以下文件:a)、最终KPI输出消息xml schema文件,存放在C:\Program Files\Common Files\BOCO\KPISchemas\下b)、网元信息xml文件,文件为:C:\Program Files\Common Files\BOCO\LongFactData\NeFact.xml,KPITube会根据这个文件获取相关配置信息,填充到最终的KPI xml消息中去c)、门限设定文件,为:C:\Program Files\Common Files\BOCO\LongFactData\NeScope.xml,KPITube会根据这个文件中定义的规则,判断KPI的门限•KPI2DB::把最终的KPI入库从KPIOUT.Q中获取消息,入到NMOSDB(一套tpd_开头的表)。
•MsgPlatformServer::消息订阅分发模块KPITube生成的最终的KPI xml消息会发布到这个模块,同时接受各个Web监控客户端的订阅,把符合各个监控客户端的消息过滤出来,供监控客户端获取•KPIQueryServer::最新性能数据查询模块在开启一个新的监控窗口的时候,需要获取最新的KPI数据呈现•KPIHUpdateService::配置更新模块可以通过这个程序更新KPITube用到的三种类型的文件,具体可以通过KPIHUpdateService.exe help查看•KPIHSelfMon::自身监控的程序,可以监控KPITube / MsgPlatformServer / KPI2DB / NETelnetD / KPIQueryServer等程序,可以通过KPIHSelfMon.exe同目录下的MonProcessInfo.xml配置,启动KPIHSelfMon时,会自动启动MonProcessInfo.xml中配置的文件如果发现监控的进程异常退出了会自动重启•MsgPlatformConsole::辅助模块,可以查看各个客户端的连接情况实时性能监控-中层处理模块说明实时性能监控-上层应用Web应用:应用:可以对网元的KPI进行矩阵、数据、图形三种模式的实时监控。
操作维护终端(操作维护终端(SuperTel):):网元连接配置、操作模块,和三期一致注意点:用户实时性能采集的用户的网元代理配置必须要注意以下两点:1、所有要采集的大网元要配自动登录,而且要明确的配置登录结束的期望值2、命令的执行要有明确的结束标记,如果系统缺省不能正确判断结束标记,需要手工配置实时性能监控-数据量估计网元类型网元数板卡等子模块按5分钟粒度的系数总数每网元一天的记录数101MSC502500125501440105SMSC13113108STP616一天总记录数111SCP73514241275200121SGSN464168一天记录的总容量(G)200BSC19238401403239.36309814201SITE96310.3333333333210.333333300BTS179910.3333333335997一个月记录的总容量(G)600TrunkGroup2342123421180.892944702LINK10403110403944.714355528663.33333平均每秒产生的消息数238.8611111峰值每秒产生的消息数392.3166667实时性能监控-部署说明SUN V890CPU 4*1.2内存 16G可以做负荷分担,把采集的消息送到多个队列,以便启动多个中层处理模块•4CPU 4G内存Windows2003•Web应用服务器和中层处理服务器逻辑上分开,物理上可以共存•目前中层处理在中等省份可以是一个,大等省份要两个•Web应用服务器可以按监控的网元和用户数进行负荷分担(一般按地市去化分)实时性能监控-应用说明•实时性能监控•基站服务质量•告警扩展(告警字段细分、退服专题)•局数据扩展:业务的扩展•智能维护:功能的加强、业务的扩展整合基站实时告警监控、实时性能监控、整合基站实时告警监控、实时性能监控、基站分类、基站统计分析等层面,专门针基站分类、基站统计分析等层面,专门针对无线质量进行监控与分析,尽早发现网对无线质量进行监控与分析,尽早发现网络存在的问题,为无线基站管理提供有针络存在的问题,为无线基站管理提供有针对性的支撑手段。
对性的支撑手段基站服务质量-目标ABCDEFGHI基站服务质量-与其它系统关系图 接接口口序序号号接口名称接口名称起止子系统起止子系统单双向单双向说明说明A实时告警、网元指令接口基站服务质量模块<->告警和操作维护子系统双向传送告警和操作维护子系统的归一化告警信息到基站服务质量模块,同时可以通过操作维护系统向网元下发指令并获取报告 B资源数据接口基站服务质量模块<->资源子系统双向从资源子系统获取网元配置数据,同时在基站服务质量模块可以修改无线网元的配置信息C性能报表接口基站服务质量模块<-性能子系统单向基站服务质量模块从性能子系统获取相关的报表并呈现D短信接口基站服务质量模块<->短信平台双向把相关的告警信息通过这个接口发送到维护人员,同时通过这个接口接收用户发送过来的请求E语音接口基站服务质量模块->语音平台单向把关键的告警通过通知到维护人员FEOMS接口基站服务质量->EOMS系统单向通过此接口,向EOMS系统发送需要派送工单的告警、追加值班记录G网元数据采集接口网元->网管系统单向通过此接口,从厂家网元或OMC采集告警、配置、性能数据。
HKPI实时监控基站服务质量<->性能实时监控这两个模块之间无线网元的实时性能监控功能复用I鉴权接口基站服务指量<->安全管理模块双向基站服务质量采用3.5统一的安全管理,用3.5安全管理模块提供的鉴权接口即可同时在基站服务质量中,可以修改用户自身的口令基站服务质量-总体结构接口1.1基站服务质量-采集层1.修改配置项,针对不同厂家,分析出断站、AC DOWN、低电压等需要特殊关注的告警,修改告警120消息里的SubAlarmType字段,值的对应关系如下:68:断站告警69:交流电停电70:低电压告警以及针对具体报告分析出细分的字段2.Rthandler送出的120消息里增加了里增加了special_field0~special_field15等细分字段1.WriteFM:增加了细分字段2.FMHandler:增加了细分字段以及细分字段的过滤3.FM2DB:增加了细分字段的处理4.活动告警库:tfa_alarm_text_act里增加了special_field0~special_field15等细分字段5.历史告警库: tfa_alarm_text里增加了special_field0~special_field15等细分字段,增加了基站退服等特殊告警的单独存储表基站服务质量-处理层基站服务质量-服务层•Dispathcer:增加了细分字段以及细分字段的过滤•AMServer:增加了细分字段以及细分字段的过滤•派单服务:增加了细分字段的过滤•新增了告警关联分析模块(基站退服的关联处理和入库)•以下功能为福建特殊功能,以后可以考虑推广:电池智能分析告警通知服务(短信通知为通用、语音通知为福建特殊)短信交互(维护人员可以通过短信进行交互,进行一些简单的查询)基站服务质量-应用层基站服务质量-应用说明•实时性能监控•基站服务质量•告警扩展(告警字段细分、退服专题)•局数据扩展:业务的扩展•智能维护:功能的加强、业务的扩展•网元类型的增加:由于新业务的开展,必将增加一些新的网元类型如软交换等,新增的网元类型需要纳入局数据管理范畴;•局数据范围的扩展:由于现有局数据经过规范的过程,可以通过工具进行规范管理的范围必将持续扩展(比如被叫号码分析表);另外由于互连互通方式的变更导致现网局数据更趋复杂,需要管理的范围扩展;•功能的扩展:在数据核查功能中除"漏做"、"指向错误"、"多做"的核查之外,增加对应压缩而未压缩的局数据核查,提示"建议合并"。
增加局数据管理系统对局数据批命令文件的发送功能,并充分考虑其命令发送的安全性基站服务质量-局数据扩展•功能的扩展:元任务->任务->方案维护记录的管理告警、短信接口•巡检项的扩展基站服务质量-智能维护。
