好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

TongLinkQ常见问题处理指南.doc

15页
  • 卖家[上传人]:ni****g
  • 文档编号:532918049
  • 上传时间:2024-03-10
  • 文档格式:DOC
  • 文档大小:425.50KB
  • / 15 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • TongLINK/Q常见问题处理指南北京东方通科技支持服务中心目 录1. 引言 32. 故障处理前期准备 33. 故障处理流程 43.1. 故障处理流程 43.2. 节点运行诊断流程 43.2.1. 操作系统核心参数 53.2.2. TongLINK/Q环境变量 63.2.3. 查看TongLINK/Q配置文件 63.2.4. 查看系统资源和进程 73.2.5. 查看TongLINK.sys文件 83.3. 网络连接诊断流程 93.3.1. 网络层连通性诊断 93.3.2. 使用TongLINK/Q命令检测节点间的连通性 103.4. 检查队列中的消息 113.4.1. 检查错误日志TongLink.sys 124. 【附录】 134.1. 常用系统命令 134.2. 核心参数 134.3. setp文件Demo 141. 引言TongLINK/Q的常见故障主要出现在基于TongLINK/Q架构的应用系统运行时此文档将重点描述如何判断和处理TongLINK/Q常见的故障问题2. 故障处理前期准备在进行故障处理之前,必须先了解TongLINK/Q运行环境的相关信息,具体的信息需求如表格所示:类型内容备注操作系统类型操作系统版本TongLINK/Q产品版本TongLINK/Q架构模式故障现象描述项目名称客户名称联系人联系图2.1 故障处理需求表 注:1、表格中红色字体选项是东方通科技公司支持服务中心人员进行故障处理时必须了解的信息;2、“TongLINK/Q架构模式”包括多节点、转发、集群、订阅/发布、JMS等;3. 故障处理流程3.1. 故障处理流程TongLINK/Q故障处理顺序如下:查看节点运行情况、查看网络运行状况、判断队列中消息运行情况、查看应用日志判断故障等;具体的总流程如下:图3.0 故障处理总流程3.2. 节点运行诊断流程在处理TongLINK/Q可能出现的问题时,首先需要要确保客户方和服务方的TongLINK/Q正常运行,网络连接正常,并且机器资源够用。

      具体的处理流程如下图3.2所示:图3.1 节点运行诊断流程每一检查点的具体步骤描述将在下文具体描述3.2.1. 操作系统核心参数操作系统核心参数的大小会影响TongLINK/Q的正常运行(包括启动)TongLINK/Q运行时需要调整的操作系统核心参数包括共享内存、信号灯、打开文件数、进程数等另外,还必须保证当前操作系统的内存、CPU以及安装TongLINK/Q的当前用户磁盘空间足够用具体查看命令查看附录中“常见操作系统命令”部分3.2.2. TongLINK/Q环境变量需要检查TongLINK/Q的环境变量是否齐全,并且指向的目录正确在UNIX和LINUX系统中可以用命令行的方式查看TongLINK/Q环境变量是否正确,正确显示入下(假设安装TongLINK/Q的是tlq用户,安装在/home/tlq目录下):$ su – tong$ env|grep TLQ TLQHOMEDIR=/home/tlqTLQMSGDIR=/home/tlq/msgTLQCONFDIR=/home/tlq/etcTLQRCVFILESDIR=/home/tlq/rcvfilesTLQSNDFILESDIR=/home/tlq/sndfilesTLQFILESDIR=/home/tlq/filesTLQLOGDIR=/home/tlq/log$ env|grep PATHPATH=.:/home/tlq/bin :……#假如需要启动管理界面或者运行java程序,还应该有与java相关的环境变量注: TongLINK/Q自身的环境变量包括:l TLQCONFDIR------配置文件的存放目录l TLQLOGDIR-------日志文件的存放目录l TLQFILESDIR-----传输文件存放目录l TLQSNDFILESDIR----消息传输过程中,发送消息文件的存放目录l TLQRCVFILESDIR---消息传输过程中,接收消息文件的存放目录l TLQMSGDIR-------系统中队列的映射文件存放目录l PATH------------可执行程序的存放目录l CLASSPATH-------JMS和JAVA接口的存放目录l JAVA_HOME-------指向JDK的安装路径l PATH :TongLINK/Q核心进程已经应用程序服务方程序存放路径假如使用Java应用程序还需要根据操作系统的不同设定相关的LD_LIBRARY_PATH/SHLIB_PATH/ SHLIB_PATH等以上参数的具体设定方法见TongLINK/Q手册《TongLINKQ系统管理》第2章 “运行”中 “配置环境变量”章节的描述。

      3.2.3. 查看TongLINK/Q配置文件l TongUser.Conf主要关注下级节点该配置文件中[UpNodeRecord]小节的“UpName” 、 “ConnPort”和“NodeIP”项的值与上级节点该配置文件中[SelfNode] 的“LocalNodeName”、[System]中的“ListenPort”以及上级节点所在机器的IP地址分别一一对应;另外上级节点 [DownNodeRecord]小节的“DownName”与下级节点中[SelfNode] 的“LocalNodeName” 一一对应;每个发送队列中“QueDestNode”必须在节点配置中配置(上级或者下级节点);各配置文件配置项的具体描述见TongLINK/Q手册《TongLINK/Q系统管理》第3章 “参数配置”中各章节的描述;3.2.4. 查看系统资源和进程TongLINK/Q45正常运行后,产生的IPC资源包括:5块共享内存,3块信号灯;并且至少有2个进程启动(tld、tmoni,假如远程代理或者JMS服务还应该有其他的进程)如下所示:$ su – tlq$ ipcs|grep tlqm 3407920 0x124c0b73 --rw-rw-rw- tlq usrm 3014731 0x124c0b51 --rw-rw-rw- tlq usrm 11141248 0x124c0b6d --rw-rw-rw- tlq usrm 21102732 0x124c0b61 --rw-rw-rw- tlq usrm 14942381 0x124c0b50 --rw-rw-rw- tlq usrs 11796510 0x124c0b50 --ra-ra-ra- tlq usrs 18350126 0x4624c0b2 --ra-ra-ra- tlq usrs 1441910 0x124c0b71 --ra-ra-ra- tlq usr$ ps -ef|grep tongtlq 68928 1 1 11:56:51 - 0:35 /home/tlq/bin/tlqdtlq 73514 1 0 11:56:51 - 0:00 /home/tlq/bin/tlqmoni……如果与此不符合,说明TongLINK/Q启动不正常,需要停止TongLINK/Q,停止与TongLINK/Q相关的进程,清空与TongLINK/Q相关的IPC资源,重新启动。

      #查看进程:$ ps -ef|grep tlq tlq 68928 1 1 11:56:51 - 0:35 /home/tlq/bin/tlqdtlq 73514 1 0 11:56:51 - 0:00 /home/tlq/bin/tlqmoni……(能看到一个tlqd和一个tlqmoni进程存在,表示启动正常)#停止进程:$ kill -9 68928 -9 73514 #查看IPC资源:$ ipcs|grep tong m 10879106 0x12900ee2 --rw-rw---- tlq usrs 6291495 0x12900ee2 --ra-ra---- tlq usr……#清空IPC资源:$ ipcrm –m 10879106 -m 13631628 –s1048665在TongLINK/Q启动时,如果操作系统的IPC资源不足,则在启动时TongLINK.sys日志中出现错误提示信息:例如:3.2.5. 查看TongLINK.sys文件系统正常启动的日志如下:$su – tlq$tlq Because of the large size queues,Start Kernel process maybe take a few minutes.... TongLINK/Q start OK !否则,说明TongLINK/Q启动有问题;具体的问题处理详见“TongLINK/Q问题集”。

      3.3. 网络连接诊断流程图3.2 网络连接诊断流程3.3.1. 网络层连通性诊断TongLINK/Q两个节点连接不通,如果节点自身运行、配置没有问题,那么出现问题的原因可能是:l 网络不通; 检查及解决方法:在下级节点所在机器执行:“ping 上级节点所在机器IP地址” 假如ping不通说明网络有问题,联系网络管理员解决问题; l 下级节点或者上级节点机器上有防火墙,并且没有开放TongLINK/Q监听端口,阻值了TongLINK/Q节点间的连通;检查及解决方法: 在下级节点所在机器执行如下命令:telnet 上级节点机器IP地址 监听端口号 如果执行后窗口无任何字符显示,并且锁死,不能进行任何操作则为正常结果,即IP地址和端口号均可用;否则联系网络管理员解决问题; 例如:#在unix操作系统有如下显示表示端口号可用:$ telnet 168.1.1.111 50010Trying...Connected to 168.1.1.111. Escape character is '^]'.Connection closed.#如果有如下显示表示不可用$ telnet 168.1.1.111 10240Trying...telnet: connect: A remote host refused an attempted connect operation.l TongLINK/Q上级节点所在机器没有开通TongLINK/Q监听端口(上级节点TongLINK.conf文件中“SelfPort”所指的端口号;检查及解决方法同上;l 有两个下级节点重名;检查及解决方法: 在服务方节点,如果用tlqstat –l命令屏幕显示某一下级节点连接状态时断时续,并且上级节点的TongLINK.sys中有如下错误信息有如下信息“CheckSIPName error,……, already exist”等信息,说明有两个不同IP地址的下级。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.