无线 : Cisco Policy Suite for BNG

日志和需的信息在QPS系统故障情形下

2016 年 10 月 24 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 8 月 22 日) | 反馈

简介

本文描述必须完成为了获取信息的步骤,当Quantum策略套件(QPS)时系统故障或失败发生。如果硬件、软件和虚拟机需求符合,不太可能QPS将失败。

贡献用Aravindhan Balasubramian,托尼Pina和Vinodkumar蒂瓦里, Cisco TAC工程师。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档中的信息基于以下软件和硬件版本:

  • QPS版本5.5及以后。

注意:某些日志在QPS版本比QPS版本5.5不会出现旧。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

捕获信息

如果QPS系统故障发生,请收集此信息:

诊断和调试日志

  1. 策略和正在充电规则功能(PCRF)客户端虚拟机的洛金(例如, pcrfclient01)和收集诊断信息(例如, /opt/broadhop/installer/diag/diagnostics.sh)。
  2. 登陆到PCRF客户端虚拟机并且收集调试信息。调试信息包括统一的QNS日志、svn回购和QNS配置细节。确保统一的日志包括系统故障的时期,并且调试级别在logback.xml文件设置。 
  3. 收集从您的QPS的此输出(例如,请运行/opt/broadhop/installer/diag/zip_debug_info.sh,并且输出在/var/tmp/debug_info <date>.zip)存储。
  4. 登陆对系统故障发生的QPS虚拟机实例。(例如, pcrfclient0x、lb0x、qns0x, portal0x)。收集QNS日志并且确保, QNS日志包括系统故障的时期。(例如, cat /etc/broadhop/license/QUANTUM201311210402429360.lic)。

QPS许可证信息

  1. 登陆到PCRF客户端虚拟机并且收集QPS许可证信息。QPS为一个特定功能通常准许,并且支持的有并发会话最大。QPS也有此功能的一个有效期。
  2. 导航对此目录:/etc/broadhop/license和获取许可证(.lic)文件的输出。(例如, cat /etc/broadhop/license/QUANTUM201311210402429360.lic)。

系统统计信息

  1. 捕获系统统计(示例:CPU,内存,磁盘利用率)。
  2. 登陆到PCRF客户端虚拟机并且收集输出。示例: /opt/broadhop/control/top_qps.sh
  3. 例如登陆到对应的虚拟机(pcrfclient0x、lb0x, qns0x)并且捕获这些系统统计:

    cat /proc/meminfo >分配了内存信息
    释放- s 60 >每一分钟的内存统计信息
    vmstat 1 >每一分钟的CPU状态
    辅助的ps -|题头消耗多数CPU利用率的-10 >名列前茅10进程详细资料
    swapon - s >交换使用汇总信息每个设备
    .。du - a|排序- n - r|题头- n 10 >消耗更多的名列前茅10文件/目录空间

  4. 登陆到sessionmgr虚拟机并且收集输出mongostatmongotop,将帮助为了排除故障是否问题与数据库涉及。

在策略创建人的线索配置

登陆对策略创建人并且导航对参考数据> System-1 >插件配置>线程配置。 

线索数量少于1,000也许范围自40到50 TPS的,但是。您能配置线索的最大是50。如果增加线索数量,这影响系统性能。 

致命错误错误日志

当系统故障发生时, QPS生成致命错误错误日志,当时包含进程状态发生的致命错误。致命错误或致命例外错误造成程序中止。

致命错误错误日志包括此信息:

  • 操作的例外或表明挑衅致命错误
  • 版本和配置信息
  • 在挑衅致命错误和线索的堆栈跟踪的线索的详细信息
  • 运行线索和他们的状态列表
  • 关于堆的汇总信息
  • 装载的本地库列表
  • 命令行参数
  • 环境变量
  • 关于操作系统(OS)和中央处理器(CPU)的详细信息

默认日志文件名按照此格式: hs_err_pid<pid>.log和在对应的Java进程开始的工作目录生成。示例:用户的工作目录,当用户开始QNS进程。

如果不认识工作目录,请搜索系统有名称的hs_err_pid*.log文件并且检查文件一度配比的,当错误出现。

完成这些步骤为了指定致命错误的位置:

  1. 登陆到pcrfclient01虚拟机
  2. 打开jvm.conf (例如, vi /etc/broadhop/pcrf/jvm.conf)。
  3. 添加选项: - XX: 对列表的ErrorFile=<directory>/<file-name>%p.log和确保,指定的目录路径存在,并且用户QNS有在该目录的全双工权限。 示例: - X :ErrorFile=/home/qns/fatal_error%p.log
  4. 如果在pcrfclient01:/etc/broadhop的conf文件不是同步用在/etc/broadhop的conf文件在管理QNS服务的VMs syncconfig.sh命令能引起很多问题。syncconfig.sh将采取pcrfclient01:/etc/broadhop conf文件和改写在/etc/broadhop的conf文件在运行QNS的VMs。 

    警告:命令synconfig.sh将采取pcrfclient01:/etc/broadhop conf文件,并且覆盖在/etc/broadhop的所有conf文件在运行QNS的虚拟机请服务(ifor示例、iomgr01、iomgr02、qns01、qns02等等)

  5. 重新启动QNS应用程序并且输入命令restartall.sh


Document ID: 117999