无线 : Cisco ASR 5000 系列

配置OCS失败解决方法的失败处理和服务器不可达的机制在ASR5K

2016 年 10 月 24 日 - 机器翻译
其他版本: PDFpdf | 英语 (2016 年 4 月 21 日) | 反馈

简介

本文描述如何配置失败处理(FH),并且在Gy的服务器不可达的(SU)机制建立接口为了解决在联机收费系统的问题(OCS)遇到或关于策略之间的连接和正在充电执行功能(PCEF)和OCS。在本文描述的信息是可适用的对在Cisco 5000系列聚集的服务路由器的家庭代理程序、网关通用分组无线业务(GPRS)支持节点(GGSN)和信息包数据网络网关(PGW)功能(ASR5K)运行。

贡献用Shashank Varshney, Cisco TAC工程师。

先决条件

要求

思科建议您的系统满足这些需求为了使用FH和SU机制:

  • 增强版正在充电服务(ECS)是可用的

  • PCEF在HA、GGSN或者PGW内存在

  • 有适当的直径连接通过辉绿岩

  • 直径信用值控制应用程序(DCCA)是可用的

使用的组件

本文档中的信息根据ASR5K的所有版本。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

背景信息

PCEF连接对在Gy接口的OCS,使用直径作为基本协议和DCCA。这是在PCEF和OCS之间的消息流:

  • 信贷管制请求(CCR) –此信息从PCEF传送到OCS。有CCR消息的三种类型:初始,更新,和终止。

  • 信贷管制答案(CCA) –此信息从OCS传送到PCEF以回应CCR。也有CCA消息的三种类型:初始,更新,和终止。

  • 再认可请求(RAR) –,当会话再认可要求时,此信息从OCS传送到PCEF。

  • 再认可答案(RAA) –这是对RAR的答复从PCEF到OCS。

直径连接设立在PCEF和OCS之间为了启用消息流。有可能性OCS也许传送负信息,运输连接也许失效在PCEF和OCS之间,或者消息可能超时,能的用户会话建立导致失败。这可以防止用户使用服务。

这两机制可以用于为了解决此问题:

  • FH机制

  • SU机制

配置

此部分描述要求为了支持FH和SU机制的配置。

网络图

本文档中的信息使用此拓扑:

Tx终止

这是可配置在直径信用值控制设置的DCCA的一个应用程序级计时器。值能排列在1和300秒之间。

示例如下:

[local]host_name(config-dcca)# diameter pending-timeout <value>

响应超时

这是辉绿岩超时并且是可配置在直径终端设置。值能排列在1和300秒之间。

注意:为此计时器配置的值比用于Tx终止计时器的那应该极大。

示例如下:

[context_name]host_name(config-ctx-diameter)# response-timeout <value>

直径会话故障切换

此功能用于为了启用或禁用直径信贷管制会话故障切换,允许系统使用辅助服务器,当主服务器变得不可得到时。这是可配置在直径信用值控制设置。

示例如下:

local]host_name(config-dcca)# diameter session failover

FH机制

如果直径会话故障切换存在, FH机制只运行。当连接或消息级别错误出现时, FH是否允许系统选择继续会话和转换到脱机,或者终止会话。

注意:默认情况下FH启用并且配置。

FH机制配置

FH机制在直径信用值控制设置可以配置。这是在FH配置里使用的语法:

failure-handling { initial-request | terminate-request | update-request } { continue
[ go-offline-after-tx-expiry | retry-after-tx-expiry ] | retry-and-terminate,
[ retry-after-tx-expiry ] | terminate }

第一部分指定请求类型:初始(CCR-I),更新(CCR-U),和终止(CCR-T)。

第二部分指定应该进行的操作,当FH机制激活时。这三操作对FH机制是可能的:

  • 继续–这允许会话继续并且转换它对脱机。此功能使用与Tx终止涉及的两个选项:

    • 去脱机在以后tx终止–,在Tx终止发生后,这开始脱机充电。

    • 重试次数在以后tx终止–,在Tx终止发生后,这再试辅助服务器。

  • 重试次数和终止–这终止会话,在系统再试辅助服务器后,如果辅助服务器不是可用的。这也使用重试次数在以后tx终止选项,再试辅助服务器,在Tx终止发生后。

  • 终止–这终止会话,不用任何尝试联系辅助服务器。

FH机制默认行为

当配置不存在时,此部分描述FH默认行为。默认情况下,在响应超时(RT)期间, FH机制激活,除了,当终止操作配置时。

如果信用值控制失败处理属性值对(AVP)从服务器接收,则已接收设置应用。

例如:

  • 初始请求>终止

  • Update请求>请重试次数和终止

  • Terminate-Request >重试次数和终止

FH机制详细呼叫流

此部分描述FH机制的详细呼叫流有所有可能的选项的。

初始请求

CCFH设置CLI命令在Tx的行为在RT的行为第二是UP第二发生故障

继续

初始请求
继续

不适用

继续

第二
以后接管
RT

脱机在另一个RT以后。
没有其他配额请求没有执行
对于在会话内的任何规定值组
在DCCA失败以后(即使
对DCCA的连接恢复)

初始请求
继续去脱机以后
tx终止

脱机

不适用

脱机在Tx

脱机在Tx

初始请求
继续重试次数以后
tx终止

继续

不适用

第二
以后接管
Tx

脱机在另一Tx以后

重试次数和终止

初始请求
重试次数和终止

不适用

重试次数

第二
以后接管
RT

在另一个RT以后终止

初始请求
重试次数和终止
重试次数在以后tx终止

重试次数

不适用

第二
以后接管
Tx

在另一Tx以后终止

终止

初始请求
终止

终止

不适用

在Tx以后终止

在Tx以后终止

Update请求

CCFH设置CLI命令在Tx的行为在RT的行为第二是UP第二发生故障

继续

Update请求
继续

不适用

继续

第二
以后接管
RT

脱机在另一个RT以后

Update请求
继续去脱机以后
tx终止

脱机

不适用

脱机在Tx

脱机在Tx

Update请求
继续重试次数以后
tx终止

继续

不适用

第二
以后接管
Tx

脱机在另一Tx以后

重试次数和终止

Update请求
重试次数和终止

不适用

重试次数

第二
以后接管
RT

在另一个RT以后的发送CCR-T

Update请求
重试次数和终止
重试次数在以后tx终止

重试次数

不适用

第二
以后接管
Tx

在另一Tx以后的发送CCR-T

终止

Update请求
终止

终止

不适用

在Tx以后的发送CCR-T

在Tx以后的发送CCR-T

Terminate-Request

CCFH设置CLI命令在Tx的行为在RT的行为第二是UP第二发生故障

继续

Terminate-Request
继续

不适用

重试次数

CCR-T发送
对第二
在RT以后

在另一个RT以后终止

Terminate-Request
继续去脱机以后
tx终止

重试次数

不适用

CCR-T发送
对第二
在Tx以后

在另一Tx以后终止

Terminate-Request
继续重试次数以后
tx终止

重试次数

不适用

CCR-T发送
对第二
在Tx以后

在另一Tx以后终止

重试次数和终止

Terminate-Request
重试次数和终止

不适用

重试次数

CCR-T发送
对第二
在RT以后

在另一个RT以后终止

Terminate-Request
重试次数和终止
重试次数在以后tx终止

重试次数

不适用

CCR-T发送
对第二
在Tx以后

在另一Tx以后终止

终止

Terminate-Request
终止

终止

不适用

以后终止
Tx

在Tx以后终止

SU机制

SU机制是类似的FH机制,但是提供对失败步骤的更加粒状的控制。除会话的继续之外,在可以使用消息和连接级别(传输)后失败,此机制,当答复从OCS是慢。它也提供选项对在终端前有一段时间了继续会话持续时间/配额耗尽或者使用可配置临时配额(音量和时间),并且可配置服务器再试,在会话转换对脱机或终止前。 

SU机制配置

SU机制在直径信用值控制设置可以配置。在SU配置里使用的语法变化符合使用的版本。

对于版本12.1和以下,这是使用SU机制配置的语法:

servers-unreachable { initial-request { continue | terminate [ after-timer-expiry
<
timeout_period> ] } | update-request { continue | terminate [ after-quota-expiry
| aftertimer-expiry <
timeout_period> ] } }

对于版本12.2和以上,这是使用SU机制配置的语法:

servers-unreachable { behavior-triggers { initial-request | update-request }
result-code { any-error | <
result-code> [ to <end-result-code> ] }
| transport-failure [ response-timeout | tx-expiry ] | initial-request
{ continue [ { [ after-interim-time <
timeout_period> ] [ after-interim-volume
<
quota_value> ] } server-retries <retry_count> ] | terminate [ {
[ after-interim-time <
timeout_period> ] [ after-interim-volume <quota_value> ]
} server-retries <
retry_count> | after-timer-expiry <timeout_period> ] }
| update-request { continue [ { [ after-interim-time <
timeout_period> ]
[ after-interim-volume <
quota_value> ] } server-retries <retry_count> ]
| terminate [ { [ after-interim-time <
timeout_period> ] [ after-interim-volume
<
quota_value> ] } server-retries <retry_count> ] | after-quota-expiry |
after-timer-expiry <
timeout_period> ] } }

注意:在版本12.2之前的版本中,有灵活性独立地配置FH和SU机制;然而,在版本12.2和以上, SU机制优先于FH机制,当配置。

如果服务器返回CC-FH AVP,并且SU机制为一套行为触发配置,则SU配置应用;否则, CC-FH AVP值应用。默认情况下,结果代码例如3002, 3004和3005属于交付失败和对待Rts。

这些操作对SU机制是可能的:

  • 行为触发–这指定可以是初始请求的消息类型(CCR-I)或更新请求(CCR-U)。有三个选项可用为这些触发:

    • 结果代码–这与消息类型一起允许特定结果代码、范围结果代码(3000-5999),或者所有错误的配置。

    • 传输失败–此规格触发行为在传输失败,向后是与版本12.0兼容。有两个选项可用为此设置:

      • 答复超时–此选项触发行为在RT,并且应该总是与传输失败一起使用。

      • Tx终止–此选项触发行为在Tx终止,并且应该总是与传输失败一起使用。

    • 操作–这指定进行的操作,当CCR-I或CCR-U的一SU触发发生时。此操作变化符合消息类型和软件版本。

  • 继续–这允许将转换的会话对脱机并且继续。没有进一步选项可用为使用此操作在版本在版本12.2之前。在版本12.2和以上,临时配额、服务器重试次数和在以后计时器终止选项为与此操作的配置是可用的。

  • 终止–,当服务器变得不可得到时,这会话的终端导致。此操作允许临时配额、服务器重试次数和在以后计时器终止选项。

这些选项能与继续一起使用终止操作:

    • 在以后过渡技术时间–此选项在临时超时周期之后允许呼叫的连续性或终端。在操作进行前,这类似于时间配额。值以秒钟被格式化,并且能排列在1和4,294,967,295之间。

    • 在以后过渡技术音量–此选项分配临时配额并且在已配置的音量的耗尽前允许会话的连续性或终端。值在字节被格式化,并且能排列在1和4,294,967,295之间。

    • 服务器重试次数–此选项在会话的连续性或终端前提供PCEF重试OCS。重试计数可以配置和在0和65,535之间的值范围。如果值是零,则重试次数不发生,并且操作立即应用。

注意在以后过渡技术时间和在以后过渡技术音量选项总是与服务器重试次数选项一起使用,或者可以同时使用全部三,并且应用对请继续并且终止操作。在以后过渡技术时间和在以后过渡技术音量选项也分配首先用尽的时间以及音量配额,并且配额触发服务器重试次数。

  • 在以后计时器终止–此选项指定(以秒钟)会话在脱机状态依然是的时间持续时间,在终端发生前。值能排列在1和4,294,967,295之间。此选项只是可适用的为终止操作。

  • 在以后配额终止–此选项终止会话在已经已分配配额的耗尽。

这是记住的一些重要信息:

  • 在以后过渡技术时间、在以后过渡技术音量和服务器重试次数选项可以使用单个或在组合,并且他们是可适用的对继续并且终止操作。

  • 在以后配额终止选项为更新请求行为触发只是可适用的。

  • 在以后计时器终止选项为终止操作只是可适用的。

  • 在以后过渡技术时间、在以后过渡技术音量和服务器重试次数选项为版本12.2和以上只是可适用的。

  • 如果直径支持会话故障切换(并且配置),则辅助服务器总是联系,在SU机制被触发前。

  • 是被接触的为时的服务器,在SU机制被触发前总是联系,当临时时间或过渡技术音量用尽时,并且选项配置与值比零极大的服务器重试次数。例如,如果OCS1首先尝试和OCS2在OCS1的一个错误以后尝试,与OCS2的通信然后触发SU机制。在服务器重试次数尝试期间,如果否定答复从OCS2,接收OCS2首先然后被接触OCS1。

SU机制呼叫流

SU机制可以由CCR-I或CCR-U的失败触发,并且原因可以是错误代码、传输失败、Tx终止或者RT。操作可以是临时配额(时间和音量),服务器重试计数、计时器值(引起会话仅脱机在指定的时间和为终端),或者配额终止的分配(仅CCR-U和终端),在会话脱机或终止前。

没有每季提供临时配额,在多个服务信贷管制(MSCC)方案的没有每规定值组(RG)基本类型。

有可能性主服务器触发传输失败,并且辅助服务器触发Tx终止或答复超时。在此方案中,最新的错误认为失败的触发。

如果SU机制没有为任何失败触发配置,则FH机制被触发。

注意:跟随的部分提供有些呼叫与SU机制涉及的流示例。提供这些呼叫流,以为支持直径会话故障切换,并且辅助服务器配置与比RT值是较少的一个Tx终止值。并且,假设, SU机制为传输失败、Tx终止和RT配置。

没有会话断开的初始请求

这是此方案的消息流:

  1. PCEF发送CCR-I对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则SU机制被触发。这立即发生为传输失败,或者在超时的Tx终止以后。

  4. 如果临时音量和时间配置,则临时配额分配到会话。

  5. 在临时配额的耗尽以后(时间或音量)和,如果服务器重试值比零,然后CCR-I极大再发送到触发SU机制的服务器。如果有另一失败, CCR-I发送到另一个服务器。

  6. 如果传输失败或Tx超时再检测,则步骤2至5被重复,直到服务器重试值用尽或一成功的答复不来自OCS。

  7. 如果问题仍然存在,则会话继续(转换对脱机)或根据配置终止。

注意:临时配额,当会话进入SU模式由于被消耗的CCR-I时在下个CCR-I没有报告。所有使用的临时配额在CCR-U报告,跟随成功的CCA-I。

与会话断开的初始请求

这是此方案的消息流:

  1. PCEF发送CCR-I对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则SU机制被触发。这立即发生为传输失败,或者在超时的Tx终止以后。

  4. 如果临时音量和时间配置,则临时配额分配到会话。

  5. 在临时配额的耗尽以后(时间或音量)和,如果服务器重试值比零,然后CCR-I极大再发送到触发SU机制的服务器。如果有另一失败, CCR-I发送到另一个服务器。

  6. 如果传输失败或Tx超时再检测,则步骤2至5被重复,直到服务器重试值用尽或一成功的答复不来自OCS。这时,会话被断开,不用整个临时配额的消耗。

  7. 在会话终止以后, PCEF再发送CCR-I为了开始个新会话。如果这是成功的,则PCEF发送CCR-T,报告整个临时配额使用。

Update请求,不用会话断开

这是此方案的消息流:

  1. PCEF发送CCR-U对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则SU机制被触发。这立即发生为传输失败,或者在超时的Tx终止以后。

  4. 如果临时音量和时间配置,则临时配额分配到会话。

  5. 在临时配额的耗尽以后(时间或音量)和,如果服务器重试值比零,然后CCR-U极大再发送到触发SU机制的服务器。如果有另一失败, CCR-U发送到包含整个已消耗未报告的配额的另一个服务器。

  6. 如果传输失败或Tx超时再检测,则步骤2至5被重复,直到服务器重试值用尽或一成功的答复不来自OCS。

  7. 整个已消耗配额报告对与成功的CCR-U的OCS。

  8. 如果问题仍然存在,则会话继续(转换对脱机)或根据配置终止,在最大重试次数值的耗尽后。

Update请求与会话断开

这是此方案的消息流:

  1. PCEF发送CCR-U对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则SU机制被触发。这立即发生为传输失败,或者在超时的Tx终止以后。

  4. 如果临时音量和时间配置,则临时配额分配到会话。

  5. 在临时配额的耗尽以后(时间或音量)和,如果服务器重试值比零,然后CCR-U极大再发送到触发SU机制的服务器。如果有另一失败, CCR-U发送到包含整个已消耗未报告的配额的另一个服务器。

  6. 如果传输失败或Tx超时再检测,则步骤2至5被重复,直到服务器重试值用尽或一成功的答复不来自OCS。这时,在它消耗整个临时配额前,会话被断开。

  7. PCEF发送CCR-T对OCS为了报告整个已消耗配额。

  8. 如果OCS回应2002年结果代码,则另外的报告不是需要的。

Update请求与未知会话

这是此方案的消息流:

  1. PCEF发送CCR-U对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则SU机制被触发。这立即发生为传输失败,或者在超时的Tx终止以后。

  4. 如果临时音量和时间配置,则临时配额分配到会话。

  5. 在临时配额的耗尽以后(时间或音量)和,如果服务器重试值比零,然后CCR-U极大再发送到触发SU机制的服务器。如果有另一失败, CCR-U发送到包含整个已消耗未报告的配额的另一个服务器。

  6. 5002 (未知会话ID)结果代码的OCS回复CCR-U的,是可能的在方案OCS重新启动并且丢失会话ID信息。

  7. PCEF启动与CCR-I的一个新会话并且接收CCA-I。

  8. PCEF通过在随后的消息的CCR-U报告整个已消耗临时配额。

Update请求与多个RG (MSCC方案)

这是此方案的消息流:

  1. PCEF发送RG1的CCR-U对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则SU机制被触发。这立即发生为传输失败,或者在超时的Tx终止以后。

  4. 如果临时音量和时间配置,则临时配额分配到会话

  5. 这时RG2用尽整个已分配配额,但是也不启动CCR-U,因为会话已经是在SU模式并且开始消耗临时配额。

  6. 在临时配额的耗尽以后(时间或音量)和,如果服务器重试值比零,然后CCR-U极大再发送到触发SU机制的服务器。如果有另一失败, CCR-U发送到包含两RG的整个已消耗未报告的配额的另一个服务器。

  7. 如果传输失败或Tx超时再检测,则步骤2至6被重复,直到服务器重试值用尽或一成功的答复不来自OCS。

  8. 整个已消耗配额报告对与成功的CCR-U的OCS。

  9. 如果问题仍然存在,则会话继续(转换对脱机)或根据配置终止,在最大重试次数值的耗尽后。

Terminate-Request

这是此方案的消息流:

  1. PCEF发送CCR-T对OCS。

  2. 超时或传输失败检测。如果传输失败检测,则PCEF用辅助服务器立即再试;否则, Tx终止被触发。

  3. 如果辅助服务器也有传输失败或超时,则会话删除。

CCR错误代码处理

这是此方案的消息流:

  1. PCEF发送对OCS的CCR和与错误代码的OCS回复。

  2. 错误代码在SU机制静态配置。

  3. PCEF提供临时配额,不用重试次数给辅助服务器。

FH和SU配置示例

此部分为FH和SU机制提供配置示例。当FH和SU机制配置时, SU优先于同一行为触发的FH。

示例如下:

credit-control group test

diameter origin endpoint test

diameter peer-select peer test

quota volume-threshold percent 10

diameter pending-timeout 80 deciseconds msg-type any

diameter session failover

trigger type rat lac

apn-name-to-be-included virtual

quota request-trigger exclude-packet-causing-trigger

failure-handling initial-request continue retry-after-tx-expiry

servers-unreachable initial-request terminate after-interim-volume 200
after-interim-time 3600 server-retries 0

servers-unreachable behavior-triggers initial-request transport-failure
tx-expiry

servers-unreachable update-request continue after-interim-volume 200
after-interim-time 3600 server-retries 50

servers-unreachable behavior-triggers update-request transport-failure
tx-expiry

验证

为了验证您的配置适当地工作,请输入显示激活正在充电服务<service name>命令:

# show active-charging service name test



Service name: test



TCP Flow Idle Timeout : 300 (secs)

UDP Flow Idle Timeout : 300 (secs)

ICMP Flow Idle Timeout : 300 (secs)

ICMP Flow Idle Timeout : 300 (secs)

ALG Media Idle Timeout : 120 (secs)



TCP Flow-Mapping Idle Timeout : 300 (secs)

UDP Flow-Mapping Idle Timeout : Not Configured



Deep Packet Inspection: Enabled

Passive Mode : Disabled

CDR Flow Control : Enabled

CDR Flow Control Unsent Queue Size: 75

Unsent Queue high watermark: 56

Unsent Queue low watermark: 18



Content Filtering: Disabled



Dynamic Content Filtering: Disabled



URL-Blacklisting: Disabled

URL-Blacklisting Match-method: Exact



Content Filtering Match-method: Generic





Interpretation of Charging-rule-base-name: active-charging-group-of-ruledefs





Selection of Charging-rule-base AVP : Last



Credit Control:

Group : test



Mode : diameter

APN-name-to-be-included: gn

Trigger-Type : N/A



Failure-Handling:

Initial-Request : continue retry-after-tx-expiry

Update-Request : retry-and-terminate

Terminate-Request: retry-and-terminate



Server Unreachable Failure-Handling:

Initial-Request : terminate

Update-Request : continue

故障排除

输入statistics命令显示激活正在充电的信用值控制为了查看与SU和FH机制涉及的统计信息。以下为示例输出:

#show active-charging credit-control statistics
...

OCS Unreachable Stats:

Tx-Expiry: 2291985 Response-TimeOut: 615

Connection-Failure: 2 Action-Continue: 0

Action-Terminated: 0 Server Retries: 2023700



Assumed-Positive Sessions:

Current: 2 Cumulative: 2196851

这是关于此示例输出的一些重要提示:

  • Tx终止–这指示一个SU情况由于Tx终止。

  • 答复超时–这指示一个SU情况由于RT。

  • 连接失败–这指示一个SU情况由于传输失败。

  • Action continue –此字段指示脱机会话的数量。

  • 操作终止–此字段指示终止会话的数量。

  • 服务器重试次数–此字段指示次数OCS再试了。

  • 假设正塞申斯

    • 当前–此字段指示当前是在SU情况会话的数量。

    • 渐增–此字段指示搬入SU状态会话的总数。

参与显示激活正在充电会话全双工all命令为了查看与会话的SU状态涉及的信息。以下为示例输出:

#show active-charging sessions full all
..
..

Current Server Unreachable State: CCR-I

Interim Volume in Bytes (used / allotted): 84/ 200

Interim Time in Seconds (used / allotted): 80/ 3600

Server Retries (attempted / configured): 1/ 50

这是关于此示例输出的一些重要提示:

  • 当前服务器不可得到州这指定当前SU状态是否归结于CCR-I或CCR-U。

  • 在字节的临时音量(使用/被定量) –这显示在字节的临时音量使用与分配的字节。

  • 临时时间以秒钟(使用/被定量) –这显示临时音量以秒钟使用与分配的秒钟。

  • 服务器再试(尝试/配置) –此是服务器重试次数数量尝试与配置的那。

相关信息



Document ID: 118993