排除FMC未处理事件的排放和频繁的排放事件运行状况监视器警报

下载选项

PDF (1.4 MB)
在各种设备上使用 Adobe Reader 查看
ePub (1.0 MB)
在 iPhone、iPad、Android、Sony Reader 或 Windows Phone 上使用各种应用查看
Mobi (Kindle) (564.5 KB)
在 Kindle 设备上查看或在多个设备上使用 Kindle 应用查看

已更新: 2024 年 5 月 3 日

文档 ID:216081

非歧视性语言

此产品的文档集力求使用非歧视性语言。在本文档集中，非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言，文档中可能无法确保完全使用非歧视性语言。深入了解思科如何使用包容性语言。

关于此翻译

思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言，希望全球的用户都能通过各自的语言得到支持性的内容。请注意：即使是最好的机器翻译，其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任，并建议您总是参考英文原始文档（已提供链接）。

简介

本文档介绍如何对Firepower管理中心上未处理事件的消耗和频繁发生的事件消耗运行状况警报进行故障排除。

问题概述

Firepower管理中心(FMC)生成以下运行状况警报之一：

频繁耗尽统一低优先级事件
从Unified Low Priority Events中排出未处理的事件

虽然这些事件在FMC上生成和显示，但它们与受管设备传感器相关，无论是Firepower威胁防御(FTD)设备还是下一代入侵防御系统(NGIPS)设备。在本文档的其余部分，除非另有说明，否则术语“传感器”同时指代FTD和NGIPS设备。

频繁排水警报受限未处理的排出警报受限

这是运行状况警报结构：

频繁耗尽<SILO NAME>

从<SILO NAME>中排出未处理的事件

在本示例中，思洛存储器名称是Unified Low Priority Events。这是磁盘管理器孤岛之一（有关更全面的说明，请参见“背景信息”部分）。

此外：

虽然从技术上讲，任何思洛存储器都可以生成<SILO NAME>频繁地消耗运行状况警报，但最常见的是与事件相关的事件以及其中低优先级事件，因为这些事件通常由传感器生成。
如果<SILO NAME>事件是事件相关的思洛存储器，则频繁的排出事件具有“警告”严重性，因为，如果处理了此事件（接下来提供有关未处理事件的组成部分的说明），则它们在FMC数据库中。
对于与事件无关的思洛存储器（如备份思洛存储器），警报为“严重”，因为此信息已丢失。
只有事件类型孤岛会从<SILO NAME>运行状况警报中生成未处理事件的排出。此警报始终具有“严重”严重性。

其他症状可能包括：

FMC UI缓慢
事件丢失

常见故障排除场景

由于向思洛存储器输入的内容过多，导致频繁耗尽<SILO NAME>事件。在这种情况下，磁盘管理器会在最后5分钟间隔内至少两次清空（清除）该文件。在事件类型接收器中，这通常是由该事件类型的过多日志记录导致的。如果<SILO NAME>运行状况警报的未处理事件排出，这也可能是由于事件处理路径中存在瓶颈所致。

流程图sf

在图中，有3个潜在的瓶颈：

FTD上的EventHandler进程超订用（其读取速度比Snort写入的速度慢）。
事件接口超订用。
FMC上的SFDataCorrelator进程超订用。

要深入了解事件处理体系结构，请参阅相应的深入探讨部分。

例 1.日志记录过多

如上一节所述，导致此类运行状况警报的最常见原因之一是输入过多。

通过show disk-manager CLISH命令收集的低水位标记(LWM)与高水位标记(HWM)之间的差异表明，接收思洛存储器需要多少空间才能从LWM（全新排出）变为HWM值。如果事件频繁排出（无论有无未处理的事件），您必须首先检查日志记录配置。

有关磁盘管理器过程的深入说明，请参阅各自的深入探讨部分。

无论是双重日志记录，还是整个manager-sensors生态系统中的事件率较高，都必须检查日志记录设置。

案例 2.传感器与FMC之间通信信道的瓶颈

此类警报的另一个常见原因是传感器和FMC之间的通信信道(sftunnel)存在连接问题和/或不稳定性。通信问题可能是由于：

sftunnel关闭或不稳定（摆动）。
sftunnel超订用。

对于sftunnel连接问题，请确保FMC和传感器在TCP端口8305上的管理接口之间可以访问。

在FTD上，您可以在[/ngfw]/var/log/messages文件中搜索sftunneld字符串。连接问题导致生成如下消息：

Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_ch_util [INFO] Delay for heartbeat reply on channel from 10.62.148.75 for 609 seconds. dropChannel...
Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_connections [INFO] Ping Event Channel for 10.62.148.75 failed
Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_channel [INFO] >> ChannelState dropChannel peer 10.62.148.75 / channelB / EVENT [ msgSock2 & ssl_context2 ] <<
Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_channel [INFO] >> ChannelState freeChannel peer 10.62.148.75 / channelB / DROPPED [ msgSock2 & ssl_context2 ] <<
Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_connections [INFO] Need to send SW version and Published Services to 10.62.148.75
Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_peers [INFO] Confirm RPC service in CONTROL channel
Sep  9 15:41:35 firepower SF-IMS[5458]: [27602] sftunneld:sf_channel [INFO] >> ChannelState do_dataio_for_heartbeat peer 10.62.148.75 / channelA / CONTROL [ msgSock & ssl_context ] <<
Sep  9 15:41:48 firepower SF-IMS[5458]: [5464] sftunneld:tunnsockets [INFO] Started listening on port 8305 IPv4(10.62.148.180) management0
Sep  9 15:41:51 firepower SF-IMS[5458]: [27602] sftunneld:control_services [INFO] Successfully Send Interfaces info to peer 10.62.148.75 over managemen
Sep  9 15:41:53 firepower SF-IMS[5458]: [5465] sftunneld:sf_connections [INFO] Start connection to : 10.62.148.75 (wait 10 seconds is up)
Sep  9 15:41:53 firepower SF-IMS[5458]: [27061] sftunneld:sf_peers [INFO] Peer 10.62.148.75 needs the second connection
Sep  9 15:41:53 firepower SF-IMS[5458]: [27061] sftunneld:sf_ssl [INFO] Interface management0 is configured for events on this Device
Sep  9 15:41:53 firepower SF-IMS[5458]: [27061] sftunneld:sf_ssl [INFO] Connect to 10.62.148.75 on port 8305 - management0
Sep  9 15:41:53 firepower SF-IMS[5458]: [27061] sftunneld:sf_ssl [INFO] Initiate IPv4 connection to 10.62.148.75 (via management0)
Sep  9 15:41:53 firepower SF-IMS[5458]: [27061] sftunneld:sf_ssl [INFO] Initiating IPv4 connection to 10.62.148.75:8305/tcp
Sep  9 15:41:53 firepower SF-IMS[5458]: [27061] sftunneld:sf_ssl [INFO] Wait to connect to 8305 (IPv6): 10.62.148.75

FMC管理接口的超订用可能是管理流量的激增或持续的超订用。健康监测器的历史数据很好地说明了这一点。

需要注意的第一件事是，在大多数情况下，FMC都部署有单个网卡用于管理。此接口用于：

FMC管理
FMC传感器管理
传感器的FMC事件收集
更新情报源
从软件下载站点下载SRU、软件、VDB和GeoDB更新
查询URL信誉和类别（如果适用）
文件性质查询（如果适用）

案例 3.SFDataCorrelator进程中的一个瓶颈

要涵盖的最后一个场景是SFDataCorrelator端(FMC)发生瓶颈时。

第一步是查看diskmanager.log文件，因为要收集的重要信息包括：

排出物的频率。
Unprocessed Events耗尽的文件数。
具有Unprocessed Events的排出事件。

有关diskmanager.log文件及其解释方法的信息，请参阅磁盘管理器部分。从diskmanager.log中收集到的信息有助于缩小后续步骤的范围。

此外，您需要查看相关器性能统计信息：

admin@FMC:~$ sudo perfstats -Cq < /var/sf/rna/correlator-stats/now 
129 statistics lines read
                 host limit:                         50000            0                50000
                 pcnt host limit in use:             100.01           100.00           100.55
                 rna events/second:                  1.78             0.00             48.65
                 user cpu time:                      2.14             0.11             58.20
                 system cpu time:                    1.74             0.00             41.13
                 memory usage:                       5010148          0                5138904
                 resident memory usage:              757165           0                900792
                 rna flows/second:                   101.90           0.00             3388.23
                 rna dup flows/second:               0.00             0.00             0.00
                 ids alerts/second:                  0.00             0.00             0.00
                 ids packets/second:                 0.00             0.00             0.00
                 ids comm records/second:            0.02             0.01             0.03
                 ids extras/second:                  0.00             0.00             0.00
                 fw_stats/second:                    0.01             0.00             0.08
                 user logins/second:                 0.00             0.00             0.00
                 file events/second:                 0.00             0.00             0.00
                 malware events/second:              0.00             0.00             0.00
                 fireamp events/second:              0.00             0.00             0.01

这些统计信息是针对FMC的，它们对应于由FMC管理的所有传感器的汇聚。对于Unified低优先级事件，您主要寻找：

任何事件类型的每秒总流数，用于评估SFDataCorrelator进程的可能超订用。
在上一输出中突出显示的两行：
- rna flows/second -表示SFDataCorrelator处理的低优先级事件的速率。
- rna dup flows/second -指示SFDataCorrelator处理的重复低优先级事件的速率。如前一个场景所述，这是通过双重日志记录生成的。

根据输出可以得出以下结论：

没有重复记录，如rna dup flows/second row所示。
在rna flows/second行中，最大值远高于平均值，因此SFDataCorrelator进程处理的事件速率出现峰值。当您看到用户工作日刚开始时的今天清晨，这种情况是意料之中的事，但总的来说，这是一个危险信号，需要进一步调查。

有关SFDataCorrelator进程的更多信息，请参阅事件处理部分。

在联系思科技术支持中心(TAC)之前要收集的项目

强烈建议您在联系思科TAC之前收集以下项目：

查看的运行状况警报的截图。
对从FMC生成的文件进行故障排除。
对从受影响的传感器生成的文件进行故障排除。
首次发现问题的日期和时间。
有关最近对策略所做的任何更改的信息（如果适用）。
事件处理部分中介绍的stats_unified.pl命令输出以及受影响的传感器。

深入了解

本节深入说明可参与此类运行状况警报的各种组件。包括：

事件处理-涵盖传感器设备和FMC上事件所采用的路径。当运行状况警报引用事件类型思洛存储器时，这主要很有用。
磁盘管理器-涵盖磁盘管理器流程、孤岛及其耗尽方式。
运行状况监控器-介绍如何使用运行状况监控器模块生成运行状况警报。
Log to Ramdisk -介绍记录到ramdisk功能及其对运行状况警报的潜在影响。

要了解事件漏出运行状况警报并能够识别潜在的故障点，需要了解这些组件如何工作以及它们如何相互交互。

事件处理

尽管频繁漏斗类型的运行状况警报可能由与事件无关的孤岛触发，但思科TAC看到的绝大多数案例都与事件相关信息的漏斗有关。此外，为了了解什么构成了未处理事件的耗尽，需要查看事件处理架构及其组件。

流程图通用

当Firepower传感器收到来自新连接的数据包时，snort进程会以unified2格式生成事件，该格式采用二进制格式，允许更快的读/写操作，同时允许更轻的事件。

输出显示FTD命令system support trace，您可在其中看到创建的新连接。重点介绍和解释了以下重要部分：

192.168.0.2-42310 - 192.168.1.10-80 6 AS 1-1 CID 0 Packet: TCP, SYN, seq 3310981951
192.168.0.2-42310 - 192.168.1.10-80 6 AS 1-1 CID 0 Session: new snort session
192.168.0.2-42310 - 192.168.1.10-80 6 AS 1-1 CID 0 AppID: service unknown (0), application unknown (0)
192.168.0.2-42310 > 192.168.1.10-80 6 AS 1-1 I 0 new firewall session
192.168.0.2-42310 > 192.168.1.10-80 6 AS 1-1 I 0 using HW or preset rule order 4, 'Default Inspection', action Allow and prefilter rule 0
192.168.0.2-42310 > 192.168.1.10-80 6 AS 1-1 I 0 HitCount data sent for rule id: 268437505,
192.168.0.2-42310 > 192.168.1.10-80 6 AS 1-1 I 0 allow action
192.168.0.2-42310 - 192.168.1.10-80 6 AS 1-1 CID 0 Firewall: allow rule, 'Default Inspection', allow
192.168.0.2-42310 - 192.168.1.10-80 6 AS 1-1 CID 0 Snort id 0, NAP id 1, IPS id 0, Verdict PASS

Snort unified_events文件按实例在路径[/ngfw]var/sf/detection_engine/*/instance-N/下生成，其中：

*是Snort UUID。每个设备都唯一。
N是Snort实例ID，可以根据上一个输出（示例中突出显示的0）+ 1计算该实例ID

任何给定的Snort实例文件夹中都可以有2种类型的unified_events文件：

unified_events-1（包含高优先级事件。）
unified_events-2（包含低优先级事件。）

高优先级事件是与潜在恶意连接相对应的事件。

事件类型及其优先级：

高优先级(1)	低优先级(2)
入侵	连接
恶意软件	发现
安全情报	文件
关联的连接事件	统计信息

下一个输出显示属于上一个示例中跟踪的新连接的事件。格式为unified2，取自位于[/ngfw]/var/sf/detection_engine/*/instance-1/下的各个统一事件日志的输出，其中1是上一个输出+1中粗体显示的snort实例id。统一事件日志格式名称使用语法unified_events-2.log.1599654750，其中2代表事件优先级，如表中所示，而最后一部分以粗体(1599654750)表示，是创建文件时的时间戳（Unix时间）。

提示：您可以使用Linux date命令将Unix时间转换为可读日期：
admin@FP1120-2：~$ sudo date -d@1599654750
2020年9月9日星期三14:32:30 CEST

Unified2 Record at offset 2190389
  Type: 210(0x000000d2)
  Timestamp: 0
  Length: 765 bytes
Forward to DC: Yes
FlowStats:
        Sensor ID: 0
        Service: 676
        NetBIOS Domain: <none>
        Client App: 909, Version: 1.20.3 (linux-gnu)
        Protocol: TCP
        Initiator Port: 42310
        Responder Port: 80
        First Packet: (1599662092) Tue Sep 9 14:34:52 2020
        Last Packet: (1599662092) Tue Sep 9 14:34:52 2020

<OUTPUT OMITTED FOR READABILITY>

        Initiator: 192.168.0.2
        Responder: 192.168.1.10
        Original Client: ::
        Policy Revision: 00000000-0000-0000-0000-00005f502a92
        Rule ID: 268437505
        Tunnel Rule ID: 0
        Monitor Rule ID: <none>
        Rule Action: 2

除每个unified_events文件外，还有一个书签文件，其中包含两个重要值：

与该实例和优先级的当前unified_events文件对应的时间戳。
在unified_event文件中最后一次读取事件的位置（以字节为单位）。

这些值按逗号分隔的顺序排列，如本示例所示：

root@FTD:/home/admin# cat /var/sf/detection_engines/d5a4d5d0-6ddf-11ea-b364-2ac815c16717/instance-1/unified_events-2.log.bookmark.1a3d52e6-3e09-11ea-838f-68e7af919059
1599862498,   18754115

这样，磁盘管理器进程就可以知道哪些事件已处理（发送到FMC），哪些事件未处理。

注意：当磁盘管理器耗尽事件思洛存储器时，它会删除统一事件文件。

有关耗尽孤岛的详细信息，请阅读磁盘管理器部分。

当下列情况之一为真时，已耗尽的统一文件将被视为具有未处理的事件：

书签时间戳低于文件创建时间。
书签时间戳与文件创建时间相同，并且文件中的字节位置低于文件大小。

EventHandler进程从统一文件读取事件，并通过sftunnel将其流式传输到FMC（作为元数据），该进程负责传感器和FMC之间的加密通信。这是基于TCP的连接，因此事件流由FMC确认

您可以在[/ngfw]/var/log/messages文件中看到以下消息：

sfpreproc:OutputFile [INFO] *** Opening /ngfw/var/sf/detection_engines/77d31ce2-c2fc-11ea-b470-d428d53ed3ae/instance-1/unified_events-2.log.1597810478 for output" in /var/log/messages

EventHandler:SpoolIterator [INFO] Opened unified event file /var/sf/detection_engines/77d31ce2-c2fc-11ea-b470-d428d53ed3ae/instance-1/unified_events-2.log.1597810478

sftunneld:FileUtils [INFO] Processed 10334 events from log file var/sf/detection_engines/77d31ce2-c2fc-11ea-b470-d428d53ed3ae/instance-1/unified_events-2.log.1597810478

此输出提供以下信息：

Snort打开了unified_events文件以供输出（在其中写入）。
事件处理程序打开了同一个unified_events文件（从中读取）。
sftunnel报告了从该unified_events文件处理的事件数。

然后相应地更新书签文件。Sftunnel为高优先级事件和低优先级事件分别使用2个不同的信道，称为统一事件(UE)信道0和1。

使用FTD上的sfunnel_status CLI命令，您可以查看流式传输的事件数。

Priority UE Channel 1 service

TOTAL TRANSMITTED MESSAGES <530541> for UE Channel service
RECEIVED MESSAGES <424712> for UE Channel service
SEND MESSAGES <105829> for UE Channel service
FAILED MESSAGES <0> for UE Channel service
HALT REQUEST SEND COUNTER <17332> for UE Channel service
STORED MESSAGES for UE Channel service (service 0/peer 0)
STATE <Process messages> for UE Channel service
REQUESTED FOR REMOTE <Process messages> for UE Channel service
REQUESTED FROM REMOTE <Process messages> for UE Channel service

在FMC中，事件由SFDataCorrelator进程接收。

使用stats_unified.pl命令可以查看每个传感器处理的事件的状态：

admin@FMC:~$ sudo stats_unified.pl
Current Time - Fri Sep 9 23:00:47 UTC 2020

**********************************************************************************
* FTD - 60a0526e-6ddf-11ea-99fa-89a415c16717, version 6.6.0.1
**********************************************************************************
  Channel Backlog Statistics (unified_event_backlog)
    Chan    Last Time              Bookmark Time          Bytes Behind
       0    2020-09-09 23:00:30    2020-09-07 10:41:50               0
       1    2020-09-09 23:00:30    2020-09-09 22:14:58            6960

此命令显示每个通道特定设备的事件积压的状态，使用的通道ID与sftunnel相同。

Bytes Behind值可计算为统一事件书签文件中显示的位置与统一事件文件大小之间的差值，以及任何时间戳高于书签文件中的时间戳的后续文件。

SFDataCorrelator进程还存储性能统计信息，这些统计信息保存在/var/sf/rna/correlator-stats/中。每天创建一个文件，以CSV格式存储当日的性能统计信息。文件名称使用YYYY-MM-DD格式，对应当前日期的文件现在被调用。

统计信息每5分钟收集一次（每5分钟间隔有一行）。

可以使用perfstats命令读取此文件的输出。

注意：此命令也用于读取snort性能统计信息文件，因此必须使用适当的标志：

-C：指示perfstats输入是相关器统计文件（如果没有此标志，perfstats假设输入是snort性能统计文件）。

-q：安静模式，仅打印文件的摘要。

admin@FMC:~$ sudo perfstats -Cq < /var/sf/rna/correlator-stats/now 
287 statistics lines read

                 host limit:                         50000            0                50000
                 pcnt host limit in use:             100.01           100.00           100.55
                 rna events/second:                  1.22             0.00             48.65
                 user cpu time:                      1.56             0.11             58.20
                 system cpu time:                    1.31             0.00             41.13
                 memory usage:                       5050384          0                5138904
                 resident memory usage:              801920           0                901424
                 rna flows/second:                   64.06            0.00             348.15
                 rna dup flows/second:               0.00             0.00             37.05
                 ids alerts/second:                  1.49             0.00             4.63
                 ids packets/second:                 1.71             0.00             10.10
                 ids comm records/second:            3.24             0.00             12.63
                 ids extras/second:                  0.01             0.00             0.07
                 fw_stats/second:                    1.78             0.00             5.72
                 user logins/second:                 0.00             0.00             0.00
                 file events/second:                 0.00             0.00             3.25
                 malware events/second:              0.00             0.00             0.06
                 fireamp events/second:              0.00             0.00             0.00

摘要中的每一行都有3个按此顺序排列的值：Average、Minimum、Maximum。

如果打印时不带-q标志，则还会看到5分钟间隔值。总结如末所示。

注：每个FMC在其数据表中都有描述的最大流速。下表包含各个数据表中每个模块的值。

模型	FMC 750	FMC 1000	FMC 1600	FMC 2000	FMC 2500	FMC 2600	FMC 4000	FMC 4500	FMC 4600	FMCv	FMCv300
最大流速(fps)	2000	5000	5000	12000	12000	12000	20000	20000	20000	变量	12000

注意：这些值用于SFDataCorrelator统计信息输出中以粗体显示的所有事件类型的聚合。

如果查看输出并调整FMC的大小，以便您为最坏情况（当所有最大值同时发生时）做好准备，则此FMC看到的事件速率为48.65 + 348.15 + 4.63 + 3.25 + 0.06 = 404.74 fps。

可以将此总值与相应模型的数据表中的值进行比较。

SFDataCorrelator还可以对收到的事件（例如关联规则）进行其他处理，然后将它们存储在数据库中，然后查询该数据库以填充FMC图形用户界面(GUI)中的各种信息，例如控制面板和事件视图。

磁盘管理器

下一个逻辑图显示了运行状况监控器和磁盘管理器进程的逻辑组件，因为它们相互交织，以便生成与磁盘相关的运行状况警报。

流程图运行状况

简而言之，磁盘管理器进程管理该盒的磁盘使用情况，并且其配置文件位于[/ngfw]/etc/sf/文件夹中。在某些情况下，可使用磁盘管理器进程的多个配置文件：

diskmanager.conf -标准配置文件。
diskmanager_2hd.conf -在机箱中安装了2个硬盘时使用。第二个硬盘驱动器与恶意软件扩展相关，用于存储文件策略中定义的文件。
ramdisk-diskmanager.conf -在启用记录到Ramdisk时使用。有关详细信息，请检查Log to Ramdisk部分。

磁盘管理器监控的每种类型的文件都分配有一个思洛存储器。根据系统上可用的磁盘空间量，磁盘管理器会为每个思洛存储器计算一个高水位标记(HWM)和一个低水位标记(LWM)。

当磁盘管理器进程耗尽思洛存储器时，它一直耗尽到到达LWM的位置。由于每个文件都会耗尽事件，因此可以超过此阈值。

要检查传感器设备上孤岛的状态，您可以使用以下命令：

> show disk-manager
Silo                                    Used        Minimum     Maximum
misc_fdm_logs                           0 KB        65.208 MB   130.417 MB
Temporary Files                         0 KB        108.681 MB  434.726 MB
Action Queue Results                    0 KB        108.681 MB  434.726 MB
User Identity Events                    0 KB        108.681 MB  434.726 MB
UI Caches                               4 KB        326.044 MB  652.089 MB
Backups                                 0 KB        869.452 MB  2.123 GB
Updates                                 304.367 MB  1.274 GB    3.184 GB
Other Detection Engine                  0 KB        652.089 MB  1.274 GB
Performance Statistics                  45.985 MB   217.362 MB  2.547 GB
Other Events                            0 KB        434.726 MB  869.452 MB
IP Reputation & URL Filtering           0 KB        543.407 MB  1.061 GB
arch_debug_file                         0 KB        2.123 GB    12.736 GB
Archives & Cores & File Logs            0 KB        869.452 MB  4.245 GB
Unified Low Priority Events             974.109 MB  1.061 GB    5.307 GB
RNA Events                              879 KB      869.452 MB  3.396 GB
File Capture                            0 KB        2.123 GB    4.245 GB
Unified High Priority Events            252 KB      3.184 GB    7.429 GB
IPS Events                              3.023 MB    2.547 GB    6.368 GB

满足以下条件之一时，运行磁盘管理器进程：

进程开始（或重新启动）
思洛存储器到达HWM
手动清空思洛存储器
每小时一次

每次运行磁盘管理器进程时，它都会在其自己的日志文件中为每个不同的孤岛生成一个条目，该日志文件位于[/ngfw]/var/log/diskmanager.log下，并且具有CSV格式的数据。

接下来，显示了diskmanager.log文件中的示例行。它来自触发从统一低优先级事件运行状况警报中排出未处理事件的传感器，以及各个列的细分：

priority_2_events,1599668981,221,4587929508,1132501868,20972020,4596,1586044534,5710966962,1142193392,110,0

列	价值
思洛存储器标签	priority_2_event
排出时间（纪元时间）	1599668981
已耗尽的文件数	221
已耗尽的字节数	4587929508
排出后数据的当前大小（字节）	1132501868
已耗尽的最大文件（字节）	20972020
已耗尽的最小文件（字节）	4596
最旧的文件已耗尽（纪元时间）	1586044534
高水位线（字节）	5710966962
低水位线（字节）	1142193392
未处理事件已耗尽的文件数	110
Diskmanager状态标志	0

然后，相应的运行状况监视器模块读取此信息，以触发相关的运行状况警报。

手动清空思洛存储器

在某些情况下，您可以手动清空思洛存储器。例如，使用手动思洛存储器清空磁盘空间，而不是手动删除文件，其优点是允许磁盘管理器决定保留和删除哪些文件。磁盘管理器保留该思洛存储器的最新文件。

所有思洛存储器都可以清空，如前所述（磁盘管理器会清空数据，直到数据量低于LWM阈值）。FTD CLISH模式中提供system support silo-drain命令，该命令提供可用思洛存储器（名称+数字ID）的列表。

下面是手动清空Unified Low Priority Events接收器的一个示例：

> show disk-manager
Silo                                    Used        Minimum     Maximum
misc_fdm_logs                           0 KB        65.213 MB   130.426 MB
Temporary Files                         0 KB        108.688 MB  434.753 MB
Action Queue Results                    0 KB        108.688 MB  434.753 MB
User Identity Events                    0 KB        108.688 MB  434.753 MB
UI Caches                               4 KB        326.064 MB  652.130 MB
Backups                                 0 KB        869.507 MB  2.123 GB
Updates                                 304.367 MB  1.274 GB    3.184 GB
Other Detection Engine                  0 KB        652.130 MB  1.274 GB
Performance Statistics                  1.002 MB    217.376 MB  2.547 GB
Other Events                            0 KB        434.753 MB  869.507 MB
IP Reputation & URL Filtering           0 KB        543.441 MB  1.061 GB
arch_debug_file                         0 KB        2.123 GB    12.737 GB
Archives & Cores & File Logs            0 KB        869.507 MB  4.246 GB
Unified Low Priority Events             2.397 GB    1.061 GB    5.307 GB
RNA Events                              8 KB        869.507 MB  3.397 GB
File Capture                            0 KB        2.123 GB    4.246 GB
Unified High Priority Events            0 KB        3.184 GB    7.430 GB
IPS Events                              0 KB        2.547 GB    6.368 GB

> system support silo-drain
Available Silos
  1 - misc_fdm_logs
  2 - Temporary Files
  3 - Action Queue Results
  4 - User Identity Events
  5 - UI Caches
  6 - Backups
  7 - Updates
  8 - Other Detection Engine
  9 - Performance Statistics
 10 - Other Events
 11 - IP Reputation & URL Filtering
 12 - arch_debug_file
 13 - Archives & Cores & File Logs
 14 - Unified Low Priority Events
 15 - RNA Events
 16 - File Capture
 17 - Unified High Priority Events
 18 - IPS Events
  0 - Cancel and return

Select a Silo to drain: 14
Silo Unified Low Priority Events being drained.

> show disk-manager
Silo                                    Used        Minimum     Maximum
misc_fdm_logs                           0 KB        65.213 MB   130.426 MB
Temporary Files                         0 KB        108.688 MB  434.753 MB
Action Queue Results                    0 KB        108.688 MB  434.753 MB
User Identity Events                    0 KB        108.688 MB  434.753 MB
UI Caches                               4 KB        326.064 MB  652.130 MB
Backups                                 0 KB        869.507 MB  2.123 GB
Updates                                 304.367 MB  1.274 GB    3.184 GB
Other Detection Engine                  0 KB        652.130 MB  1.274 GB
Performance Statistics                  1.002 MB    217.376 MB  2.547 GB
Other Events                            0 KB        434.753 MB  869.507 MB
IP Reputation & URL Filtering           0 KB        543.441 MB  1.061 GB
arch_debug_file                         0 KB        2.123 GB    12.737 GB
Archives & Cores & File Logs            0 KB        869.507 MB  4.246 GB
Unified Low Priority Events             1.046 GB    1.061 GB    5.307 GB
RNA Events                              8 KB        869.507 MB  3.397 GB
File Capture                            0 KB        2.123 GB    4.246 GB
Unified High Priority Events            0 KB        3.184 GB    7.430 GB
IPS Events                              0 KB        2.547 GB    6.368 GB

运行状况监视器

以下是要点：

在FMC上“运行状况监视器”(Health Monitor)菜单或“消息中心”(Message Center)的“运行状况”(Health)选项卡下看到的任何运行状况警报均由运行状况监视器进程生成。
此过程可监控FMC和受管传感器的系统运行状况，由多个不同的模块组成。
可以在每个设备上附加的运行状况策略中定义运行状况警报模块。
运行状况警报由Disk Usage模块生成，该模块可在FMC管理的每个传感器上运行。
当FMC上的运行状况监视器进程运行时（每5分钟一次或触发手动运行时），磁盘使用模块会查看diskmanager.log文件，如果满足正确条件，则会触发相应的运行状况警报。

要触发Drain of Unprocessed events运行状况警报，必须满足以下所有条件：

已耗尽的字节数字段大于0（这表示此思洛存储器中的数据已耗尽）。
未处理事件已耗尽大于0的文件数（这表示已耗尽的数据中存在未处理事件）。
排水时间在最近1小时内。

要触发频繁排出事件，运行状况警报必须满足以下条件：

diskmanager.log文件的最后2个条目需要：
- Have Bytes drawed字段大于0（这表示来自此思洛存储器的数据已耗尽）。
- 间隔时间少于5分钟。
此思洛存储器最后一个条目的耗尽时间是在过去1小时内。

从磁盘使用模块收集的结果（以及其他模块收集的结果）通过sftunnel发送到FMC。您可以使用sftunnel_status命令查看通过sftunnel交换的运行状况事件的计数器：

TOTAL TRANSMITTED MESSAGES <3544> for Health Events service
RECEIVED MESSAGES <1772> for Health Events service
SEND MESSAGES <1772> for Health Events service
FAILED MESSAGES <0> for Health Events service
HALT REQUEST SEND COUNTER <0> for Health Events service
STORED MESSAGES for Health service (service 0/peer 0)
STATE <Process messages> for Health Events service
REQUESTED FOR REMOTE <Process messages> for Health Events service
REQUESTED FROM REMOTE <Process messages> for Health Events service

记录到Ramdisk

即使大多数事件存储在磁盘中，设备也会默认配置为记录到ramdisk中，以防止不断向磁盘写入和删除事件导致SSD逐渐损坏。

在此场景中，事件不存储在[/ngfw]/var/sf/detection_engine/*/instance-N/下，但它们位于[/ngfw]/var/sf/detection_engines/*/instance-N/connection/中，后者是指向/dev/shm/instance-N/connection的符号链接。在这种情况下，事件驻留在虚拟内存中，而不是物理内存中。

admin@FTD4140:~$ ls -la /ngfw/var/sf/detection_engines/b0c4a5a4-de25-11ea-8ec3-4df4ea7207e3/instance-1/connection
lrwxrwxrwx 1 sfsnort sfsnort 30 Sep  9 19:03 /ngfw/var/sf/detection_engines/b0c4a5a4-de25-11ea-8ec3-4df4ea7207e3/instance-1/connection -> /dev/shm/instance-1/connection

要验证设备当前配置为执行什么操作，请从FTD CLISH运行命令show log-events-to-ramdisk。如果使用命令configure log-events-to-ramdisk <enable/disable>：，

> show log-events-to-ramdisk
Logging connection events to RAM Disk. 

> configure log-events-to-ramdisk  
Enable or Disable  enable or disable (enable/disable)

警告：当执行configure log-events-to-ramdisk disable命令时，需要在FTD上完成两个部署，以便snort不会停滞在D状态（不间断睡眠），这将导致流量中断。
思科漏洞ID为CSCvz53372的缺陷中记录了此行为。在第一个部署中，会跳过snort内存阶段的重新评估，这会导致snort进入D状态。解决方法是使用任何虚拟更改执行其他部署。

当您登录ramdisk时，主要缺点是各个思洛存储器分配了较小的空间，因此在相同的情况下会更频繁地耗尽空间。下一个输出是FPR 4140的磁盘管理器，其中启用了ramdisk的日志事件和不启用日志事件进行比较。

Log to Ramdisk enabled.（登录到Ramdisk已启用。）

> show disk-manager
Silo                                    Used        Minimum     Maximum
Temporary Files                         0 KB        903.803 MB  3.530 GB
Action Queue Results                    0 KB        903.803 MB  3.530 GB
User Identity Events                    0 KB        903.803 MB  3.530 GB
UI Caches                               4 KB        2.648 GB    5.296 GB
Backups                                 0 KB        7.061 GB    17.652 GB
Updates                                 305.723 MB  10.591 GB   26.479 GB
Other Detection Engine                  0 KB        5.296 GB    10.591 GB
Performance Statistics                  19.616 MB   1.765 GB    21.183 GB
Other Events                            0 KB        3.530 GB    7.061 GB
IP Reputation & URL Filtering           0 KB        4.413 GB    8.826 GB
arch_debug_file                         0 KB        17.652 GB   105.914 GB
Archives & Cores & File Logs            0 KB        7.061 GB    35.305 GB
RNA Events                              0 KB        7.061 GB    28.244 GB
File Capture                            0 KB        17.652 GB   35.305 GB
Unified High Priority Events            0 KB        17.652 GB   30.892 GB
Connection Events                       0 KB        451.698 MB  903.396 MB
IPS Events                              0 KB        12.357 GB   26.479 GB

已禁用记录到Ramdisk。

> show disk-manager
Silo                                    Used        Minimum     Maximum
Temporary Files                         0 KB        976.564 MB  3.815 GB
Action Queue Results                    0 KB        976.564 MB  3.815 GB
User Identity Events                    0 KB        976.564 MB  3.815 GB
UI Caches                               4 KB        2.861 GB    5.722 GB
Backups                                 0 KB        7.629 GB    19.074 GB
Updates                                 305.723 MB  11.444 GB   28.610 GB
Other Detection Engine                  0 KB        5.722 GB    11.444 GB
Performance Statistics                  19.616 MB   1.907 GB    22.888 GB
Other Events                            0 KB        3.815 GB    7.629 GB
IP Reputation & URL Filtering           0 KB        4.768 GB    9.537 GB
arch_debug_file                         0 KB        19.074 GB   114.441 GB
Archives & Cores & File Logs            0 KB        7.629 GB    38.147 GB
Unified Low Priority Events             0 KB        9.537 GB    47.684 GB
RNA Events                              0 KB        7.629 GB    30.518 GB
File Capture                            0 KB        19.074 GB   38.147 GB
Unified High Priority Events            0 KB        19.074 GB   33.379 GB
IPS Events                              0 KB        13.351 GB   28.610 GB

由于思洛存储器尺寸较小，因此访问事件并将其流传输到FMC的速度也较高。尽管在适当的条件下这是更好的选择，但必须考虑它的缺点。

常见问题解答 (FAQ)

Drain of Events运行状况警报是否仅由Connection Events生成？

不能。

Frequent Drain警报可由任何磁盘管理器思洛存储器生成。
任何与事件相关的思洛存储器均可生成未处理事件排出的警报。

连接事件是最常见的罪魁祸首。

当看到Frequent Drain运行状况警报时，是否始终建议禁用Log to Ramdisk？

否。仅在日志记录过多（DOS/DDOS除外）的情况下，当受影响的思洛存储器是连接事件思洛存储器时，且仅在无法进一步调整日志记录设置的情况下。

如果DOS/DDOS导致日志记录过多，解决方案是实施DOS/DDOS保护或消除DOS/DDOS攻击的来源。

Log to Ramdisk的默认功能可减少SSD磨损，因此强烈建议使用它。

什么是未处理的事件？

事件不会单独标记为未处理。在下列情况下，文件具有未处理的事件：

其创建时间戳高于各个书签文件中的时间戳字段。

或

其创建时间戳等于各个书签文件中的时间戳字段，并且其大小高于各个书签文件上的字节字段中的位置。

FMC如何知道特定传感器的滞后字节数？

传感器发送有关unified_events文件名和大小的元数据以及有关书签文件的信息，为FMC提供足够的信息来计算后面的字节如下：

当前unified_events文件大小-来自书签文件的字节字段中的位置+时间戳高于相应书签文件中的时间戳的所有unified_events文件的大小。

已知问题

打开Bug Search Tool并使用此查询：

FMC配置

修订历史记录

版本	发布日期	备注
3.0	03-May-2024	更新的简介、PII、备用文本、机器翻译、链接目标和格式。
1.0	25-Sep-2020	初始版本

由思科工程师提供

若昂·德尔加多
思科TAC工程师
米基斯·扎菲鲁迪斯
思科TAC工程师

此文档是否有帮助?

反馈

联系我们

提交支持案例
(需要思科服务合同)

排除FMC未处理事件的排放和频繁的排放事件运行状况监视器警报

下载选项

非歧视性语言

关于此翻译

目录

简介

问题概述

常见故障排除场景

例 1.日志记录过多

推荐的操作

案例 2.传感器与FMC之间通信信道的瓶颈

推荐的操作

案例 3.SFDataCorrelator进程中的一个瓶颈

推荐的操作

在联系思科技术支持中心(TAC)之前要收集的项目

深入了解

事件处理

磁盘管理器

手动清空思洛存储器

运行状况监视器

记录到Ramdisk

常见问题解答 (FAQ)

已知问题

修订历史记录

由思科工程师提供

此文档是否有帮助?

联系我们

本文档适用于以下产品