简介
本文档介绍如何增加DLP精确数据匹配索引器的可用内存,以在Cisco Umbrella中处理大型数据源。
先决条件
要求
本文档没有任何特定的要求。
使用的组件
本文档中的信息基于Cisco Umbrella。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
概述
Exact Data Match Indexer是Umbrella DLP中的Exact Data Match功能的一部分。 该工具为客户数据源(CSV文件)编制索引,并生成关键记录的指纹,这些指纹将上传到Umbrella以用于DLP策略。本文解释如何增加索引器处理大型数据源的可用内存。
问题
当为大型数据源(CSV文件)编制索引时,将显示以下错误:
ERROR: Out of heap space; please rerun with an increased size (-Xmx).
解决方案
运行-Xmx
索引工具,指定分配给索引工具的内存量。 内存分配可以用兆字节(m)或千兆字节(g)来指定。 例如:
-Xmx1000m
= 1000兆字节(1024兆字节)
-Xmx1g
= 1千兆字节(1074兆字节)
所需的内存取决于源文件(CSV文件)的文件大小。 Umbrella建议分配的内存至少是源CSV文件大小的两倍。
例如,如果源数据为512 MB,内存可以按如下方式分配:
java -X1g -jar edm-indexer.jar -i source_file.csv -e template-id
如果该工具以自动方式运行,则必须增加内存分配以考虑源数据大小的更改。