はじめに
このドキュメントでは、Cisco Umbrellaの大規模なデータソースでDLP Exact Data Matching Indexerを使用するために使用可能なメモリを増やす方法について説明します。
前提条件
要件
このドキュメントに関する固有の要件はありません。
使用するコンポーネント
このドキュメントの情報は、Cisco Umbrellaに基づくものです。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
概要
Exact Data Match Indexerは、Umbrella DLPのExact Data Match機能の一部です。このツールは、カスタマーデータソース(CSVファイル)にインデックスを作成し、DLPポリシーで使用するためにUmbrellaにアップロードされる重要なレコードのフィンガープリントを生成します。この記事では、インデクサが大規模なデータソースで使用できるように使用可能なメモリを増やす方法について説明します。
問題
大きなデータソース(CSVファイル)のインデックスを作成すると、次のエラーが表示されます。
ERROR: Out of heap space; please rerun with an increased size (-Xmx).
解決方法
インデックスツールに割り当てるメモリの量を指定して、-Xmx
を使用してインデックスツールを実行します。 メモリの割り当ては、メビバイト(m)またはギビバイト(g)で指定できます。 例:
-Xmx1000m
= 1000メガバイト(1024メガバイト)
-Xmx1g
= 1ギビバイト(1074メガバイト)
必要なメモリは、ソースファイル(CSVファイル)のファイルサイズによって異なります。 Umbrellaでは、メモリをソースCSVファイルの少なくとも2倍のサイズに割り当てることを推奨しています。
たとえば、ソースデータが512 MBの場合、メモリは次のように割り当てることができます。
java -X1g -jar edm-indexer.jar -i source_file.csv -e template-id
ツールを自動的に実行する場合は、ソースデータサイズの変更に合わせてメモリの割り当てを増やす必要があります。