Inleiding
In dit document wordt beschreven hoe u het beschikbare geheugen voor de DLP Exact Data Matching Indexer kunt vergroten om te werken met grote gegevensbronnen in Cisco Umbrella.
Voorwaarden
Vereisten
Er zijn geen specifieke vereisten van toepassing op dit document.
Gebruikte componenten
De informatie in dit document is gebaseerd op Cisco Umbrella.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Overzicht
De Exact Data Match Indexer is onderdeel van de Exact Data Match functie in Umbrella DLP. De tool indexeert een klantgegevensbron (CSV-bestand) en genereert vingerafdrukken van kritische records die naar Umbrella worden geüpload voor gebruik in DLP-beleid. In dit artikel wordt uitgelegd hoe u het beschikbare geheugen voor de indexeerder kunt vergroten om met grote gegevensbronnen te werken.
Probleem
Wanneer een grote gegevensbron (CSV-bestand) wordt geïndexeerd, wordt deze fout weergegeven:
ERROR: Out of heap space; please rerun with an increased size (-Xmx).
Oplossing
Voer het indexeringsgereedschap uit met Xmx-
specificatie van de hoeveelheid geheugen die aan het indexeringsgereedschap moet worden toegewezen. De geheugentoewijzing kan worden gespecificeerd in mebibytes (m) of gibibytes (g). Voorbeeld:
-XMX1000m
= 1000 mebibyte (1024 megabyte)
-XMX1g
= 1 gigabyte (1074 megabyte)
Het vereiste geheugen is afhankelijk van de bestandsgrootte van het bronbestand (CSV-bestand). Umbrella raadt aan om minstens twee keer zoveel geheugen toe te wijzen als het CSV-bronbestand.
Als de brongegevens bijvoorbeeld 512 MB zijn, kan het geheugen als volgt worden toegewezen:
java -X1g -jar edm-indexer.jar -i source_file.csv -e template-id
Als de tool op een geautomatiseerde manier wordt uitgevoerd, moet de geheugentoewijzing worden verhoogd om rekening te houden met wijzigingen in de grootte van de brongegevens.