Introduzione
In questo documento viene descritta la disponibilità generale di IDM (Index Document Match).
Panoramica
L'IDM è una tecnica avanzata di classificazione dei dati DLP che migliora in modo significativo la capacità dell'organizzazione di proteggere efficacemente i documenti contenenti dati sensibili.
Con IDM, le organizzazioni possono indicizzare e imprimere il contenuto dei documenti che contengono i dati riservati. Creando un archivio di impronte digitali di questi dati, il nostro prodotto DLP (Data Loss Prevention) è in grado di identificare in modo efficiente i documenti che corrispondono completamente o parzialmente durante la valutazione dei contenuti.
Il vantaggio dell'IDM rispetto alla corrispondenza dei pattern tradizionale tramite espressioni regolari e parole chiave è significativo. Anziché confrontare i dati con quelli che possono sembrare dati sensibili, IDM consente di eseguire la corrispondenza con i dati sensibili effettivi. Questo approccio mirato riduce il numero di incidenti DLP di scarsa importanza e consente alle organizzazioni di concentrare le operazioni e le risorse di sicurezza su indagini di alto valore.
Quali sono le differenze tra la gestione intelligente dei dati (IDM) ed EDM?
IDM (Indexed Document Match) ed EDM (Exact Document Match) differiscono in termini di tipo di dati che immettono.
EDM si concentra in particolare sui dati tabulari fingerprinting, ovvero dati strutturati organizzati in formato tabellare. Questo significa che EDM è progettato per gestire i dati con una struttura specifica, ad esempio database o fogli di calcolo. Ad esempio, un'organizzazione può utilizzare l'EDM per eseguire l'impronta digitale di una tabella di carte di credito aziendali, garantendo il monitoraggio e la protezione solo di tali carte.
D'altra parte, IDM viene utilizzato per l'indicizzazione e il rilevamento delle impronte digitali dei documenti in formato libero, ovvero dati non strutturati che non utilizzano un formato specifico. IDM è in grado di elaborare e rilevare le impronte digitali di documenti non organizzati in una struttura simile a una tabella, ad esempio file di testo, PDF o documenti di Word.
In sintesi, IDM viene utilizzato per il fingerprinting dei dati non strutturati, mentre EDM viene utilizzato per il fingerprinting dei dati strutturati.
Quali sono i casi di utilizzo più comuni per l'utilizzo di IDM?
Alcuni scenari comuni includono la rilevazione delle impronte digitali e la tutela della proprietà intellettuale, come archivi di codici sorgente, documenti di brevetto o informazioni aziendali sensibili come i moduli dei dipendenti HR, documenti aziendali e documenti legali.
IDM genera impronte digitali in base al file o al suo contenuto testuale?
IDM indicizza e impronta il contenuto testuale del documento anziché il file stesso. Ciò consente a IDM di eseguire una corrispondenza parziale con il contenuto valutato, anche se alcuni dei dati sensibili vengono copiati e incollati in un nuovo file. È possibile specificare l'entità della corrispondenza necessaria per attivare una violazione selezionando una delle opzioni predefinite (20%, 60%, 80%).
Come utilizzare IDM?
L'IDM (Indexed Document Match) in Umbrella funziona generando impronte digitali hash del testo estratto da documenti sensibili. Queste impronte digitali vengono quindi utilizzate dalle varie scansioni di DLP in modalità multipla per identificare completamente o parzialmente il contenuto dei documenti. Per generare queste impronte digitali, è necessario scaricare e utilizzare localmente lo strumento Cisco DLP Indexer.
L'indicizzatore, un'interfaccia della riga di comando, estrae il testo dai documenti, esegue operazioni di impronta digitale e indicizzazione e quindi esegue l'hash del testo indicizzato. Lo strumento successivamente carica le impronte digitali hash in Umbrella o Secure Access.
L'output dell'utilizzo dello strumento di indicizzazione è un nuovo tipo di identificatore dati IDM da utilizzare nella classificazione dati personalizzata. Queste classificazioni vengono applicate sia alle regole di prevenzione della perdita dei dati in tempo reale che alle regole di prevenzione della perdita dei dati dell'API SaaS per proteggere efficacemente sia i dati inattivi che i dati in movimento.
20327456127636
È possibile pianificare lo strumento di indicizzazione DLP in modo che impronte periodicamente i nuovi dati?
Lo strumento Indicizzatore può essere eseguito in modalità monitor come processo in background. Questa modalità consente all'indicizzatore di DLP di eseguire automaticamente la reindicizzazione a intervalli regolari, garantendo che i dati di origine vengano regolarmente aggiornati in Umbrella senza la necessità di operazioni manuali.
Dove accedere a IDM e scaricare lo strumento di indicizzazione DLP?
- Accedere al dashboard Umbrella.
- Passare a Criteri > Componenti dei criteri > Classificazione dati > Classificazione dati.
- Fare clic sulla scheda Corrispondenza documento indicizzato.
- In questa sezione è possibile creare gli identificatori IDM e scaricare l'indicizzatore di prevenzione della perdita dei dati.
Quali tipi di file sono compatibili con IDM?
IDM supporta tutti i tipi di file supportati da DLP. L'elenco completo dei tipi di file supportati è disponibile nella documentazione. È opportuno ricordare che IDM supporta anche i caratteri Unicode.
Quali limitazioni è necessario prendere in considerazione quando si utilizza la gestione intelligente dei dati?
La quantità totale di testo indicizzato per tutti gli identificatori di dati IDM in un'organizzazione non deve superare 1 GB. Nella scheda Corrispondenze documento indicizzato della pagina Classificazione dati vengono visualizzati avvisi quando viene raggiunta la quota assegnata.
Dove è possibile trovare ulteriori informazioni?
Documentazione Umbrella