Introdução
Este documento descreve a disponibilidade geral do Index Document Match (IDM).
Overview
O IDM é uma técnica avançada de classificação de dados DLP que aprimora significativamente a capacidade da organização de proteger com eficiência documentos que contêm dados confidenciais.
Com o IDM, as organizações podem indexar e criar impressões digitais do conteúdo de documentos que contêm seus dados confidenciais. Ao criar um repositório de impressões digitais desses dados, nosso produto Data Loss Prevention (DLP) pode identificar com eficiência documentos completos ou parcialmente correspondentes durante a avaliação do conteúdo.
A vantagem do IDM sobre a correspondência de padrões tradicional usando expressões regulares e palavras-chave é significativa. Em vez de comparar com qualquer coisa que possa parecer dados confidenciais, o IDM permite que você compare com os dados confidenciais reais. Essa abordagem direcionada reduz o número de incidentes de DLP de baixa importância e permite que as empresas concentrem suas operações e recursos de segurança em investigações de alto valor.
Em que o IDM difere do EDM?
O IDM (Indexed Document Match, correspondência de documentos indexados) e o EDM (Exact Document Match, correspondência de documentos exatos) diferem em termos do tipo de dados que eles digitam.
O EDM concentra-se especificamente em dados tabulares de impressão digital, que são dados estruturados organizados em um formato de tabela. Isso significa que o EDM foi projetado para lidar com dados com uma estrutura específica, como bancos de dados ou planilhas. Por exemplo, uma empresa pode usar o EDM para criar a impressão digital de uma tabela de cartões de crédito corporativos, garantindo que somente esses cartões de crédito corporativos sejam monitorados e protegidos.
Por outro lado, o IDM é usado para indexação e impressão digital de documentos em formato livre, que são dados não estruturados que não usam um formato específico. O IDM é capaz de processar e imprimir impressões digitais de documentos que não estão organizados em uma estrutura semelhante a uma tabela, como arquivos de texto, PDFs ou documentos do Word.
Em resumo, o IDM é usado para a impressão digital de dados não estruturados, enquanto o EDM é usado para a impressão digital de dados estruturados.
Quais são os casos de uso comuns para usar o IDM?
Alguns cenários comuns incluem impressão digital e proteção da propriedade intelectual, como repositórios de código-fonte, registros de patentes ou informações corporativas confidenciais, como formulários de funcionários de RH, documentos corporativos e documentos legais.
O IDM gera impressões digitais com base no arquivo ou em seu conteúdo textual?
O IDM indexa e cria impressões digitais do conteúdo textual do documento, em vez do próprio arquivo. Isso permite que o IDM faça uma correspondência parcial com o conteúdo avaliado, mesmo que alguns dos dados confidenciais sejam copiados e colados em um novo arquivo. Você tem a flexibilidade de especificar a extensão da correspondência necessária para disparar uma violação, selecionando a partir de uma lista predefinida de opções (20%, 60%, 80%).
Como usar o IDM?
O Indexed Document Match (IDM) no Umbrella opera gerando impressões digitais de hash do texto extraído de documentos confidenciais. Essas impressões digitais são usadas pelas várias digitalizações do DLP multimodo para identificar total ou parcialmente o conteúdo dos documentos. Para gerar essas impressões digitais, você precisa baixar e usar a ferramenta Indexador DLP da Cisco localmente.
O indexador, uma interface de linha de comando, extrai texto dos documentos, executa operações de impressão digital e indexação e, em seguida, mistura o texto indexado. Posteriormente, a ferramenta carrega as impressões digitais com hash no Umbrella ou no Secure Access.
A saída do uso da ferramenta de indexação é um novo tipo de identificador de dados do IDM a ser usado na classificação de dados personalizada. Essas classificações são aplicadas com regras de DLP em tempo real e regras de DLP de API de SaaS para proteger com eficiência os dados inativos e os dados em movimento.
20327456127636
A ferramenta Indexador de DLP pode ser agendada para fazer a impressão digital de novos dados periodicamente?
A ferramenta Indexador pode ser executada no modo de monitor como um processo de segundo plano. Esse modo permite que o indexador DLP reindexe automaticamente em intervalos regulares, garantindo que os dados de origem sejam atualizados regularmente no Umbrella sem a necessidade de operação manual.
Onde acessar o IDM e baixar a ferramenta Indexador DLP?
- Faça login no painel do Umbrella.
- Navegue até Policies > Policy Components > Data Classification > Data Classification.
- Clique na guia Correspondência de Documento Indexado.
- Nesta seção, você pode criar Identificadores IDM e baixar o Indexador DLP.
Quais tipos de arquivo são compatíveis com o IDM?
O IDM oferece suporte a todos os tipos de arquivos suportados pelo DLP. Você pode encontrar a lista abrangente de tipos de arquivos suportados na documentação. Vale mencionar que o IDM também suporta caracteres Unicode.
Que limitações devem ser levadas em consideração ao usar o IDM?
A quantidade total de texto indexado para todos os identificadores de dados IDM em uma organização não deve exceder 1 GB. A guia Correspondências de documentos indexados na página Classificação de dados exibe avisos quando a cota alocada é atingida.
Onde posso encontrar mais informações?
Documentação do Umbrella