O conjunto de documentação deste produto faz o possível para usar uma linguagem imparcial. Para os fins deste conjunto de documentação, a imparcialidade é definida como uma linguagem que não implica em discriminação baseada em idade, deficiência, gênero, identidade racial, identidade étnica, orientação sexual, status socioeconômico e interseccionalidade. Pode haver exceções na documentação devido à linguagem codificada nas interfaces de usuário do software do produto, linguagem usada com base na documentação de RFP ou linguagem usada por um produto de terceiros referenciado. Saiba mais sobre como a Cisco está usando a linguagem inclusiva.
A Cisco traduziu este documento com a ajuda de tecnologias de tradução automática e humana para oferecer conteúdo de suporte aos seus usuários no seu próprio idioma, independentemente da localização. Observe que mesmo a melhor tradução automática não será tão precisa quanto as realizadas por um tradutor profissional. A Cisco Systems, Inc. não se responsabiliza pela precisão destas traduções e recomenda que o documento original em inglês (link fornecido) seja sempre consultado.
Este documento descreve diferentes tipos de erros de disco, como classificá-los e ferramentas que você pode usar para identificá-los.
Não existem requisitos específicos para este documento.
As informações neste documento são baseadas em discos rígidos no Unified Computing System (UCS).
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
O documento também descreve a função do controlador da unidade de disco rígido (HDD) e da matriz redundante de discos independentes (RAID) quando você identifica erros médios nas unidades.
Note: Erros médios também são conhecidos como erros de mídia
O que causa erros de mídia de disco rígido?
A causa mais comum de erros médios é uma amplitude de sinal ruim que resulta em
Como o HDD detecta o erro médio?
Etapa 1.O disco rígido executa periodicamente verificações de mídia em segundo plano para detectar erros.
Etapa 2. O disco rígido tenta ler a mídia e, por algum motivo, não consegue recuperar os dados gravados.
Etapa 3. Quando o HDD não consegue recuperar os dados gravados, ele chama o código de recuperação do HDD, que tentará várias etapas de recuperação de erros para ler os dados da mídia com êxito.
Etapa 4. Se todas as etapas de recuperação falharem, a unidade gerará um erro 03/11/0x de volta para o host e os LBAs serão colocados na lista de defeitos pendentes.
Como o controlador Raid detecta erros médios?
Quando o sistema operacional (SO) vê erros médios?
Enquanto uma unidade está em operação, a cabeça pode se deparar com um setor com um nível de leitura magnética enfraquecido. Os dados ainda podem ser lidos, mas podem cair abaixo do limite preferencial para níveis de leitura de setor qualificados. Esse drive de disco consideraria esse setor um setor que poderia e substituiria esses dados por um novo local disponível na lista de reserva em boas condições. Quando os dados são movidos, o endereço do setor antigo é adicionado à lista defeitos de crescimento, para nunca mais ser usado. Este processo é um erro de mídia recuperável. A unidade acionará o SMART quando a maioria de seus setores sobressalentes em boas condições for esgotada.
Nota:A LSI (Latent Semantic Indexing) recomenda que você deixe a frequência de leitura de patrulha e outras configurações de leitura de patrulha nos valores padrão para alcançar o melhor desempenho do sistema. Se decidir alterar os valores, registre o valor padrão original aqui para que você possa restaurá-los posteriormente.
Observação: a leitura de unidades "Patrol" não informa o progresso enquanto é executada. O status de leitura da patrulha é informado somente no registro de eventos.
As opções de leitura de unidades "Patrol" são mostradas na imagem:
Exemplos de MegaCli
Para ver informações sobre o estado de leitura da patrulha e o atraso entre execuções de leitura da patrulha:
# MegaCli64 -AdpPR -Info -ALL
Para descobrir a taxa de leitura de patrulha atual, execute:
# MegaCli64 -AdpGetProp PatrolReadRate -aALL
Para desativar a leitura de patrulha automática:
# MegaCli64 -AdpPR -Dsbl -aALL
Para ativar a patrulha automática, leia:
#MegaCli64 -AdpPR -EnblAuto -aALL
Para iniciar uma análise de leitura de patrulha manual:
# MegaCli64 -AdpPR -Start -aALL
Para parar uma análise de leitura de patrulha:
# MegaCli64 -AdpPR -Stop -aALL
Note: É recomendável executar uma verificação de consistência pelo menos uma vez por mês.
As opções de gerenciamento de verificação de consistência são mostradas na imagem:
As opções de agendamento de verificação de consistência são como mostrado na imagem:
Exemplos de MegaCli
Para ver a próxima hora agendada da Verificação de consistência:
#MegaCli64 -AdpCcSched -Info -ALL
Para alterar o tempo de verificação de consistência agendado:
#MegaCli64 -AdpCCSched -SetSTartTime 20171028 02 -aALL
Para desativar a verificação de consistência:
#MegaCli64 -AdpCcSched -Dsbl -aALL