Isilon: Notificação de evento: A partição var está próxima de sua capacidade, ID do evento: 100010001

Summary: Este artigo discute como limpar a partição Var à medida que ela se aproxima da capacidade.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Evento
Uma das seguintes notificações de evento é emitida:

The /var partition is near capacity (95% used)

The /var partition is near capacity (85% used)

The /var partition is near capacity (75% used)

Detalhes
Quando a partição /var atinge 75%, 85% ou 95% da capacidade, um evento é registrado e um alerta é enviado.

Cause

A pasta /var contém vários registros, arquivos de diagnóstico, dados de configuração e arquivos temporários para várias funções do cluster. Com o passar do tempo, vários arquivos extras podem se acumular na pasta /var e fazer com que ela se encha.

/var/log/wtmp Arquivos e os arquivos de substituição /var/log/wtmp.0/var/log/wtmp.1, por exemplo, aumente de tamanho para mais de 10 MB. Às vezes, eles aumentam para 150 MB. O comando /var/log/wtmp Arquivo é um arquivo de log binário que registra dados de log-in e log-off. O arquivo do gerenciador de logs, /etc/newsyslog.conf, não arquiva da mesma forma que faz com outros arquivos de log para que o /var/log/wtmp Pode aumentar e preencher o diretório /var.

Resolution

Nota: Devido à responsabilidade, o suporte do Isilon aconselha o usuário a realizar as ações de mover/excluir dados do cliente. Se o usuário tiver dúvidas, a Dell poderá ajudar a respondê-las, se necessário.

Abaixo está o conteúdo padrão de uma partição /var e uma breve descrição dos subdiretórios mais relevantes. Salvo indicação em contrário, o conteúdo e os dados em /var e seus subdiretórios não devem ser alterados ou removidos. 
ps9500x3-2# cd /var
ps9500x3-2# ls
.snap           at              backups         db              ifs             lib             patch           spool
account         audit           cache           empty           journal         log             preserve        tmp
agentx          authpf          crash           games           journal-peer    mail            run             unbound
apache2         backup          cron            heimdal         krb5kdc         msgs            rwho            yp


 .snap          Snapshots. Do not touch.
 account        Account information. Do not touch.
 agentx         Empty but preserved for Agent Extensibility (AgentX) Protocol
 apache2        Apache Files. Do not touch.
 at             Variable data. Do not touch.
 audit          Audit Files. Do not touch.
 authpf         Authentication gateway. Do not touch.
 backup         System configuration backup files. Do not touch
 backups        Group configuration backups. Do not touch
 cache          System cache. Do not touch.
 crash          Crash files, older files can be deleted if needed
 cron           Cron jobs, do not touch
 db             Database files. Do not touch
 empty          Do not touch.
 games          Empty but preserved.
 heimdal        Kerberos 5 protocol. Do not touch.
 ifs            Do not touch unless directed by support
 journal        System Journal database
 journal-peer   System Journal-peer database
 krb5kdc        Kerberos KDC (Key Distribution Center)
 lib            Likewise database files. Do not touch
 log            Various System log files, can be cleared but zero's out the system logs.
 mail           Mail sub-system files.     
 msgs           Message logs
 patch          System patch database. Do not touch
 preserve       Do not touch
 run            Do not touch
 rwho           Do Not Touch
 spool          System Spool files.  Do not touch.
 tmp            Healthcheck items and vi recover. Do not touch.
 unbound        Do Not Touch
 yp             Do Not Touch

Os dois diretórios nos quais devemos nos concentrar são /var/crash e /var/logs , pois eles podem crescer e consumir a maior parte do espaço em disco na partição /var .

Os arquivos de travamento mais antigos em /var/crash poderão ser removidos se não forem mais necessários.

O /var/logs pode ser zerado e redefinido se os logs se tornarem muito grandes. Lembre-se de que, depois que os registros são redefinidos, não é mais possível solucionar e pesquisar problemas anteriores.

Analise a saída df da partição /var . Dependendo da sua saída, realize uma ou mais das seguintes tarefas:
 

ps9500x3-2# df
Filesystem            1K-blocks    Used     Avail Capacity  Mounted on
/dev/mirror/root0       1957292  871082    929628    48%    /
devfs                         1       1         0   100%    /dev
/dev/mirror/var0         978604   51394    848922     6%    /var
/dev/mirror/var-crash   2946284      10   2710572     0%    /var/crash
/dev/mirror/keystore      61228      46     56284     0%    /keystore
/dev/md0                  61166    2158     54116     4%    /tmp/ufp
/dev/md1.uzip            435751  406426     -5535   101%    /base
OneFS                 246327840 2362592 173903776     1%    /ifs
ps9500x3-2#
 


 

Rotação de logs:

As instruções detalhadas sobre como girar logs estão no artigo 20315 da Base de Conhecimento, Isilon: OneFS — como girar logs do sistema para um nó.
Comando para girar os registros:
newsyslog -f

Se a partição /var retornar a um nível de uso normal, analise a lista de logs gravados recentemente para determinar se o rodízio em um determinado log tem sido feito com frequência. O rodízio pode resolver o problema de partição cheia compactando ou removendo os logs grandes e antigos e, dessa forma, reduzir automaticamente o uso da partição.
 

Verifique a porcentagem de inodes livres:

Abra uma conexão SSH com o nó que relatou o erro e faça log-in usando a conta "root".
Execute o seguinte comando:
df -i |grep var |grep -v crash
Um resultado parecido com este será exibido:
Filesystem            1K-blocks      Used       Avail Capacity iused       ifree %iused  Mounted on
/dev/mirror/var0          1013068   49160      882864      5%   1650      139276  100%   /var
Se o valor %iused for 90% ou superior, reduza o número de arquivos na partição /var usando um dos métodos descritos abaixo.
 

Identificar os arquivos que não pertencem à partição /var:

Nota: Não mova nem exclua nenhum arquivo em /var/patch, pois eles são essenciais para o sistema de patches no nó.
  1. No nó que gerou o alerta, execute o seguinte comando para listar os arquivos na partição /var que têm mais de 5 MB:
find -x /var -type f -size +10000 -exec ls -lh {} \; | awk '{ print $9 ": " $5 }'
  1. Na saída, procure arquivos que normalmente não pertencem à partição /var . Por exemplo, um arquivo de instalação do OneFS, uma coleta de logs ou um arquivo criado pelo usuário.
  2. Remova os arquivos ou mova-os para o diretório /ifs. 


Remover manualmente os arquivos da partição /var:

Depois que os arquivos extras são identificados, os comandos necessários para limpar o diretório /var geralmente envolvem Make Directory (mkdir), Copy (cp), Move (mv) e Remove (rm). Os usuários devem estar familiarizados com esses comandos básicos do UNIX/Linux antes de continuar.

Sempre faça uma cópia de backup dos arquivos antes de excluí-los ou movê-los de seu local original.

Crie um diretório para mover ou copiar dados de backup, em que <dest> é o diretório de destino. É nesse diretório que as cópias de backup de todos os arquivos que serão excluídos devem ser copiadas primeiro. 

# mkdir /ifs/data/Isilon_Support/<dest>

Copiar, mover ou excluir arquivos conforme apropriado:

Para copiar um arquivo ou diretório:

# cp  <file>   /ifs/data/Isilon_Support/<dest>

Copie um diretório recursivamente.

# cp  -R <directory>   /ifs/data/Isilon_Support/<dest>

Para mover um arquivo ou diretório:

# mv <file>  /ifs/data/Isilon_Support/<dest>

# mv <directory>   /ifs/data/Isilon_Support/<dest>

Para remover/excluir um arquivo:

# rm <file>

 

Determine se um processo está mantendo um arquivo grande aberto.

Use o comando fstat para listar os arquivos abertos em um nó ou diretório ou para listar os arquivos que um processo abriu. Uma lista dos arquivos abertos pode ajudá-lo a monitorar os processos que estão gravando arquivos grandes. Veja como usar o comando fstat para listar os arquivos abertos em um nó, artigo 21402, Isilon: Como usar o comando fstat para listar os arquivos abertos em um nó.

Se nenhuma das tarefas acima resolver o problema, vá para a seguinte solução:


Limite o tamanho do arquivo de sobreposição e compacte o arquivo

  1. Abra uma conexão SSH com algum nó do cluster e faça login usando a conta "root".
  2. Execute os seguintes comandos para criar um backup do arquivo /etc/newsyslog.conf:
cp /etc/newsyslog.conf /ifs/newsyslog.conf
cp /etc/newsyslog.conf /etc/newsyslog.bak
  1. Abra o arquivo /ifs/newsyslog.conf em um editor de texto.
  2. Localize a seguinte linha:
/var/log/wtmp 644 3 * @01T05 B
  1. Altere a linha para:
/var/log/wtmp 644 3 10000 @01T05 ZB
Essas alterações instruem o sistema a passar o arquivo /var/log/wtmp quando ele atingir 10 MB e compactar o arquivo com gzip.
  1. Salve e feche o arquivo /ifs/newsyslog.conf .
  2. Execute o seguinte comando para copiar o arquivo atualizado em todos os nós do cluster:
isi_for_array 'cp /ifs/newsyslog.conf /etc/newsyslog.conf'
  1. Os arquivos de log são revezados automaticamente, se necessário, usando um trabalho cron a cada hora e meia hora (/etc/crontab)
#minute hour    mday    month   wday    who     command
#
# rotate log files every half-hour, if necessary
0,30    *       *       *       *       root    newsyslog

Se o rodízio de outros logs for frequente ou se as etapas anteriores não resolverem o problema, entre em contato com o suporte técnico da Dell para obter assistência.

Affected Products

Isilon

Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000169344
Article Type: Solution
Last Modified: 12 May 2025
Version:  18
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.