Data Protection Advisor: Os arquivos temporários pgsql_tmp pasta no servidor do datastore aumentaram rapidamente e consumindo todo o espaço disponível no file system
Resumo: Os arquivos pgsql_tmp pasta no servidor do datastore aumentaram rapidamente e o disco foi preenchido.
Este artigo aplica-se a
Este artigo não se aplica a
Este artigo não está vinculado a nenhum produto específico.
Nem todas as versões do produto estão identificadas neste artigo.
Sintomas
O file system no servidor do datastore onde o Postgres está localizado está quase cheio.
O serviço de aplicativos é iniciado com sucesso, mas não consegue processar dados e, em breve, falha.
A seguinte mensagem foi encontrada no server.log no application server:
2022-11-15 08:41:00,700 WARN [org.jboss.jca.core.connectionmanager.listener.TxConnectionListener] (ReportEngineMessageListener #1:Backup Report Card:22b4e14e-a7a9-4b49-a244-54336df9661f) IJ000305: Erro de conexão:
org.postgresql.util.PSQLException: ERRO: não foi possível criar o arquivo temporário "base/pgsql_tmp/pgsql_tmp921.5.sharedfileset/i165of8192.p0.0": Não há espaço restante no dispositivo
Um erro seguiu o aviso acima:
2022-11-15 08:41:00,704 ERROR [com.emc.apollo.jdbc.exec.SQLExecutor] (ReportEngineMessageListener #1:Backup Report Card:22b4e14e-a7a9-4b49-a244-54336df9661f) Consulta de execução de erro: Erro. A consulta foi:
SELECIONE t0.f_agent_name como "t0f_agent_name", t0.f_sub_name como "t0f_sub_name", t0.f_group_name como "t0f_group_name", t0.f_schedule_name como "t0f_schedule_name", t0.f_client_name como "t0f_client_name", t0.f_policy_name como "t0f_policy_name", t0.f_workflow_name como "t0f_workflow_name", t0.f_workflow_jobid como "t0f_workflow_jobid", t0.f_action_name como "t0f_action_name", t0.f_job_name como "t0f_job_name", t0.f_domain_name como "t0f_domain_name", t0.f_backup_set como "t0f_backup_set", t0.f_session como "t0f_session", t0.f_proxy como "t0f_proxy", t0.f_queuestart como "t0f_queuestart", t0.f_status como "t0f_status", t0.f_starttime como "t0f_starttime", t0.f_endtime como "t0f_endtime", t0.f_ntries como "t0f_ntries", t0.f_queuestart COMO f_reporterstarttime, t0.f_queuestart COMO f_reporterendtime, t0.f_id como f_id
DE view_backupjob t0....
Nos registros do datastore, mensagens semelhantes serão encontradas:
2022-11-15 07:29:49.001 GMT [7443] ERRO: não foi possível gravar no arquivo "base/pgsql_tmp/pgsql_tmp4401.6.sharedfileset/i19081of32768.p1.0": Não há espaço restante no dispositivo
Verificando o servidor do datastore no diretório /dpa/services/datastore/data/base/pgsql_tmp, há várias pastas e arquivos que compõem muitos GBs de tamanho.
A data dos primeiros arquivos no diretório pgsql_tmp pode corresponder a um upgrade recente do software DPA.
O serviço de aplicativos é iniciado com sucesso, mas não consegue processar dados e, em breve, falha.
A seguinte mensagem foi encontrada no server.log no application server:
2022-11-15 08:41:00,700 WARN [org.jboss.jca.core.connectionmanager.listener.TxConnectionListener] (ReportEngineMessageListener #1:Backup Report Card:22b4e14e-a7a9-4b49-a244-54336df9661f) IJ000305: Erro de conexão:
org.postgresql.util.PSQLException: ERRO: não foi possível criar o arquivo temporário "base/pgsql_tmp/pgsql_tmp921.5.sharedfileset/i165of8192.p0.0": Não há espaço restante no dispositivo
Um erro seguiu o aviso acima:
2022-11-15 08:41:00,704 ERROR [com.emc.apollo.jdbc.exec.SQLExecutor] (ReportEngineMessageListener #1:Backup Report Card:22b4e14e-a7a9-4b49-a244-54336df9661f) Consulta de execução de erro: Erro. A consulta foi:
SELECIONE t0.f_agent_name como "t0f_agent_name", t0.f_sub_name como "t0f_sub_name", t0.f_group_name como "t0f_group_name", t0.f_schedule_name como "t0f_schedule_name", t0.f_client_name como "t0f_client_name", t0.f_policy_name como "t0f_policy_name", t0.f_workflow_name como "t0f_workflow_name", t0.f_workflow_jobid como "t0f_workflow_jobid", t0.f_action_name como "t0f_action_name", t0.f_job_name como "t0f_job_name", t0.f_domain_name como "t0f_domain_name", t0.f_backup_set como "t0f_backup_set", t0.f_session como "t0f_session", t0.f_proxy como "t0f_proxy", t0.f_queuestart como "t0f_queuestart", t0.f_status como "t0f_status", t0.f_starttime como "t0f_starttime", t0.f_endtime como "t0f_endtime", t0.f_ntries como "t0f_ntries", t0.f_queuestart COMO f_reporterstarttime, t0.f_queuestart COMO f_reporterendtime, t0.f_id como f_id
DE view_backupjob t0....
Nos registros do datastore, mensagens semelhantes serão encontradas:
2022-11-15 07:29:49.001 GMT [7443] ERRO: não foi possível gravar no arquivo "base/pgsql_tmp/pgsql_tmp4401.6.sharedfileset/i19081of32768.p1.0": Não há espaço restante no dispositivo
Verificando o servidor do datastore no diretório /dpa/services/datastore/data/base/pgsql_tmp, há várias pastas e arquivos que compõem muitos GBs de tamanho.
A data dos primeiros arquivos no diretório pgsql_tmp pode corresponder a um upgrade recente do software DPA.
Causa
Durante o upgrade recente, o datastore do DPA não foi ajustado corretamente para a quantidade de RAM disponível no servidor.
A execução do seguinte comando mostra o seguinte:
O valor de 512 MB é típico das configurações padrão para o servidor PostgreSQL.
Essa configuração de memória baixa fazia com que o DPA gravava informações de consulta em arquivos temporários pgsql_tmp.
Quando o file system ficou cheio, o sistema acabou com a consulta que deixou para trás os arquivos tmp que, eventualmente, preencheram todo o espaço livre no file system.
Isso causou o erro no server.log relacionado a uma consulta SELECT que não conseguiu criar um arquivo temporário pgsql_tmp diretório.
A execução do seguinte comando mostra o seguinte:
# dpa.sh ds tune
EMC Data Protection Advisor
[INFO] Current Datastore Service tuned expecting 512MB of host memory
Command completed successfully.
EMC Data Protection Advisor
[INFO] Current Datastore Service tuned expecting 512MB of host memory
Command completed successfully.
O valor de 512 MB é típico das configurações padrão para o servidor PostgreSQL.
Essa configuração de memória baixa fazia com que o DPA gravava informações de consulta em arquivos temporários pgsql_tmp.
Quando o file system ficou cheio, o sistema acabou com a consulta que deixou para trás os arquivos tmp que, eventualmente, preencheram todo o espaço livre no file system.
Isso causou o erro no server.log relacionado a uma consulta SELECT que não conseguiu criar um arquivo temporário pgsql_tmp diretório.
Resolução
Execute o comando tune no servidor do Datastore para a quantidade de RAM no servidor.
Por exemplo, se o servidor estiver configurado com 64 GB de RAM, execute o comando:
Reinicie o serviço do datastore.
Após a reinicialização, os arquivos pgsql_tmp serão removidos automaticamente pelo processo postgresql.
Monitore o registro de serviço mais recente do Datastore. Quando a seguinte mensagem for exibida, o aplicativo poderá ser iniciado.
2022-11-15 09:19:10.003 GMT [10897] REGISTRO: o sistema de banco de dados está pronto para aceitar conexões
Com mais memória ajustada para o serviço datastore, haverá menos requisitos para gravar dados de consulta em arquivos temporários pgsql_tmp.
Entre em contato com o suporte técnico da Dell para obter mais informações.
Por exemplo, se o servidor estiver configurado com 64 GB de RAM, execute o comando:
# dpa.sh ds ajuste 64GB
EMC Data Protection Advisor
Set Datastore service memory usage to 65536MB: Confirme [Y|N]
y
Serviço de datastore ajustado com sucesso.
A nova utilização de memória para o datastore não entrará em vigor até que o serviço do datastore seja reiniciado.
Comando concluído com sucesso.
EMC Data Protection Advisor
Set Datastore service memory usage to 65536MB: Confirme [Y|N]
y
Serviço de datastore ajustado com sucesso.
A nova utilização de memória para o datastore não entrará em vigor até que o serviço do datastore seja reiniciado.
Comando concluído com sucesso.
Reinicie o serviço do datastore.
Após a reinicialização, os arquivos pgsql_tmp serão removidos automaticamente pelo processo postgresql.
Monitore o registro de serviço mais recente do Datastore. Quando a seguinte mensagem for exibida, o aplicativo poderá ser iniciado.
2022-11-15 09:19:10.003 GMT [10897] REGISTRO: o sistema de banco de dados está pronto para aceitar conexões
Com mais memória ajustada para o serviço datastore, haverá menos requisitos para gravar dados de consulta em arquivos temporários pgsql_tmp.
Entre em contato com o suporte técnico da Dell para obter mais informações.
Produtos afetados
Data Protection AdvisorPropriedades do artigo
Número do artigo: 000205495
Tipo de artigo: Solution
Último modificado: 25 mai. 2023
Versão: 3
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.