VPLEX:管理服务器遇到较高的 RAM、内存使用率和内部磁盘空间使用率

Summary: 在没有外部 AMQP 事件使用者的情况下运行的管理服务器可能会遇到较高的 RAM 内存使用率和内部磁盘空间使用率。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



  • 在没有外部 AMQP 事件使用者的情况下运行的管理服务器可能会遇到较高的 RAM 内存使用率和内部磁盘空间使用率。 
  • 在执行 CLI 或 GUI 命令时,内存消耗较高的系统将遇到比正常延迟更高的延迟。  
  • 根分区的内部磁盘空间不足的系统将无法写入该分区(VPLEX 将继续将日志写入其他分区,但一些 Linux 服务使用根分区,并且无法记录进一步的事件)。

症状 1:
rabbitmq 使用大量 RAM 内存。
 
service@ManagementServer:~>top
 
top - 13:17:26 up 103 days, 13 min, 20 users, load average:0.28、0.34、0.36
个任务:201 total, 1 running, 200 sleeping, 0 stopped, 0 zombie
Cpu(s):12.3%US、0.9%SY、0.0%NI、85.0%ID、1.5%WA、0.0%HI、0.2%SI、0.0%ST
内存:   总计 3920396k,已用 3448376k,可用 472020k,缓冲区为
14752k 交换:  8388604k total, 413608k used, 7974996k free, 1781800k cached
 
PID USER PR NI VIRT  RES SHR S %CPU %MEM TIME+ COMMAND
22674 rabbitmq 20 0 3.4g 3.7g 2040 s 2 87.9 225:09.39 beam.smp
16302 service 20 0 2975m 1.1g 9232 s 2 2.4 561:18.54 java
 
症状 2:
Call Home 警告磁盘空间使用
率高或临界。当管理服务器上的根分区达到可用空间的 90% 时,您将看到以下
Call Home。

 
<ID>0x8a4a31fb</ID>
<name>SMS_PARTITION_HIGH_CAPACITY</nameserverity><>
ERROR </severity><
customerRCA> 管理服务器上的分区已达到容量高。</customerRCA >

 
当根分区变满时,您将看到以下 Call Home。
 
<ID>0x8a4a61fa</ID>
<name>SMS_PARTITION_CRITICAL_CAPACITY</nameserverity><>
ERROR </severity><
customerRCA管理服务器上的分区已超过临界容量阈值。<>/customerRCA >

 
症状 3:
rabbitmq 正在使用大量磁盘空间。

 
service@ManagementServer:/var/lib/rabbitmq/mnesia/rabbit@localhost # du -shx *
4.0K cluster_nodes.config
4.0K DECISION_TAB.日志
4.0K 最新。记录 32K msg_store_persistent
14G msg_store_transient <<<<4.0K nodes_running_at_shutdown 4.08 亿队列和 4.0 万rabbit_durable_exchange。



DCD
4.0K rabbit_durable_queue。DCD
4.0K rabbit_durable_queueDCL
4.0K rabbit_durable_route。DCD
4.0K rabbit_runtime_parameters。DCD
8.0K rabbit_runtime_parametersDCL
4.0K rabbit_serial
4.0K rabbit_user。DCD
4.0K rabbit_user_permissionDCD
4.0K rabbit_vhostDCD

service@ManagementServer:/var/lib/rabbitmq/mnesia/rabbit@localhost # df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda5 20G 19G 692K 100% /
<<<<
udev 1.9G 196K 1.9G 1% /dev
tmpfs 1.9G 0 1.9G 0% /dev/shm
/dev/sda1 504M 60M 420M 13% /boot
/dev/sda7 16G 4.1G 11G 27% /var/log
/dev/sda8 44G 5.0G 37G 13% /diag
/dev/sda9 9.9G 151M 9.2G 2% /data


service@ManagementServer:/var/lib/rabbitmq/mnesia/rabbit@localhost # ls -lah msg_store_transient/ | head
total 14G
drwxr-x--- 1 rabbitmq rabbitmq 12K Nov 13 11:14 .
drwxr-x--- 1 rabbitmq rabbitmq 734 Nov 13 15:03 ..
-rw-r----- 1 rabbitmq rabbitmq 15M Nov 6 05:: 51 0.rdq-rw-r
----- 1 rabbitmq rabbitmq 17M Nov 13 05:19 1000.rdq-rw-r
----- 1 rabbitmq rabbitmq 17M Nov 13 05:21 1001.rdq-rw-r
----- 1 rabbitmq rabbitmq 17M Nov 13 05:22 1002.rdq-rw-r
----- 1 rabbitmq rabbitmq 17M Nov 13 05:23 1003.rdq-rw-r
----- 1 rabbitmq rabbitmq 17M Nov 13 05:25 1004.rdq-rw-r
----- 1 rabbitmq rabbitmq 17M Nov 13 05:30 1005.rdq


症状 4:
外部消息队列上有大量消息。

 
service@sms-bali-2:~>sudo rabbitmqctl list_queues
列出队列 ...
aliveness-test 0
queue.vplex.external    1749909 <<<<<
queue.vplex.ndu.events 0
sms_internal 0...
做。

 

Cause

  • RabbitMQ 将尝试保留所有事件,直到事件被消耗或达到内存消耗阈值。 
  • 对于 VPLEX,queue.vplex.external 队列目前没有默认使用者。 
  • 如果不选中,队列大小可能会变得非常大。 
  • 一旦内存消耗达到 20%,RabbitMQ 会将队列写入磁盘,而磁盘又使用根磁盘空间。 

Resolution

解决方法 1:
在管理服务器中,使用以下命令重新启动 rabbitmq 服务器:

sudo service rabbitmq-服务器重启

输出示例:

service@ManagementServer:~>
rabbitmq-server。
重新启动 rabbitmq-server:成功
sudo service rabbitmq-server restartservice@ManagementServer:~>  

 

解决方法 2:
在管理服务器中,使用以下命令重新启动管理服务器:

立即 sudo shutdown r

输出示例:
service@ManagementServer:~>sudo shutdown -r now

Broadcast message from root (pts/0) (Mon Mar 5 19:33:18 2018):

系统现在将关闭以进行重新启动!


提醒:
然后会弹出一条 PuTTY 致命错误消息,指出“服务器意外关闭网络连接”

永久修复:
此问题已在 GeoSynchrony 5.5 及更高版本中得到解决。

Affected Products

VPLEX Series

Products

VPLEX for All Flash, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS1, VPLEX VS2
Article Properties
Article Number: 000170841
Article Type: Solution
Last Modified: 20 Nov 2020
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.