PowerScale:OneFS 在节点重新启动时丢失 NFSv4 锁定

Summary: 在节点重新启动后,NFSv4 客户端可能会丢失锁定或无法正确释放锁定。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

在修复开发之前,所有 OneFS 版本中都存在此问题。
它可以影响使用 NFSv4 和锁定操作的任何应用程序。

在广泛使用 NFSv4 锁定机制时,ActiveMQ 或 OpenMQ 等“消息队列”应用程序通常会观察到此问题。

对于 MQ 应用程序;它通常表现为在不应接管主 MQ 服务器时接管主 MQ 服务器。
这会导致宕机或数据不一致,需要在应用程序端进行手动干预才能解决。

在数据包捕获中观察到时,客户端会成功锁定文件,而第二个客户端会尝试访问它。
当锁定客户端连接到节点重新启动时,第二个客户端将被授予锁定。
第一个客户端在锁定结束时收到错误,因为它们不再具有锁定。

此问题可重现,如下所示:

  1. 在第一个客户端上,使用 NFSv4.0 装载导出。
  2. 在第二个客户端上,使用 NFSv4.0 装载相同的导出。
  3. 在第一个客户端上,锁定文件 5 分钟。
  4. 在第二个客户端上,启动一个循环,尝试锁定同一文件。
  5. 重新启动第一个客户端连接到的 OneFS 节点。
  6. 如果存在问题,第二个客户端将在第一个客户端锁定结束之前被授予锁定。

 

Cause

将 NFSv4 连接移至其他节点的逻辑中存在错误,导致在节点重新启动时释放锁定。

 

Resolution

修复:
升级或修补以下 OneFS 版本之一。

  • 9.1.0.19+
  • 9.2.1.12+
  • 9.4.0.3+
  • 9.5.0.0+

解决 方案:
此问题没有解决方法。

 

Affected Products

PowerScale OneFS
Article Properties
Article Number: 000215804
Article Type: Solution
Last Modified: 26 Sep 2023
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.