Dell Unity. Клиенты NFS перестают отвечать или сталкиваются с проблемами производительности при доступе к целевой стороне репликации
Summary: При попытке получить доступ к экспортам на целевой стороне репликации возникали проблемы с произвольным прекращением реагирования и производительностью. (Исправляется пользователем)
Symptoms
Экспортируемые каталоги NFS, созданные на целевом сервере сетевой системы хранения данных с использованием интерфейса резервного копирования.
При попытке получить доступ к экспортам на целевой стороне репликации возникали проблемы с произвольным прекращением реагирования и производительностью.
Анализ трассировки сети показывает, что запросы NFS поступают на сервер NAS, но сервер NAS не отвечает.
var/log/sm_daemon.log
2021-06-01 16:01:43.049778 [7f1f973ea700]TRACE sm_del_all_by_mark delete_objects(509): Deleting <NAddr>: IPv4 link=0x000c scope=0 label='bond3.218' addr='x.x.x.x/16' flags=Secondary+/Temporary+/NoDAD-/Optimistic-/DADFailed-/Homeaddress-/Deprecated-/Tentative-/Permanent+
2021-06-01 16:01:43.051418 [7f1f973ea700]TRACE sm_del_all_by_mark delete_objects(509): Deleting <NAddr>: IPv4 link=0x000e scope=0 label='bond3.661' addr='x.x.x.x/22' flags=Secondary+/Temporary+/NoDAD-/Optimistic-/DADFailed-/Homeaddress-/Deprecated-/Tentative-/Permanent+ <--- IP in question
2021-06-01 16:01:43.052528 [7f1f973ea700]TRACE sm_del_all_by_mark delete_objects(509): Deleting <NAddr>: IPv4 link=0x000f scope=0 label='bond3.671' addr='x.x.x.x/22' flags=Secondary+/Temporary+/NoDAD-/Optimistic-/DADFailed-/Homeaddress-/Deprecated-/Tentative-/Permanent+
2021-06-01 16:01:43.053629 [7f1f973ea700]TRACE sm_del_all_by_mark delete_objects(509): Deleting <NAddr>: IPv4 link=0x29ba scope=0 label='bond3.651' addr='x.x.x.x/22' flags=Secondary-/Temporary-/NoDAD-/Optimistic-/DADFailed-/Homeaddress-/Deprecated-/Tentative-/Permanent+ <--- IP that prompts bond removal
2021-06-01 16:01:43.055136 [7f1f973ea700]TRACE sm_del_all_by_mark delete_objects(509): Deleting <NLink>: type=4 link=0x29ba media=0x01 flags=Connected+/Up+/Promisc-/Master-/Slave- flags=0x00011043 flagsChange=0x00000000 MTU=1500 MAC='00:60:16:5c:56:04' name='bondx.xxx' parentLink=0x000a VLAN=xxx kind='vlan' PCIAddr='' NICName='' SpeedDuplex/AutoNeg=0/0,supported{}/0,partner{}/0,advertised{}/0 FlowControl/AutoNeg=0/0 NetNS=0 <--- bond removal
/var/log/messages
2021-06-01T16:01:53+00:00 self kernel: [15786728.512641] unregister_netdevice: waiting for bond3.651 to become free. Usage count = 2 2021-06-01T16:02:03+00:00 self kernel: [15786738.588540] unregister_netdevice: waiting for bond3.651 to become free. Usage count = 2 2021-06-01T16:02:13+00:00 self kernel: [15786748.700452] unregister_netdevice: waiting for bond3.651 to become free. Usage count = 2
Эта проблема может возникнуть в следующих случаях:
- Сервер NAS является целевой стороной репликации
- Отражение пакетов включено на исходной стороне репликации
Целевой сервер сетевой системы хранения данных может испытывать проблемы при активации кэша отражения IP-адресов после выхода из приостановленного состояния.
Во время нормальной работы целевой сервер NAS приостанавливает, а затем воспроизводит разностную информацию, связанную с репликацией.
Затем сервер NAS разменяет приостановку и снова переводит интерфейсы в режим онлайн, а связанный IP-адрес отражает кэш.
Есть вероятность, что после возврата интерфейса сервер NAS в оперативный режим перестанет отвечать и не сможет отвечать на запросы клиентов NFS.
Это состояние носит периодический характер. Сервер сетевой системы хранения данных может работать в течение определенного периода времени, а затем столкнуться с проблемой.
Возможно, сервер NAS столкнется с проблемой сразу или будет работать в течение длительного периода времени, прежде чем она активируется.
Эта проблема может проявляться по-разному.
Это может привести к критической ошибке процессора СХД.
Создание или удаление интерфейсов на целевом сервере NAS может завершиться сбоем и оставить сервер NAS в состоянии ограниченной функциональности.
Cause
Это проблема кода Unity ниже 5.07.
Resolution
Временные решения
Отключите или приостановите репликацию.
Отключите отражение IP-адресов на исходной стороне (оно будет отключено на целевой стороне)
Модернизация до 5.07