Поиск и устранение неисправностей пакетов обновления нулевого окна TCP, отправленных узлом PowerScale

Summary: В этой статье обсуждается причина нулевых счетчиков окон из команды netstat. В нем также обсуждаются возможные точки интереса при исследовании и выяснении того, почему эти значения растут. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Выходные данные
 'netstat -anT -p tcp'
команда от узла показывает количество пакетов нулевого окна TCP (столбец 0-win). Значения в столбце 0-win показывают, сколько раз узел TCP-соединения (локальный адрес) к удаленному устройству (внешний адрес) отправил пакет обновления нулевого окна TCP. Это происходит, когда окно приема TCP узла уменьшается до нуля или становится слишком маленьким для размещения полноразмерного сегмента данных.
Примере:
Cluster-1# netstat -anT -p tcp
Active Internet connections (including servers)
Proto Rexmit OOORcv 0-win  maxswnd maxseg     srtt   srtvar    rexmt  sndwnd sncwnd rcvwnd   delack SR SS ND AS Local Address          Foreign Address
tcp4       0      0   1001 2097920   1460     47ms     23ms    342ms 2097664 190488 131400     99ms  X  X  X  X 100.89.53.100.445       100.90.164.11.52765
...
Конечным результатом этого является то, что удаленное устройство не сможет передавать данные, что приведет к задержкам, которые приводят к повышенной задержке (записи), до тех пор, пока узел не отправит обновление окна TCP, указывающее, сколько данных он теперь может получать. 
В большинстве случаев пакеты обновления нулевого окна TCP, отправляемые узлом, указывают на то, что принимающее приложение (процесс) на узле (NFS, SMB и т.д.) медленно извлекает данные из буфера приема. На это может указывать согласованное ненулевое значение, наблюдаемое в столбце Recv-Q для соединения в выходных данных
 'netstat -an tcp'
. Например, выполните следующую команду несколько раз, чтобы проверить, заполнен ли Recv-Q.
Примере:
Cluster-1# netstat -an tcp
Active Internet connections (including servers)
Proto Recv-Q Send-Q Local Address          Foreign Address        (state)
tcp4  131400      0 100.89.53.100.445       100.90.164.11.52765    ESTABLISHED
...
Это счетчик реального времени, поэтому эту команду необходимо выполнить, когда узел отправляет пакеты обновления нулевого окна TCP для подключения. Ниже приведен пример скрипта для получения статистики в реальном времени из:
  • Recv
  • Send-Q
  • Незаказы (OOO)
  • Zero Windows (0-win)
  • Ретранслирует
# mkdir /ifs/data/Isilon_Support/$(date +%d-%m-%Y)/
echo; while sleep 10 ; do echo "######### Live Send Rec Queue Q: #########"; date ; netstat -an4x -p tcp | awk '{ if (( $2 != 0 ) || ($3 != 0)) print $0 }'; echo; sleep 1; echo "######### Live OoO / 0-win / Retrans: #########" ; date; netstat -an4T -p tcp | awk '{ if (( $2 != 0 ) || ($3 != 0) || ($4 != 0)) print $0 }'; done >> `hostname`.TCP_specs.out
Постоянно повышенное значение Recv-Q означает, что данные были помещены в буфер приема, но приложение не вызвало recv() для их копирования из буфера приема в буфер приложения. Это указывает на то, что приложение перегружено или иным образом не может своевременно обрабатывать входящие данные. Как только данные поступают в очередь получения, они должны быть немедленно обработаны, если приложение этого не делает, то его просят выполнить больше работы, чем оно может обработать. 
Таким образом, если значение Recv-Q остается повышенным для соединения, в то время как пакеты обновления нулевого окна TCP посылаются для соединения, следует провести исследование узких мест в принимающем приложении, процессоре, дисках и т. д.
Если значение Recv-Q остается равным нулю для соединения, то пакеты обновления нулевого окна TCP, отправляемые узлом, также могут указывать на то, что окно приема TCP на стороне узла соединения слишком мало для начала для произведения задержки пропускной способности (BDP) соединения между узлом и удаленным адресатом, и могут потребоваться некоторые настройки TCP узла.

Additional Information

Дополнительные сведения см. в разделе «Задержка, полоса пропускания и пропускная способность» следующего руководства https://www.delltechnologies.com/asset/en-us/products/storage/industry-market/h16463-isilon-advanced-networking-fundamentals.pdf

Affected Products

PowerScale OneFS
Article Properties
Article Number: 000221738
Article Type: How To
Last Modified: 19 Apr 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.