Connectrix. Что такое тайм-аут keepalive в FCIP
Summary: Что такое тайм-аут keepalive в FCIP?
Symptoms
Проще говоря, тайм-аут keepalive — это пакет тактового импульса, отправленный с однорангового узла на одноранговый узел в среде FCIP, который не удался.
Это типичное сообщение для тайм-аута KA. Обратите внимание на различные приоритеты, схемы и, наконец, туннель. Каждый из них имеет свой тайм-аут KA.
2016/06/17-16:00:21:308148, [XTUN-2005], 594561/36489, FID 128, ERROR, Node_32, FCIP Tunnel 16 High-Pri QoS DOWN (Keepalive Timeout)., ftnl_cp_vm.c, line: 1743, comp:bmd, ltime:2016/06/17-16:00:21:303651 2016/06/17-16:00:21:930759,
[XTUN-2005], 594564/36490, FID 128, ERROR, Node_32, FCIP Tunnel 16 Low-Pri QoS DOWN (Keepalive Timeout)., ftnl_cp_vm.c, line: 1743, comp:bmd, ltime:2016/06/17-16:00:21:916149 2016/06/17-16:00:21:931139,
[XTUN-2003], 594568/36491, FID 128, ERROR, Node_32, FCIP Tunnel 16 Circuit 3 DOWN (Keepalive Timeout)., ftnl_cp_capi.c, line: 2201, comp:bmd, ltime:2016/06/17-16:00:21:917593 2016/06/17-16:00:21:931232,
[XTUN-2003], 594569/36492, FID 128, ERROR, Node_32, FCIP Tunnel 16 Circuit 2 DOWN (Keepalive Timeout)., ftnl_cp_capi.c, line: 2201, comp:bmd, ltime:2016/06/17-16:00:21:918112 2016/06/17-16:00:21:931467,
[XTUN-2003], 594570/36493, FID 128, ERROR, Node_32, FCIP Tunnel 16 Circuit 1 DOWN (Keepalive Timeout)., ftnl_cp_capi.c, line: 2201, comp:bmd, ltime:2016/06/17-16:00:21:918586 2016/06/17-16:00:21:931595,
[XTUN-2003], 594571/36494, FID 128, ERROR, Node_32, FCIP Tunnel 16 Circuit 0 DOWN (Keepalive Timeout)., ftnl_cp_capi.c, line: 2201, comp:bmd, ltime:2016/06/17-16:00:21:919314 2016/06/17-16:00:21:939507,
[XTUN-2001], 594572/36495, FID 128, ERROR, Node_32, FCIP Tunnel 16 DOWN (Network/Remote/Other)., ftnl_cp_capi.c, line: 2111, comp:bmd, ltime:2016/06/17-16:00:21:921443 2016/06/17-16:00:21:939737,
[XTUN-2005], 594574/36496, FID 128, ERROR, Node_32, FCIP Tunnel 16 Med-Pri QoS DOWN (Internal Close)., ftnl_cp_vm.c, line: 1743, comp:bmd, ltime:2016/06/17-16:00:21:924391
По умолчанию для каналов установлено 10-секундное время ожидания активности.
Используйте тайм-аут активности в 1 секунду, если туннели имеют несколько каналов. Таким образом, рамы могут быть быстрее перемещены по другому контуру. Чтобы изменить keepalive, используйте portcfg fcipcircuit 16 modify <circuit ID> -k 1000
Для туннеля FICON требуется, чтобы тайм-аут поддержания активности не превышал 1 с для каждого канала FCIP, добавленного в туннель.
Для нормальной работы через туннели FCIP время ожидания активности для всех каналов FCIP в туннеле FCIP должно быть меньше общего времени ожидания ввода-вывода для всех обменов FC. Если значение времени ожидания ввода-вывода FC меньше значения времени ожидания активности активности, то время ожидания операций ввода-вывода будет истекать во всех доступных каналах FCIP без повторных попыток.
Значение keep-alive должно основываться на требованиях приложения. Обратитесь к поставщикам инициаторов FC, чтобы определить соответствующее значение тайм-аута активности для вашего приложения. Сумма тайм-аутов поддержания активности для всех каналов в туннеле должна быть близка к общему значению времени ожидания ввода-вывода инициатора FC. Например, приложение зеркального отображения имеет 6-секундный тайм-аут ввода-вывода. В туннеле FCIP есть три контура. Установите для тайм-аута поддержания активности значение 2 с для каждого контура FCIP. Это позволяет выполнять максимально возможное количество повторных попыток по всем доступным каналам FCIP до истечения времени ожидания ввода-вывода инициатором.
Cause
Проще говоря, тайм-аут keepalive — это пакет тактового импульса, отправленный с однорангового узла на одноранговый узел в среде FCIP, который не удался.
Resolution
FCR требует, чтобы таймер keepalive составлял 1,5 с, чтобы не истекало время ожидания FCR.
Значение тайм-аута KA можно найти под идентификатором цепи в разделе FCIP Supportsave.Circuit ID: 17.0 (Circuit 0 of tunnel 17) Circuit Num: 0 Admin Status: Enabled Oper Status: Up Connection Type: Default Remote IP: 10.251.131.58 Local IP: 10.250.30.58 Metric: 0 Failover Group ID: (Not Config/Active) Min Comm Rt: 150000 Max Comm Rt: 400000 SACK: On Min Retrans Time: 100 Max Retransmits: 8 Keepalive Timeout: 1000 <----------------- 1 second