Isilon:在 Oracle 資料泵作業期間發生錯誤「dNFS 異步 I/O 故障」

Summary: 使用 Smartconnect 區域名稱時,Oracle 用戶端和 Isilon 之間透過 WAN 執行的資料泵/備份作業可能會中斷,並出現錯誤「dNFS 異步 I/O 故障」,但可使用 IP 運作。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

這是依照設計的程序。

Oracle 用戶端正在使用 Smartconnect 區域名稱,透過 WAN 對 Isilon 執行資料抽取/備份作業。
作業中斷並出現以下錯誤:
 
ORA-17516:dNFS 非同步 I/O 故障
 
但是,相同的操作適用於IP位址。

Cause

這可能是由兩件事引起的:
  1. 故障轉移和單用戶端負載平衡的 dNFS 功能。
dNFS 或直接 NFS 具有故障轉移和單用戶端負載平衡功能,用於寫入密集型作業,如數據泵或備份操作。由於此功能,當您查看數據包跟蹤時,您會注意到用戶端將在操作過程中與多個節點進行通信。

雖然 Isilon 可以在不需要 dNFS 的情況下處理容錯移轉,但它不提供單一用戶端負載平衡;而是 Isilon 會在查詢時輪替提供給每個用戶端的 IP 位址,進而在整個用戶端群中執行平衡。

因此,在廣域網上,每次 Oracle 用戶端必須調用 Smarconnect 服務才能連接到不同的節點時,獲取下一個 IP 位址都會出現延遲,在此期間,Oracle 用戶端將假定 NFS 伺服器無法訪問,並將中斷正在進行的操作,並聲明“dNFS 異步 I/O 故障”。

甲骨文對錯誤的聲明如下,驗證了我們的發現:
 
Error code: ORA-17516
描述:dNFS 異步 I/O 故障
原因:由於儲存伺服器 rebo ot,導致非同步 I/O 要求失敗
 
  1. 兩個裝置之間存在的自適應安全設備 [ASA] 防火牆正在丟棄埠 2049 上的傳入 TCP 數據包:
兩個設備之間可能存在防火牆,該防火牆設置為通過埠 2049 丟棄 TCP 數據包。ASA 始終期望 TCP 連接的第一個數據包是來自嘗試打開/形成 TCP 連接的主機的 TCP SYN。如果其他一些 TCP 封包如「TCP RST ACK」傳入,便會假定這是針對現有連線的封包。然後,它會檢查其連接表,但找不到現有連接,因此會丟棄流量。

檢視 ASA 裝置的紀錄時,您會發現類似的紀錄訊息:
 
%ASA-6-106015:拒絕 TCP (無連線) 從 x.x.x.x/x 到 x.x.x.x/x 標記介面上的 RST 某些介面

Resolution

Oracle 有一個單獨的過程來配置 dNFS。
  1. 檢查掛接項目來源: oranfstab file
  2. 其中指定了 NFS 伺服器的不同 IP 位址
  3. 使用此組態檔案中存在的其中一個 IP 位址掛接 NFS 匯出
  4. 這將排除使用 Smartconnect 區域名稱,而改為僅使用 IP 位址與伺服器連線。
  5. 多個 IP 位址位於 oranfstab 檔案將負責負載平衡

請聯絡 Oracle 支援以設定 dNFS。如果兩個設備之間存在防火牆,則在 ASA 設備上,您需要允許埠 2049 上的傳入 TCP 流量。

Additional Information

Affected Products

Isilon

Products

Isilon
Article Properties
Article Number: 000056260
Article Type: Solution
Last Modified: 02 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.