PowerFlex: Kaynak İhtilafı Sorunlarını Giderme

요약: PowerFlex Kaynak İhtilafı Sorunları ve Sorun Giderme

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

PowerFlex süreçlerinden kaynaklanan anormal davranışlar, PowerFlex işlemleri diğer yazılım veya donanım bileşenleriyle kaynak çekişmesine girdiğinde ortaya çıkar.

Buradaki semptomlar çok ve çeşitli olabilir. Bu, semptomların ve sonuçların kısmi bir listesidir

 

MDM Sorunları:

 - MDM işlemleri takılıp diğer MDM'lerle iletişimi kaybettikçe MDM sahiplik yük devretme gerçekleşir

From exp.0:
Panic in file /emc/svc_flashbld/workspace/ScaleIO-RHEL7/src/mos/umt/mos_umt_sched_thrd.c, line 1798, function mosUmtSchedThrd_SuspendCK, PID 36721.Panic Expression ALWAYS_ASSERT Scheduler guard seems to be dead.
 
From trc.*
24/02 15:54:16.087919 0:schedThrdGuard_SampleLivnes:01463: WARNING: pThread 0x106d9360(0) in scheduler 0x7fff580c4880, running UMT 0x7f39ad00ceb8, found to be stuck.
24/02 15:54:16.088226 ad417eb8:actorLoop_IsSchedThredStuck:10932: Stuck scheduler thread identified
24/02 15:54:16.088253 ad417eb8:actor_Loop:11257: Lost quorum. ourVoters: 0 votersOwnedByOther: [0,0]
24/02 15:54:16.088299 ---Planned crash, reason: Lost quorum, going down to let another MDM become master ---

 

 - MDM işlemi, bir süre sonra sürekli olarak bağlantıyı kesecek ve yeniden bağlanacaktır

2017-02-23 14:00:43.241 MDM_CLUSTER_LOST_CONNECTION 	WARNING  	The MDM, ID 089012db4d536880, lost connection 
2017-02-23 14:00:43.422 MDM_CLUSTER_CONNECTED     	INFO     	The MDM, ID 089012db4d536880, connected 
2017-02-23 23:05:25.852 MDM_CLUSTER_LOST_CONNECTION 	WARNING  	The MDM, ID 089012db4d536880, lost connection 
2017-02-23 23:05:26.422 MDM_CLUSTER_CONNECTED     	INFO     	The MDM, ID 089012db4d536880, connected 
2017-02-24 15:54:16.141 MDM_CLUSTER_LOST_CONNECTION 	WARNING  	The MDM, ID 089012db4d536880, lost connection 
2017-02-24 15:54:16.238 MDM_CLUSTER_CONNECTED    	INFO     	The MDM, ID 089012db4d536880, connected 

 

 

SDS Sorunları:

 - SDS'nin bağlantısı kesilecek ve bir süre sonra sürekli olarak yeniden bağlanacaktır

2017-02-15 13:18:16.881 SDS_RECONNECTED           INFO     	 SDS: siosds2 (ID 1eb052fe00000001) reconnected
2017-02-16 03:37:37.327 SDS_DECOUPLED             ERROR    	 SDS: siosds2 (id: 1eb052fe00000001) decoupled.
2017-02-16 03:39:54.300 SDS_RECONNECTED           INFO     	 SDS: siosds2 (ID 1eb052fe00000001) reconnected
2017-02-17 04:03:41.757 SDS_DECOUPLED             ERROR    	 SDS: siosds2 (id: 1eb052fe00000001) decoupled.
2017-02-17 04:09:13.604 SDS_RECONNECTED           INFO     	 SDS: siosds2 (ID 1eb052fe00000001) reconnected

 

 - SDS, diğer SDS düğümleriyle bağlantı kaybıyla ilgili olarak trc dosyalarında salınım hataları gösterebilir:

14/02 19:13:24.096983 1be7eb8:contNet_OscillationNotif:01675: Con 1eb052fe00000005 - Oscillation of type 5 (RPC_LINGERED_1SEC) reported
14/02 19:13:24.196814 1be7eb8:contNet_OscillationNotif:01675: Con 1eb053000000000b - Oscillation of type 5 (RPC_LINGERED_1SEC) reported
14/02 19:13:24.296713 1be7eb8:contNet_OscillationNotif:01675: Con 1eb0530000000007 - Oscillation of type 5 (RPC_LINGERED_1SEC) reported
14/02 21:48:43.917218 afb28eb8:contNet_OscillationNotif:01675: Con 1eb052fe00000007 - Oscillation of type 1 (SOCKET_DOWN) reported
14/02 21:48:43.917296 afb28eb8:contNet_OscillationNotif:01675: Con 1eb052fe00000005 - Oscillation of type 1 (SOCKET_DOWN) reported

 

 - SDS, trc dosyalarında kilitlenmemiş veya sıkışmış iş parçacıkları gösterebilir: 

 
14/02 19:13:24.147938 9aa4eeb8:netPath_IsKaNeeded:01789: DEBUG ASSERT, Reason:Socket deadlocked. Crashing.
14/02 19:13:24.148113 9aa4eeb8:netPath_IsKaNeeded:01789: DEBUG ASSERT, Reason:Socket deadlocked. Crashing.
14/02 19:13:24.148121 9aa4eeb8:netPath_IsKaNeeded:01789: DEBUG ASSERT, Reason:Socket deadlocked. Crashing.
 
14/02 20:52:54.097765 242f0eb8:kalive_StartIntr:00346: KA aborted due to stuck sched thread
14/02 21:48:43.510602 7fa30eb8:kalive_StartIntr:00346: KA aborted due to stuck sched thread
14/02 21:48:44.776713 1b67ceb8:kalive_StartIntr:00346: KA aborted due to stuck sched thread
 
14/02 02:44:41.532007 e2239eb8:contNet_OscillationNotif:01675: Con 1eb052fd00000001 - Oscillation of type 3 (RCV_KA_DISCONNECT) reported
14/02 02:44:43.799135 0:schedThrdGuard_SampleLivnes:01463: WARNING: pThread 0x1a0de10(0) in scheduler 0x7fff01bec400, running UMT 0x7f94e221eeb8, found to be stuck.
14/02 02:44:43.799155 0:schedThrdGuard_SampleLivnes:01463: WARNING: pThread 0x1a0e050(1) in scheduler 0x7fff01bec400, running UMT 0x7f94e2227eb8, found to be stuck.
14/02 02:44:43.799257 e0e38eb8:cont_IsSchedThredStuck:01678: Stuck scheduler thread identified
14/02 02:44:43.799267 e0e38eb8:kalive_StartIntr:00346: KA aborted due to stuck sched thread
 

 

 - SDS, trc dosyalarında "hata çatallaması" gösterebilir:

01/09 00:37:51.329020 0x7f1001c58eb0:mosDbg_BackTraceAllOsThreads:00673: Error forking.

 

 - Gerekli belleğin ayrılamaması nedeniyle SDS başlatılamıyor.
Aşağıdakiler exp günlük dosyalarında bildirilir:

07/09 00:41:52.713502 Panic in file /data/build/workspace/ScaleIO-SLES12-2/src/mos/usr/mos_utils.c, line 235, function mos_AllocPageAlignedOrPanic, PID 25342.Panic Expression pMem != ((void *)0) .

 

 - İşletim sisteminde /var/log/messages veya Sistem Olay günlüklerinde de bazı belirtiler olabilir:

/var/log/messages:
Feb  14 13:25:08 ScaleIO-192-168-1-2 kernel: [7461116.683555] TCP: Possible SYN flooding on port 7072. Sending cookies.
Feb  14 13:25:08 ScaleIO-192-168-1-2 kernel: [7461116.683561] TCP: Possible SYN flooding on port 7072. Sending cookies.
Feb  14 13:25:08 ScaleIO-192-168-1-2 kernel: [7461116.683566] TCP: Possible SYN flooding on port 7072. Sending cookies.
Feb  14 13:25:08 ScaleIO-192-168-1-2 kernel: [7461116.683570] TCP: Possible SYN flooding on port 7072. Sending cookies.
Feb  14 13:27:39 ScaleIO-192-168-1-2 kernel: [7461266.566145] sched: RT throttling activated

 

"Bağlantı noktası 7072'de SYN taşması" mesajları, ağ veri paketlerinin bu ana bilgisayardaki SDS'ye gönderildiğini ve SDS'nin bu bağlantı noktasındaki paketleri kabul edemeyeceğini gösterir. SDS varsayılan olarak 7072 numaralı bağlantı noktasını kullanır.
"RT kısıtlaması etkinleştirildi", işletim sistemi zamanlayıcısının CPU'yu tıkayan ve diğer iş parçacıklarını aç bırakan bazı Gerçek Zamanlı iş parçacıkları belirlediğini belirten bir mesajdır. İşletim sistemi bunu, bu gerçek zamanlı görevleri kısıtlamak ve işletim sisteminin kilitlenmesini veya çökmesini önlemek amacıyla yapar.  

 
 
SDC Sorunları:

SDC, SDS'lerin bağlantısı sık sık kesildiğinde veya SDC'ye yeterince hızlı yanıt veremediği halde sahip olduğu GÇ bloklarına servis sağlamaya çalıştığında da GÇ hatalarıyla karşılaşabilir.

 

Etki

Yukarıdaki belirtiler DATA_DEGRADED, DATA_FAILED olaylara ve CLUSTER_DEGRADED neden olabilir.

원인

Yukarıdaki tüm belirtiler eşleşiyorsa bu sorun muhtemelen bir CPU veya Bellek kaynağı açlık sorunudur. MDM veya SDS işlemlerinden CPU'yu ve belleği aç bırakan üçüncü taraf uygulamaları veya işlemleri arayın.

Sanal bir ortamda, CPU birkaç kez düşük performansa sahipti. Bunun nedeni, SVM'lerin aynı kaynak havuzu altında tanımlanmış olmasıdır.

Bu gibi durumlarda, SVM'leri kaynak havuzuna koymamayı, SVM'de tanımlandığı şekilde özel kaynaklarına sahip olmalarını tavsiye etmeliyiz.

해결

PowerFlex bileşenlerinin (MDM, SDS, SDC) performans ayarlarına göre ayarlandığından emin olun. Burada bulunan Performans "İnce Ayar" ve "Sorun Giderme" rehberlerine bakın.

 

Yapılandırma incelemesi:

  1. Öncelikle SVM CPU ve RAM ayarlarının en iyi uygulamaya uygun olduğunu doğrulayın: 
    1. SVM CPU ayarları: (Anında ayarlanabilir)
      1. Soket Başına Çekirdek: hepsi bir sokette, bu nedenle "Soketler" "1" değerine sahiptir. (Toplam çekirdek sayısı, barındırdığı SDS'nin ihtiyaçlarına göre belirlenir: All-flash, FG, DASCache, Cloudlink, 3.5 vb. işlemlerinin tümü CPU gereksinimini etkiler (artırır.)
      2. Rezervasyon: Açılır menüden "Maximum" değerini seçin
      3. Hisse: Yüksek
      4. Bu şöyle görünmelidir: 

SVM CPU ayarları

 

b. SVM RAM ayarları: (Anında ayarlanabilir)

  1. "Tüm konuk belleğini rezerve et (Tümü kilitli)" seçeneğini işaretleyin
  2. Hisse: Yüksek
  3. Bu şöyle görünmelidir:

SVM RAM ayarları

 

 

c. Konuk içi SVM OS belleği aşırı kullanım ayarları: (Yeniden başlatma gerektirir)

    1. Fazla kullanım ayarlarının doğru olduğunu onaylamak için sysctl -a|grep overcommit komutunu çalıştırın:
      # sysctl -a|grep overcommit
      vm.overcommit_memory = 2
      vm.overcommit_ratio = 100
    2. Yukarıdaki değerler ayarlanmazsa, bazı SVM bellekleri SDS işlemi için kullanılamaz. /etc/sysctl.conf dosyasını düzenleyerek ve yukarıdaki değerleri düzenleyerek/ekleyerek düzeltin

    3. SDS'yi bakım moduna alın ve ayarları uygulamak için SVM'yi yeniden başlatın
    4. Yeniden başlattıktan sonra "cat /etc/sysctl.conf|grep overcommit" komutunu çalıştırarak onaylayın
    5. Bakım modundan çıkma
  1. Bunları günlüklerde bulmak için:
    1. SVM yapılandırması (vmsupport):
      1. Doğru yapılandırılmış bir SVM'nin .vmx dosyası aşağıdakileri içerecektir:

sched.cpu.units = "mhz"
sched.cpu.affinity = "all"
sched.cpu.min = "25930"     (nonzero value that's equal to core speed * the # of cores allocated)
sched.cpu.shares = "high"
sched.mem.min = "24576"     (nonzero value that's a full allocation of configured memory)
sched.mem.minSize = "24576" (nonzero value that's a full allocation of configured memory)
sched.mem.shares = "high"
cpuid.coresPerSocket = "10" (value equal to total # of cores allocated, so they're all in one socket)
sched.mem.pin = "TRUE"

 

  1. Yanlış (güncel olmayan) SVM yapılandırmaları aşağıdakilere sahip olacaktır:
sched.cpu.min = "0"
sched.cpu.shares = "normal"
sched.mem.pin = "FALSE"
sched.mem.shares = "normal"
cpuid.coresPerSocket = "4" (value less than total # of cores allocated, usually 1/2 or 1/4)
 
Konuk içi işletim sistemi yapılandırması (getinfo):
  1. Doğru yapılandırılmış bellek aşırı yüklenmesi:

    Dosya sunucusu/sysctl.txt şunları içerir:

vm.overcommit_memory = 2
vm.overcommit_ratio = 100

 

  1. PowerFlex, her bir hizmetin bellekte ve yüksek hızda çalışması için önemli miktarda RAM kullanır. Bu nedenle, herhangi bir PowerFlex hizmetinin yükünü boşaltmak için kullanılacak takas kullanımını desteklemez.

    Bir HCI çözümünde Yalnızca Depolama ve SVM'ler için beklenen varsayılan ayar, 2 değerinde fazla kaynak ayırma belleğidir. Bu şekilde çekirdek, belleği aşırı yüklemez ve takas kullanılmamasına ilişkin ayarlar olmadan, hiçbir commit_as değerinin toplam boş/kullanılabilir bellekten büyük olmamasını sağlar.

    100 oranı, kullanılan takası engellemek için daha fazla kontrol için hiçbir takasın da kullanılmamasını sağlar.

  2. Yanlış yapılandırılmış bellek aşırı kullanımı:
    Dosya sunucusu/sysctl.txt şunları içerir:

vm.overcommit_memory = 0  (value not 2)
vm.overcommit_ratio = 50  (value less than 95)

 

Diğer olası geçici çözümler:

  1. CPU/bellek kaynağı açlığına neden olan uygulamaları durdurun veya kaynak tüketimini hafifletmek için güncellemeler için uygulama satıcısına danışın. 
  2. Kaynakları hangi uygulamanın aldığını bulmak için CPU/Bellek eğilim araçlarını (top/sar/cron işleri/vb.) kullanın. Sorunun ne zaman ortaya çıktığını ve kimin sorumlu olduğunu göstermek için gereken ayrıntı düzeyini elde etmek için 1 saniyelik aralıklar önerilir
  3. Daha fazla kaynak sağlamak için ana bilgisayar CPU'sunu ve/veya belleğini yükseltin
  4. Yakınsanmış bir sistem yerine iki katmanlı bir kuruluma yeniden mimari oluşturun (SDS/SDC aynı ana bilgisayardaysa)

추가 정보

문서 속성
문서 번호: 000167765
문서 유형: Solution
마지막 수정 시간: 24 11월 2025
버전:  5
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.