PowerFlex 4.6 Birden çok bölme yeniden başlatmaya devam ediyor
Summary: Salt Depolama (SO) ve Salt Bilgi İşlem (CO) Kaynak Grubu (RG) yeni dağıtımı veya 4.6.1'e yükseltme sırasında ve sonrasında birden çok pod yeniden başlatılmaya devam ediyor.
Symptoms
PowerFlex Manager 4.6.1'in yeni dağıtımı veya SO ve CO düğümlerinin 200+ düğümüyle 4.6.1'e yükseltme
Yeniden başlatma sırasındaki ekran görünümü bellek yetersizliğini gösteriyor:
Etki
- Kararsız sistem durumu ve kullanıcı arayüzü yanıt vermiyor/kullanılamıyor
Cause
PowerFlex Manager Platform (PFMP) sürüm 4.6.1 ve üzeri sürümlerdeki bir yazılım sorunu nedeniyle, 200'den fazla düğümü olan sistemler (hem SO hem de CO) daha önce duyurulandan daha fazla bilgi işlem kaynağı gerektirir: 28 CPU çekirdeği ve 64 GB bellek.
Resolution
Kapatma prosedürü
- MVM'de oturum açın ve veritabanını durdurmak için aşağıdaki komutları çalıştırın:
- Veritabanı durumunu doğrulayın:
kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1) echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown":true}}' - Veritabanının kapalı olduğunu doğrulayın:
echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
- Veritabanı durumunu doğrulayın:
- MVM'yi kapatın
MVM kaynaklarını güncelleştirme
Yeni dağıtımlar veya 4.6.1'e yükseltmeler için MVM düğümlerinin ek bellek ve CPU gereksinimlerini karşılaması gerekir:
- CPU - 28 çekirdek
- Bellek: 64 GB
Açma prosedürü
- Tüm MVM'leri açın
- Her MVM'de, rke2-server hizmetinin durumunu kontrol etmek için aşağıdaki komutu çalıştırın:
kubectl get nodesrke2-server durumuna bağlı olarak aşağıdakileri yapın:rke2 sunucusunun durumu
Atılması gereken adım
Active (Etkin)
Sonraki adıma geçin
Etkinleştirme
Etkin olana kadar rke2-server durumunu kontrol etmek için komutu tekrarlayın.
Failed
Aşağıdaki komutu çalıştırarak hizmeti başlatmayı deneyin:
systemctl start rke2-server - rke2 sunucusu tüm MVM'lerde etkin olduğunda, tüm düğümlerin hazır durumda olduğundan emin olun:
kubectl get nodes - Düğümler hazır olduğunda bir sonraki adıma geçin. Bir hata mesajı görüntülenirse, birkaç dakika bekleyin ve tekrar deneyin.
- Küme izleme operatörü (CMO) veritabanını geri yükleyin:
kubectl config set-context default --namespace=$(kubectl get pods -A | grep -m 1 -E 'platform|pgo|helmrepo|docker' | cut -d' ' -f1) kubectl -n powerflex patch $(kubectl -n powerflex get postgrescluster -o name) --type merge --patch '{"spec":{"shutdown": false}}' - CMO veritabanını doğrulayın:
echo $(kubectl get pods -l="postgres-operator.crunchydata.com/control-plane=pgo" --no-headers -o name && kubectl get pods -l="postgres-operator.crunchydata.com/instance" --no-headers -o name) | xargs kubectl get -o wide
- Küme izleme operatörü (CMO) veritabanını geri yükleyin:
- PowerFlex yönetim platformu durumunu izleyin:
- PowerFlex yönetim platformu monitör yardımcı programının bağlantı noktası numarasını belirlemek için aşağıdaki komutu çalıştırın:
kubectl get services monitor-app -n powerflex -o jsonpath="{.spec.ports[0].nodePort}{\"\n\"}" - 20-30 dakika bekleyin ve PowerFlex yönetim platformunun genel sağlık durumunu kontrol edin.
- PowerFlex yönetim platformu monitör yardımcı programının bağlantı noktası numarasını belirlemek için aşağıdaki komutu çalıştırın:
- http://< düğüm IP>:p ort/ konumuna gidin; burada düğüm IP adresi, MVM'lerden herhangi birinde yapılandırılmış bir yönetim IP adresidir (Giriş veya PowerFlex Yöneticisi IP adresi değil).
- PFMP durumuna tıklayın ve tüm girişlerin yeşile dönmesini bekleyin.
- PFMP ana kullanıcı arayüzü artık erişilebilir olacaktır (Bazen 20 ila 30 dakika bekleyebilir).
Etkilenen Sürümler
PFMP 4.6.1
Düzeltildiği Sürüm
PFMP 4.8