อวามาร์: วิธีการตั้งค่าเซิร์ฟเวอร์ Avamar เป็นสถานะควบคุมที่รู้จัก
摘要: บทความนี้อธิบายวิธีการตั้งค่าเซิร์ฟเวอร์ Avamar เป็นสถานะควบคุมที่รู้จัก
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
มีงานอัตโนมัติมากมายบนเซิร์ฟเวอร์ Avamar ซึ่งอาจส่งผลต่อการแก้ไขปัญหาและความพยายามใน
การแก้ปัญหาขั้นตอนนี้จัดทําเอกสารวิธีการใส่ Avamar ลงในสิ่งที่เรียกว่า "สถานะควบคุมที่ทราบ" เพื่อป้องกันไม่ให้กิจกรรมที่ไม่คาดคิดหรือไม่พึงปรารถนาเกิดขึ้น
ควรปฏิบัติตามรายการตรวจสอบด้านล่างเมื่อดําเนินการบํารุงรักษาด้วยตนเองและขั้นสูง เช่น:
นี่ไม่ใช่วิธีแก้ปัญหาการตรวจสุขภาพ สันนิษฐานว่าเซิร์ฟเวอร์ Avamar ไม่แข็งแรง
การแก้ปัญหาขั้นตอนนี้จัดทําเอกสารวิธีการใส่ Avamar ลงในสิ่งที่เรียกว่า "สถานะควบคุมที่ทราบ" เพื่อป้องกันไม่ให้กิจกรรมที่ไม่คาดคิดหรือไม่พึงปรารถนาเกิดขึ้น
ควรปฏิบัติตามรายการตรวจสอบด้านล่างเมื่อดําเนินการบํารุงรักษาด้วยตนเองและขั้นสูง เช่น:
- การสร้างลายเส้นใหม่
- การสร้างโหนดใหม่
- การรีสตาร์ทโหนดออฟไลน์
นี่ไม่ใช่วิธีแก้ปัญหาการตรวจสุขภาพ สันนิษฐานว่าเซิร์ฟเวอร์ Avamar ไม่แข็งแรง
原因
งานบํารุงรักษาด้วยตนเองหรือขั้นสูงต้องเรียกใช้บนเซิร์ฟเวอร์ Avamar
解决方案
ความระมัดระวัง: หากใช้ไม่ถูกต้องคําสั่งบางคําสั่งที่อ้างอิงด้านล่างอาจทําให้เกิดปัญหาความสมบูรณ์ของข้อมูลหรือข้อมูลสูญหาย หากคุณไม่เข้าใจคําสั่งหรือผลที่ตามมาของการเรียกใช้ ให้ขอความช่วยเหลือจาก ฝ่ายสนับสนุนของ Dell หรือตัวแทน
พันธมิตรของ Dell ในพื้นที่ของคุณข้อกําหนดเบื้องต้น:
พันธมิตรของ Dell ในพื้นที่ของคุณข้อกําหนดเบื้องต้น:
- คําสั่งทั้งหมดควรเรียกใช้ในฐานะผู้ดูแลระบบโดยโหลดคีย์ SSH ต่อบทความ Avamar: วิธีลงชื่อเข้าใช้เซิร์ฟเวอร์ Avamar และโหลดคีย์ต่างๆ
- คําสั่งบางอย่างอาจไม่ให้ข้อเสนอแนะหรือมีผลทันที ไม่จําเป็นต้องเรียกใช้คําสั่งมากกว่าหนึ่งครั้ง
- สําหรับใด ๆ
avmaint config --avaคําสั่ง ยืนยันเสมอว่าการเปลี่ยนแปลงมีผล เรียกใช้คําสั่ง:
avmaint config --ava | grep <setting>
- ควรหลีกเลี่ยงการบํารุงรักษาด้วยตนเอง อนุญาตให้ตัวกําหนดตารางเวลาการบํารุงรักษาจัดการงานบํารุงรักษาทุกครั้งที่ทําได้
- ควรตอบคําถามต่อไปนี้โดยใช้คําสั่งเหล่านี้เพื่อทําความเข้าใจสถานะทั่วไปของเซิร์ฟเวอร์ Avamar ก่อนที่จะทํางานกับระบบใดๆ
- ด่านที่ตรวจสอบล่าสุดอายุเท่าไหร่?
cplist
- ลายเส้นทั้งหมดออนไลน์หรือไม่? โหนดทั้งหมดออนไลน์หรือไม่
status.dpn
- บริการทั้งหมดขึ้นหรือไม่?
dpnctl status
- ตรวจสอบการบํารุงรักษาที่ทํางานอยู่และยกเลิกหากจําเป็น:
- ระงับกิจกรรมการบํารุงรักษาโดยใช้ตัวกําหนดตารางเวลาการบํารุงรักษาเพื่อให้แน่ใจว่าจะไม่เริ่มต้นอีกครั้งหลังจากหยุด
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
อย่าระงับ การเก็บขยะ (GC) เพราะอาจส่งผลให้มีการย้อนกลับโดยไม่จําเป็น
- เรียกใช้คําสั่งด้านล่างและตรวจสอบกิจกรรมการบํารุงรักษาที่กําลังทํางานอยู่
status.dpn
- หากด่านกําลังวิ่งอยู่ ให้ดําเนินการให้เสร็จสิ้น
- หาก HFScheck กําลังทํางานอยู่ สามารถหยุดได้หากเซิร์ฟเวอร์ไม่อยู่ในโหมดผู้ดูแลระบบ (เฟส waitcgsan) หรือ HFScheck เกือบเสร็จสมบูรณ์:
avmaint hfscheckstop --ava
- หาก GC กําลังทํางานอยู่ ก็สามารถฆ่าได้:
avmaint gckill --ava
การดําเนินการนี้อาจใช้เวลาสักครู่จึงจะเสร็จสมบูรณ์เนื่องจากบัตรผ่านปัจจุบันจะต้องเสร็จสิ้น
- เมื่อไม่มีการบํารุงรักษาอีกต่อไป ควรหยุดตัวกําหนดตารางเวลาการบํารุงรักษา:
dpnctl stop maint
- หยุดตัวกําหนดตารางเวลาการสํารองข้อมูล หยุดเรียกใช้การสํารองข้อมูลหรือคืนค่า และระงับการเชื่อมต่อใหม่:
- ป้องกันไม่ให้ MCS เริ่มการสํารองข้อมูลใหม่:
dpnctl stop sched
- แสดงรายการข้อมูลสํารองที่ทํางานอยู่ทั้งหมด:
avmaint sessions --ava | grep sessionid
หากการคืนค่าอื่นที่ไม่ใช่การจําลองแบบกําลังทํางานอยู่ ให้ปรึกษากับผู้ใช้เพื่อพิจารณาว่าควรอนุญาตให้การคืนค่าเสร็จสมบูรณ์หรือไม่
- เมื่อได้รับการอนุมัติจากผู้ใช้ว่าการสํารองข้อมูลสามารถฆ่าได้อย่างหมดจด (สร้างการสํารองข้อมูลบางส่วน) โดยใช้ UI หรือใช้อย่างไม่สะอาด:
avmaint kill -waittime=0 <sessionid>
- แสดงรายการข้อมูลสํารองเพิ่มเติมที่ไม่ได้แสดงโดยคําสั่งก่อนหน้า:
avmaint sessions --full
- ขึ้นอยู่กับการดําเนินการที่จะดําเนินการอาจไม่เป็นที่ยอมรับสําหรับการดําเนินการประเภทการสํารองข้อมูลใด ๆ ที่จะเรียกใช้ (นั่นคือ avmaint getrefby) ดังนั้น ให้ระงับผู้มอบหมายงานเพื่อไม่อนุญาตให้สํารองข้อมูลด้วยตนเอง:
avmaint suspend
- หยุดการจําลองแบบ (แหล่งที่มาหรือเป้าหมายการจําลองแบบ)
- สําหรับแหล่งการจําลองแบบ (คืนค่า) ให้ใช้ UI หรือ EM หรือฆ่ากระบวนการเพื่อหยุดการจําลองแบบ
- สําหรับเป้าหมายการจําลองแบบ (การสํารองข้อมูล) ให้ตรวจสอบว่าการจําลองแบบกําลังทํางานอยู่หรือไม่:
avmaint sessions | grep path
- มองหาโดเมน /REPLICATE ในเส้นทาง หยุดการจําลองแบบบนกริดต้นทางโดยใช้วิธีการในขั้นตอนที่ 4a
- ปิดการกระทืบด้วยคําสั่ง:
avmaint config --ava asynccrunching=false
อาจใช้เวลาถึง 15 นาทีในการหยุดการกระทืบ ให้ตรวจสอบบันทึก GSAN จากโหนดข้อมูลเพื่อหาข้อความ "กระทืบ"
- ปิดการปรับสมดุล
- ตรวจสอบว่าการปรับสมดุลกําลังทํางานอยู่หรือไม่:
avmaint config --ava | grep balancemin
โดยปกติแล้ว ไม่ควรเปิดใช้งานการปรับสมดุล (ค่าใดๆ นอกเหนือจาก 0) แต่ก็ยังเป็นสิ่งสําคัญที่ต้องตรวจสอบ
- ในการปิดใช้งานการปรับสมดุล:
avmaint config --ava balancemin=0
อาจใช้เวลาถึง 15 นาทีในการหยุดการทรงตัว ให้ตรวจสอบ status.dpn เพื่อดูว่ามีแถบใดกําลังโยกย้ายเพื่อยืนยันว่าการปรับสมดุลเสร็จสิ้นหรือไม่
- ตรวจสอบความจุ:
- ตรวจสอบความจุของระบบปฏิบัติการ:
avmaint nodelist --ava | grep fs-perc
- ตรวจสอบขนาดของจุดตรวจ:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- ตรวจสอบรายชื่อจุดตรวจเพื่อพิจารณาว่าต้องเก็บจุดตรวจใด (จุดตรวจที่ตรวจสอบแล้วล่าสุดในทุกโหนด):
cplist
ขึ้นอยู่กับผลลัพธ์ข้างต้นกําหนดจํานวนจุดตรวจที่สามารถเก็บไว้ได้จุดใดที่สําคัญและสามารถสร้างจุดตรวจใหม่ได้กี่จุด
สําหรับข้อมูลเกี่ยวกับความจุ โปรดดูบทความ Avamar: แนวคิดการจัดการขีดความสามารถและการฝึกอบรม
- ทําให้ตัวเองตระหนักถึงลําดับของโหนดและความแตกต่างระหว่างหมายเลขโหนดลอจิคัลและหมายเลขโหนดจริง:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- ตรวจสอบฮาร์ดแวร์
- งานอัตโนมัติทั้งหมดควรหยุดลงแล้ว
- เซิร์ฟเวอร์ควรมีกิจกรรมเพียงเล็กน้อย และควรดําเนินการกับงานหรือคําสั่งที่ต้องทําด้วยตนเองได้อย่างปลอดภัย
ตรวจสอบเซิร์ฟเวอร์โดยตรวจสอบบันทึก GSAN ทั่วทั้งโหนดข้อมูล ตรวจสอบว่ามีการบันทึกกิจกรรมเพียงเล็กน้อยหรือไม่มีเลย
คําสั่ง uptime ยังสามารถเรียกใช้โดยใช้ mapall เพื่อตรวจสอบว่า "ค่าเฉลี่ยโหลด" ทั่วทั้งโหนดข้อมูลต่ํา (ระหว่าง 0.01 ถึง 0.05)
ตัวอย่างเช่น:
ตัวอย่างเช่น:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01ขั้นตอนข้างต้นตั้งค่าเซิร์ฟเวอร์เป็นสถานะที่ไม่ใช่การผลิต เปลี่ยนกลับการเปลี่ยนแปลงเสมอ เมื่องานที่ต้องทําด้วยตนเองทั้งหมดเสร็จสิ้น
受影响的产品
Avamar, Avamar Server文章属性
文章编号: 000170876
文章类型: Solution
上次修改时间: 06 8月 2025
版本: 15
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。