พาวเวอร์สเกล: ฐานข้อมูลงานกําลังรายงานว่าถูกล็อกหรือรอนานในการสืบทอดตําแหน่ง

Summary: ระดับการป้องกันของฐานข้อมูลงานบนคลัสเตอร์ขนาดใหญ่อาจทําให้เกิดปัญหาในการเข้าถึงฐานข้อมูลรายงาน

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

งานกําลังเข้าสู่สถานะรอหลายครั้ง

การอัปเดตฐานข้อมูลใช้เวลานานจึงจะเสร็จสมบูรณ์

ใน isi_job_d.log และ messages.log จะเห็นข้อความเกี่ยวกับเวลารอนานการล็อกฐานข้อมูลและการกระโดดโหนดผู้ประสานงานงานที่เป็นไปได้เป็นประจํา

อาการที่ 1:     
isi_job_d.log รายงานการรอคอยที่ยาวนานในการอัปเดตที่สําเร็จ:     

isi_job_d[45179]: Reports database update (job state) succeeded but took 11272 ms

อาการที่ 2:     
ฐานข้อมูลรายงาน isi_job_d.log ถูกล็อก:     

isi_job_d[97274]: Failed to update Jobs (state): database is locked

อาการที่ 3:     
ผู้ประสานงานงานสลับโหนดเป็นประจํา:      

2018-05-02T02:00:48Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[31517]: Becoming job engine coordinator
2018-05-02T02:11:26Z <24.5> cluster01-33(id52) cluster01-33 isi_job_d[36865]: Becoming job engine coordinator
2018-05-02T02:25:39Z <24.5> cluster01-33(id52) cluster01-33 isi_job_d[37310]: Becoming job engine coordinator
2018-05-02T02:36:25Z <24.5> cluster01-37(id56) cluster01-37 isi_job_d[77098]: Becoming job engine coordinator
2018-05-02T02:38:24Z <24.5> cluster01-37(id56) cluster01-37 isi_job_d[77167]: Becoming job engine coordinator
2018-05-02T02:43:33Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[32917]: Becoming job engine coordinator
2018-05-02T02:59:58Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[33518]: Becoming job engine coordinator
2018-05-02T03:02:44Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[33782]: Becoming job engine coordinator
2018-05-02T03:08:02Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[33969]: Becoming job engine coordinator
 

Cause

  1. ฐานข้อมูล (reports.db) ได้รับการอัปเดตอย่างต่อเนื่องเนื่องจากงานระยะยาวที่สร้างการอัปเดตจํานวนมาก
  2. การอัปเดตไฟล์ทุกครั้งจะทําหกครั้งทั่วทั้งคลัสเตอร์ การลดระดับการป้องกันลงทําให้การอัปเดตเร็วขึ้น
  3. ขึ้นอยู่กับระยะเวลาที่หยุดชั่วคราวใน isi_papi_d เราคาดว่าจะเห็นการหมดเวลาของผู้ประสานงานในการเขียนไปยังฐานข้อมูล (การบันทึก) นอกจากนี้ยังอาจประสบความสําเร็จ แต่บันทึกว่าการเขียนใช้เวลานานกว่าที่ต้องการเข้าสู่ระบบ isi_job_d.log ในทั้งสองกรณี

 

ในการกําหนดระดับการป้องกันของการใช้ reports.db

isi get -DD

 

cluster01-16# isi get -DD /ifs/.ifsvar/modules/jobengine/reports.db
POLICY   W   LEVEL PERFORMANCE COAL  ENCODING      FILE              IADDRS
8x        8     6x concurrency off   UTF-8         reports.db        <25,14,1575794508288:512>, <26,17,484528026624:512>, <26,31,924241684480:512>, <27,31,145164204544:512>, <28,30,2451893562880:512>, <29,29,6440579584:512> ct: 1506750730 rt: 0
*************************************************
* IFS inode: [ 25,14,1575794508288:512, 26,17,484528026624:512, 26,31,924241684480:512, 27,31,145164204544:512, 28,30,2451893562880:512, 29,29,6440579584:512 ]
*************************************************
...
*  Protection Policy:  8x
*  Target Protection:  6x                  <-- six times protection

 

Resolution

ฝ่ายวิศวกรรมของ Dell กําลังตรวจสอบปัญหานี้ บทความนี้จะได้รับการอัปเดตเมื่อมีข้อมูลเพิ่มเติม

เมื่อต้องการหลีกเลี่ยงปัญหานี้ ให้เรียกใช้คําสั่งต่อไปนี้เพื่อเปลี่ยนระดับการป้องกันของฐานข้อมูลรายงานงานเป็นดังนี้:   

  1. หยุดงานวิ่งชั่วคราว ตรวจสอบว่าไม่มีงานที่กําลังทํางานด้วยคําสั่ง: สถานะงาน ISI
  2. ปิดใช้งานเอ็นจิ้นงานและตรวจสอบว่า isi_job_dตายในทุกโหนด:    
isi services -a isi_job_d disable
isi_for_array -sX 'ps auxww |grep -i isi_job_d |grep -v grep'
  1. เปลี่ยนระดับการป้องกันของ reports.db เป็นรูปแบบการเข้าถึงแบบสุ่ม:      
isi set -r -g reprotect -a random -p 3x -F /ifs/.ifsvar/modules/jobengine/reports.db
  1. การเรียกใช้ isi get -DD อีกครั้งควรยืนยันว่า reports.db มีการเปลี่ยนแปลง:     
cluster01-16# isi get -DD /ifs/.ifsvar/modules/jobengine/reports.db
POLICY   W   LEVEL PERFORMANCE COAL  ENCODING      FILE              IADDRS
3x       3      3x random off   UTF-8         reports.db        <25,14,1575794508288:512>, <26,31,924241684480:512>, <29,16,157594713088:512> ct: 1506750730 rt: 0
*************************************************
* IFS inode: [ 25,14,1575794508288:512, 26,31,924241684480:512, 29,16,157594713088:512 ]
*************************************************
*...
*  Protection Policy:  3x
*  Target Protection:  3x
  1. เปิดใช้งานกลไกงาน:     
isi services -a isi_job_d enable
isi_for_array -sX 'ps auxww |grep -i isi_job_d |grep -v grep'
  1. ทํางานต่อ ข้อความใน isi_job_d.log ควรลดลง
ด้านบนควรถอด reports.db เป็น 3x ทันที อย่างไรก็ตาม ผู้ใช้บางรายอาจกําหนดค่างาน Smartpools ให้ทํางานกับไฟล์ 'ทั้งหมด' แทนที่จะเป็น 'ค่าเริ่มต้น'

จะตรวจสอบได้อย่างไร?

ในบันทึกเต็ม:
[xus25@elvis 2021-09-24-003]$ cat local/isi_storagepool_settings
     Automatically Manage Protection: all  <<<<
Automatically Manage Io Optimization: all 
...
บนคลัสเตอร์สด
steven-8220-1# isi storagepool settings view
     Automatically Manage Protection: all  <<<<
Automatically Manage Io Optimization: all 
...
เมื่อตั้งค่า 'จัดการโดยอัตโนมัติ' เป็นทั้งหมด งาน Smartpools ถัดไปอาจเปลี่ยน reports.db กลับไปเป็นมิเรอร์
6x หรือ 8xเพื่อหลีกเลี่ยงปัญหานี้ เราขอแนะนําให้ตั้งค่า 'จัดการการป้องกันโดยอัตโนมัติ' เป็น 'files_at_default'
เมื่อตั้งค่าเป็น 'files_at_default' งาน SmartPools จะข้ามไฟล์ที่มีการจัดการด้วยตนเองซึ่งหมายความว่าจะทําให้ reports.db มีระดับการป้องกันที่เราระบุ

Additional Information

Affected Products

PowerScale, Isilon

Products

Isilon, Isilon NL410
Article Properties
Article Number: 000066019
Article Type: Solution
Last Modified: 17 Sep 2025
Version:  16
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.