NetWorker: NetWorker의 테이프 라이브러리 문제 해결
요약: 이 문서는 NetWorker 지원 관리자와 NetWorker 백업 관리자가 테이프 라이브러리 관련 문제에 접근하고 해결하는 데 도움을 주기 위해 작성되었습니다.
지침
테이프 라이브러리 문제를 조사하기 전에 다음 사항을 고려해야 합니다.
- 테이프 드라이브는 미디어에서 데이터 및 레이블을 읽고 쓰며 모든 미디어 기능을 제공하지만 테이프 카트리지 자체를 이동할 수 없습니다
- Tape LIBRARIES는 미디어 테이프 카트리지를 요소 간에 이동합니다. 드라이브, 슬롯 및 가져오기 및 내보내기 포트를 지원하며 데이터를 읽거나 쓰지 않습니다.
테이프 카트리지를 이동할 수 없어 NetWorker 작업이 실패하는 경우 다음과 같은 몇 가지 일반적인 원인이 있을 수 있습니다.
- 라이브러리 로봇 또는 내부의 하드웨어 또는 펌웨어 문제
- 전송을 통한 NetWorker 호스트에서 라이브러리 로봇으로의 연결 문제
- NetWorker 호스트와 라이브러리 간의 OS, 드라이버 또는 호환성 문제
- 테이프 라이브러리 유형, 상태 및 주소 지정과 관련된 NetWorker 구성 문제
다음 단계를 시간순으로 수행하면 문제의 특성을 확인하고 해결할 수 있습니다. 이 문서로 문제를 해결할 수 없는 경우 문제의 범위를 좁히고 전문가가 작업을 계속할 수 있도록 테스트를 제공합니다.
1. 환경 정보
NetWorker Server 및 영향을 받는 스토리지 노드에서 다음을 수행합니다.
- 호스트 이름, OS 유형 및 버전
- NetWorker 버전 및 빌드 번호.
- '
inquire테이프 및 라이브러리를 표시하는 ' 명령입니다. - 현재 압축된 복사본
nsrdb(롤백을 위해 필요한 경우 현재 주크박스 정보 보존)
리눅스:/nsr/res/nsrdb
Windows(기본값):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - 스토리지 노드, 라이브러리의 NetWorker 이름 및 영향을 받는 노드, 디바이스 및 볼륨 목록
- 문제의 공통점(특정 볼륨, 특정 드라이브, 특정 노드 등)
nsrget -o:d 영향을 받는 서버 및 노드에서.
-o:d 테이프를 쓰는 데 사용 중인 테이프가 있는 모든 호스트에서 NMC(NetWorker Management Console)의 모니터링 -> 디바이스에서 확인할 수 있습니다.
다음 문서에서는 NSRGET을 가져오고 사용하는 방법에 대한 정보를 제공합니다. NetWorker: NSRGet NetWorker 데이터 수집 툴을 사용하는 방법
2. 라이브러리의 준비도 테스트
- 영향을 받는 라이브러리의 스토리지 노드 소유자가 활성화되어 있고 준비되었는지 확인합니다.
- NMC에서 Devices ->Storage Nodes로 이동합니다.
- 보기 ->진단 모드가 활성화되어 있는지 확인합니다.
- 오른쪽 창에서 Enabled 및 Ready 열을 확인합니다.
- 활성화되어야 할 스토리지 노드가 활성화되지 않은 경우 스토리지 노드를 마우스 오른쪽 버튼으로 클릭하고 활성화/비활성화 를 클릭하여 활성화 합니다.
- 스토리지 노드가 1분 또는 2분 내에 준비 상태가 되지 않으면 별도로 후속 조치를 취해야 합니다. 라이브러리의 스토리지 노드에 액세스할 수 없어 라이브러리가 응답하지 않습니다.
- 영향을 받는 라이브러리가 활성화되어 있고 준비되었는지 확인합니다.
- NMC에서 디바이스 ->라이브러리로 이동합니다.
- 보기 ->진단 모드가 활성화되어 있는지 확인합니다.
- 오른쪽 창에서 Enabled 및 Ready 열을 확인합니다. 라이브러리가 Ready 상태로 표시되면 [
4]. - 활성화되지 않은 경우 왼쪽의 라이브러리 인스턴스를 마우스 오른쪽 버튼으로 클릭하고 '활성화/비활성화'를 선택하여 다시 활성화할 수 있습니다.
- 활성화되면 1-2분 정도 기다렸다가 라이브러리 컨테이너를 다시 클릭하고 '준비' 열에 녹색 체크 표시가 나타나는지 확인합니다.
- 라이브러리가 준비되지 않으면 왼쪽의 라이브러리 인스턴스를 마우스 오른쪽 버튼으로 클릭하고 Properties를 선택한 다음 General 탭에서 Control Port 값이
scsidev@#.#.#에서 볼 수 있는 주소inquire명령어와 동일한 방식으로 AUTHC를 사용합니다. - Control Port가 일치하지 않으면 Enabled를 No로 설정하고 OK를 클릭합니다. 그런 다음 속성을 다시 입력하고 Control Port를
inquire주소가 검색되었습니다. 제어 포트를 업데이트한 후 Enabled를 Yes로 다시 변경하고 OK를 다시 클릭하여 다시 활성화합니다. 라이브러리가 준비 상태가 되는지 확인할 수 있도록 1분 또는 2분 정도 기다립니다. - 마지막으로, 제어 포트 값을 수정한 후 라이브러리가 준비 상태가 되는 것을 허용하지 않는 경우 마지막으로 라이브러리의 속성을 입력합니다. 고급( Advanced ) 탭에서 디버그 트레이스 레벨(Debug Trace Level ) 을 5 로 설정합니다. 및 비활성화 했다가 다시 활성화 하여 데몬 로그에서 2분 동안 시작 시퀀스를 캡처합니다.
섹션에서 라이브러리를 다시 활성화하는 경우 [2.2]에서 다음을 확인합니다. nsrlcpd 대상 스토리지 노드에서 시작합니다. 또한 독립적으로 중지되거나 다시 시작되지 않는지 확인하십시오. PID(프로세스 ID)가 계속 변경되면 소프트웨어 또는 덤프 코어에 의해 프로세스가 중지되거나 종료되었음을 나타냅니다. 또한 시작을 방해할 수 있는 서버와 스토리지 노드 간의 이름 확인 문제에 주의하십시오. 서버에서 노드에 대해 확인하는 이름은 노드의 고유한 nsrladb 이름 및 노드에 대한 서버 이름과 일치해야 합니다.
- 라이브러리 준비 문제에 대한 고급 문제 해결 정보는 NetWorker에서 테이프 라이브러리 준비 문제 해결 을 참조하십시오.
- 자세한 내용은 NetWorker 문제 해결 가이드를 참조하십시오. 프로세스의 충돌 및 코어 덤프 노드의
nsrexecd,nsrsnmd또는nsrlcpd코어 덤핑입니다.
NetWorker 호스트별 프로세스에 대한 자세한 개요는 다음을 참조하십시오. NetWorker 프로세스 및 포트
이러한 서비스와 관련된 메시지는 호스트의 daemon.raw파일로 교체합니다.
- Linux:
/nsr/logs/daemon.raw - Windows(기본값):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker: nsr_render_log 사용하여 .raw 로그 파일을 렌더링하는 방법
3. 라이브러리의 응답성 결정:
라이브러리가 준비되지 않고 원인을 파악할 수 없는 경우 라이브러리 자체에 연결할 수 있는지 확인합니다.
- 각 노드 풀을
inquire[1.3]를 선택하고 출력에 라이브러리가 'Autochanger'로 나타나는지 확인한 다음 SCSI를 기록해 둡니다.#.#.#주소. - 라이브러리가
inquire출력에서 OS가 이를 감지할 수 있는지 확인하십시오. NetWorker에서 라이브러리가 구성되고 활성화된 경우 Solaris 호스트에서 라이브러리를 보고하지 않습니다. 자세한 내용은 Troubleshooting Tape Library Detection Problems in NetWorker를 참조하십시오. - 라이브러리가 기본 라이브러리 명령에 응답하는지 확인합니다. [
3.1]에서 다음을 실행합니다. 'sjisn #.#.#'. 라이브러리 테스트 명령에 대한 자세한 내용은 NetWorker의 테이프 라이브러리 액세스 문제 해결을 참조하십시오. - SJI 명령이 실패할 경우 전송 또는 하드웨어 문제의 가능성을 고려하십시오. 자세한 내용은 NetWorker의 테이프 라이브러리 하드웨어 문제 해결을 참조하십시오.
- OS가 라이브러리를 검색하지 않고 SJI 명령에 올바르게 응답하여 NetWorker가 검색하지 못하는 것이 문제인 경우
jbconfig명령 및 옵션 2 선택; 그래도 문제가 해결되지 않으면 옵션 4를 시도하고 수동으로 라이브러리 주소를 제공하고 표준 라이브러리로 구성합니다(옵션 56). 자세한 내용은 NetWorker의 테이프 라이브러리 구성 문제 해결을 참조하십시오.
4. 테이프 이동 및 볼륨 상태 테스트
라이브러리가 준비되고 응답하는 것처럼 보이지만 볼륨을 로드하는 데 문제가 있는 경우 다양한 원인이 있을 수 있습니다.
- 가능하면 전체 라이브러리를 비우십시오. 다른 작업을 중지할 수 있는 경우 마우스 오른쪽 버튼을 클릭하고 디바이스 ->라이브러리 탭에서 라이브러리를 재설정합니다.
- 단일 테이프 카트리지를 단일 장치에 로드하려고 시도하는데, 이 경우 두 장치 모두 로드 문제의 영향을 받는 것으로 생각됩니다. 필요에 따라 각 시도 후 언로드합니다.
- 다른 드라이브의 동일한 볼륨 및 영향을 받는 것으로 생각되는 드라이브의 다른 볼륨과 비교합니다. 오류 및 패턴(있는 경우)을 기록합니다.
- 디바이스에 관계없이 볼륨 로드에 안정적으로 실패하는 경우 다음 레이블 검사를 시도합니다.
- 마운트하지 않고 볼륨 로드 테이프 카트리지가 오류 없이 작동하면 암이 기계적으로 작동하는지 확인한 것입니다.
- Windows 업그레이드를 실행하라는 프롬프트에 아래 내용이 표시될 때까지
nsrmm -pv -f networker_device확인된 레이블로 응답하면 미디어도 유효하고 정상임을 확인한 것입니다. - 라이브러리의 속성에서 Diagnostic Mode가 활성화된 상태에서 Timers 탭으로 이동하고 Load Sleep을 60으로 설정한 후 OK를 클릭합니다.
- 볼륨을 언로드한 다음 이제 성공하면 볼륨을 다시 로드하려고 시도합니다. 문제는 타이밍 문제일 수 있습니다(다시 실패하기 시작할 때까지 더 낮은 절전 값으로 실험할 수 있음).
- 만일
nsrmm명령이 실패했습니다. 추가 테스트가 필요합니다. 마우스 오른쪽 버튼을 클릭하고 Enable/Disable을 선택하여 NMC에서 해당 드라이브를 비활성화합니다.- 다음의
scanner장치에 대한 명령:- NetWorker Server의 로컬 스토리지 노드에서 다음을 실행합니다.
scanner -nizv local_device - "원격" NetWorker Storage Node에서 다음을 실행합니다.
scanner -s server -nizv local_device
- NetWorker Server의 로컬 스토리지 노드에서 다음을 실행합니다.
- ~ 20 줄 후에 중단하고 레이블 읽기 메시지를 확인하십시오. 성공은 다음과 같이 표시됩니다.
8936:scanner: scanning media_type tape volume_name on device_name파일의 무결성을 확인합니다. - 만약
scanner예기치 않은 파일 번호, 원함 2, higher_number 데이터 손실이 발생했으며 SCSI 재설정으로 인한 것일 수 있습니다. NetWorker에서 덮어쓴 레이블 및 SCSI 재설정 문제 해결을 확인합니다.
- 다음의
- 만일
scannera를 반환합니다.message 8945:scanner: Read: -1 bytes볼륨을 다른 노드 또는 드라이브에서 읽을 수 있는지 확인하고 문제의 추세를 파악합니다. 일부 노드에서는 일부 볼륨을 읽을 수 있지만 다른 노드에서는 읽을 수 없으며 디바이스가 LTO-4 이상인 경우 드라이브 암호 해독 실패를 고려하십시오. LTO 하드웨어 암호화 및 NetWorker.
고급 미디어 검증 정보는 다음을 참조하십시오. NetWorker의 미디어 마운트 문제 해결
5. 드라이브 순서 문제 테스트
로드 및 마운트 명령이 성공하지만 레이블 읽기 또는 단순 마운트가 실패하는 경우 잘못된 드라이브 순서가 문제일 수 있습니다.
- 가능하면 전체 라이브러리를 비우십시오. 다른 작업을 중지할 수 있는 경우 마우스 오른쪽 버튼을 클릭하고 디바이스 ->라이브러리에서 라이브러리를 재설정합니다.
- 단일 테이프 카트리지를 단일 장치에 로드하려고 시도하는데, 이 경우 두 장치 모두 로드 문제의 영향을 받는 것으로 생각됩니다. 필요에 따라 각 시도 후 언로드합니다.
- 다른 드라이브의 동일한 볼륨 및 영향을 받는 것으로 생각되는 드라이브의 다른 볼륨과 비교합니다. 오류 및 패턴(있는 경우)을 기록합니다.
- 로드가 안정적으로 실패하는 경우 다음 레이블 검사를 시도합니다.
라이브러리 로드 문제에 대한 고급 지원은 다음을 참조하십시오. NetWorker
의 테이프 라이브러리 로드 문제 해결이러한 모든 테스트가 실패했고 더 이상 실패하지 않으면 이 문서의 각 단계별 결과를 문서화하고 NetWorker 지원 팀에 문의하십시오. 솔루션을 신속하게 편집하고 "반복되는 단계"를 제한하려면 명확한 세부 정보가 필수적입니다.