NetWorker:VMware 组失败,出现错误,无法从 vCenter 加载清单
Summary: NetWorker VMware 包含动态关联的组失败,并出现错误,无法从 vCenter 加载清单
Symptoms
1.与组类型关联的 NetWorker 工作流:VMware 且启用了动态关联(基于标记的关联),将失败,并出现错误 "Failed to load 入库"。
2.当尝试 "启动单个客户端" 时,工作流不会报告其下的虚拟机。
步.守护程序日志中显示了以下错误:
nsrdisp_nwbg NSR 关键库存会话状态返回故障。Error: "从 ' < vcenter name >" 中加载库存失败。无法加载类别/标记元数据:无法在 "HTTPS://< vCenter name >/rest/com/vmware/cis/session" 处登录 CIS 服务:Https://< vcenter 名称 >/rest/com/vmware/cis/session: net/http: request 已取消(客户端,等待标头时超时) '。nsrdisp_nwbg NSR 关键库存会话状态返回故障。Error: "从 ' < vcenter name >" 中加载库存失败。无法加载类别/标记元数据:无效内存地址或零指针取消引用 "已返回失败的清单会话状态。Error: "无法从" < vCenter 名称 > "加载资源。 无法加载类别/标记元数据: 无法将 REST 请求发送到 vCenter:Post https://< vCenter name >/rest/com/vmware/cis/tagging/tag-association/id: urn: vmomi: InventoryServiceTag:73f530b9-ea0b-48db-b657-c6cf308c2a53: GLOBAL? ~ action = 列表-附属-对象: net/http:请求已取消(客户端在等待标头时超时) '。
Cause
1.从来自 cs 的过时标签中 VCenter 失败。标识:
这可以通过在 vCenter CLI 上运行以下命令来识别。连接到 vCenter postgres 数据库:
/opt/vmware/vpostgres/current/bin/psql -d VCDB -U postgres
要查询与虚拟机关联的陈旧标签,请执行以下操作:
# select count (*) from cis_kv_keyvalue,其中 kv_provider 如 "标记:%" 和 kv_key 如 "tag_association urn: vmomi:虚拟机:%" 和 regexp_replace (kv_key,"tag_association urn: vmomi:虚拟机: vm-([0-9] +). * ',' \ 1 '):: bigint not in (从 vpx_vm 选择 id);
要查询与主机关联的陈旧标签,请执行以下操作:
# select count (*) from cis_kv_keyvalue,其中 kv_provider 如 "标记:%" 和 kv_key 如 "tag_association urn: vmomi: HostSystem:%" 和 regexp_replace (kv_key,"tag_association urn: vmomi: HostSystem: host-([0-9] +). * ',' \ 1 '):: bigint not in (select id from vpx_host);
2.VAPI 端点因内存 crunch 和转储堆内存故障而 vCenter 失败:
这可以通过在 vCenter CLI 上运行以下命令来确定:
# ls-ltrh * hprof * |awk {"print $9"} java_pid62528. hprof java_pid45649. hprof java_pid36715. hprof java_pid2514. hprof java_pid43896. hprof java_pid52081. hprof
上面的每个对应于您在守护程序上注意到错误的时间。登录 NetWorker。
Resolution
通过以下建议,应由 VMware 管理员解决上述每种情况:
1。过时的标签:
要清除过时的标签:
a。停止 vpxd & 内容库服务:
服务-control--stop vmware-vpxd service-control--stop vmware-content-library
b.连接到 vCenter postgres 数据库
/opt/vmware/vpostgres/current/bin/psql -d VCDB -U postgres
要删除过时的标签:
从 cis_kv_keyvalue 中删除 kv_provider 如 "标记:%" 和 kv_key 类似 "tag_association urn: vmomi:虚拟机:%" 和 regexp_replace (kv_key,"tag_association urn: vmomi:虚拟机: vm-([0-9] +). * ',' \ 1 '):: bigint not in (select id from vpx_vm)返回 kv_key,kv_value;从 cis_kv_keyvalue 中删除 kv_provider 如 "标记:%" 和 kv_key 类似 "tag_association urn: vmomi: HostSystem:%" 和 regexp_replace (kv_key,"tag_association urn: vmomi: HostSystem: host-([0-9] +). * ',' \ 1 '):: bigint not in (select id from vpx_host)返回 kv_key,kv_value;从 cis_kv_keyvalue 中删除 kv_provider 如 "标记:%" 和 kv_key 类似 "tag_association urn: vmomi:数据存储:%" 和 regexp_replace (kv_key,"tag_association urn: vmomi:数据存储:数据存储区-([0-9] +)。 *","\ 1"):: bigint not in (select id from vpx_datastore)返回 kv_key,kv_value;
。请再次运行两次选择查询命令,以确保计数为0。
b.启动服务:
服务-control--start vmware-vpxd service-control--start vmware-content-library
c. 注销 vCenter 会话,并再次登录并验证环境、标签、NSX、备份、配置等。
如果 vCenter 看起来不正常,请使用命令 "vc support" 从 vCenter 收集日志,然后联系 VMware。
2.VAPI 崩溃:
对.识别分配给 VAPI 的内存并增加如果内存过低,则可以通过 VMware 支持来确定最佳实践。
#cloudvm ram-大小-l |grep-i vapi vmware-vapi-端点 = 256
更改为:
#cloudvm ram-大小-l |grep-i vapi vmware-vapi-端点 = 1120