No obstante, si el problema persiste, siga estos pasos.
a. Compruebe el registro de sucesos web de XCC para identificar la unidad defectuosa y el tipo de
problema (consulte
b. Recopile los datos de servicio de XCC (consulte
354).
c. Ejecute xpu-smi para realizar el diagnóstico (consulte
software/xpu-manager.html
d. Póngase en contacto con el servicio de Lenovo.
Especificaciones del sensor de la GPU de XCC
Cuando vea un suceso en el registro de sucesos web de XCC, consulte la siguiente tabla para identificar la
unidad defectuosa y el tipo de problema. Por ejemplo:
6 | 01/08/2021 | 14:34:53 | 0x0020 | Add-in Card GPU Board | Trasition to Critical from less severe | Asserted |0xA2F60F
Tabla 26. Especificaciones del sensor de la GPU de XCC
Nombre del sensor
Número de sensor
Tipo de sensor
Tipo de lectura del sensor
ID de entidad
Instancia/Tipo
Declaraciones registradas de
SEL
Cancelaciones de
declaraciones registradas de
CPU de GPU
SEL
Cancelaciones de
declaraciones de umbrales
Solicitud de LED 'ON' cuando
se hace una declaración
F = KED con error
Solicitud de LED 'OFF' cuando
se cancela una declaración
F = KED con error
330
Guía del usuario de la bandeja ThinkSystem SD650-I V3 Neptune DWC
"Especificaciones del sensor de la GPU de XCC" en la página
para obtener más detalles)
EAh
17h
07h
0Bh
02h
02h
02h
N/A
02h - F
02h - F
"Recopilación de datos de servicio" en la página
https://www.intel.com/content/www/us/en/
Fecha
02h - Transición de menos grave a crítico
Evt Data2:
B#h: Alerta térmica
BBh: Estado de presencia y alimentación
21h: Estado de enlace de PCIe
E0h: Recuento de GPU desde SMBIOS
3Ah: Sensor de estado de la tarjeta
Evt Data3:
XXh: Índice CORE de GPU, 01h: núcleo 1
0Ch: núcleo 3 + núcleo 4
ED2: B#h
ED3: ID de VR
330).