首页> 系统技术> ESXi紫屏分析

[文章]ESXi紫屏分析

收藏
1 3139 0

【摘要】
        VMware的虚拟化技术是相对成熟的产品,vsphere 也已经更新到6.5版本。但在日常使用中难免会有发生一些故障。其中有一类故障,ESXi紫屏是让人头痛的问题。本文将针对ESXi的紫屏进行诊断,探讨如何去分析一个紫屏文件,介绍一些紫屏分析的案例。
【正文】
一、案例分析1
        下图为一个紫屏文件和我们从中提取的信息。

        在该紫屏文档中,我们可以获取到产品的版本:ESXi 6.0.0-3620759。
        获取到错误的类型:PCPU 1:no heartbeat (3/3 IPIs received)
        可以通过官方对紫屏错误类型的诊断进行排查 ,以下是官方定义的的常见的错误类型,此类型为检测信号的无响应。类似于lost heartbeat。lost heartbeat更常见于内存溢出。

        出错时 CPU 上运行的环境(进程) *PCUP14:1049950/vmm4:VM(vmid):调用PCPU的虚拟机信息。
        VMK uptime: 10:22:45:16,963:系统正常运行了10天22小时。
        堆栈跟踪:DVFilter Shm Do Tx And Pending Rx @com.vmware.vmkapi
        出错时 VMkernel 正在执行的操作: Shm内存等待vmkapi接口调用。
        其他报错信息:NMI IPI received.Was eip(base):ebp:cs
        此为vsan6.0常见错误,在 vSAN 6.0 修补程序版本 ESXi600-201706001中已解决。
        结论:该故障可能为vsan6.0故障导致的内存错误,建议升级到ESXi新版本。

二、案例分析2

        获取产品的版本:ESXi 5.0.0-469512。
        获取到错误的类型:PF Exception 14 in world 9804:vmm0:gz-bgvc IP 0x418005094ebf addr 0xc
        可以通过官方对紫屏错误类型的诊断进行排查 ,以下是官方定义的的常见的异常的定义:

        以下是完整的异常列表:
    • 异常类型 0 #DE:除法错误(Divide Error)
    • 异常类型 1 #DB:调试异常
    • 异常类型 2 NMI:不可屏蔽中断
    • 异常类型 3 #BP:断点异常
    • 异常类型 4 #OF:溢出(INTO 指令)
    • 异常类型 5 #BR:界限检查(BOUND 指令)
    • 异常类型 6 #UD:Opcode 无效
    • 异常类型 7 #NM:协处理器不可用
    • 异常类型 8 #DF:双重故障
    • 异常类型 10 #TS:TSS 无效
    • 异常类型 11 #NP:分段不存在
    • 异常类型 12 #SS:堆栈分段错误
    • 异常类型 13 #GP:一般保护错误
    • 异常类型 14 #PF:页面错误
    • 异常类型 16 #MF:协处理器错误
    • 异常类型 17 #AC:对齐检查
    • 异常类型 18 #MC:计算机检查异常
    • 异常类型 19 #XF:SIMD 浮点异常
    • 异常类型 20-31:预留
    • 异常类型 32-255:用户定义(时钟调度程序)
  • 出错时 CPU 上运行的环境(进程) *PCUP9:9804/vmm0::gz-bgvc:gz-bgvc在调用PCPU资源。
  • VMK uptime: 154:00:21:23,560:系统正常运行了154天0小时。
  • 其他报错信息:Recursive panic on same CPU(cpu 9,world 9804)
  • 递归不稳定通常是由于主机硬件问题所致。ESXi 5.x 内核已进行了许多改进,软件缺陷触发递归不稳定的可能性非常小。

三、总结
        我们可以从紫屏文件的描述信息中,获取一些基本信息。包括ESXi版本、报错的类型、报错时CPU运行的程序、系统正常运行的时间。这些信息有助于我们定位故障的类型。堆栈信息和其他详细的报错内容可以协助我们定位详细的故障原因。紫屏信息通常只是我们分析问题的一个方式,更多的详细信息需借助日志文件排查。
系统技术
最近热帖
{{item.Title}} {{item.ViewCount}}
近期热议
{{item.Title}} {{item.PostCount}}