virtualization/VMware

[VMware vSphere 4.x] ESXi <-> 스토리지사이의 iSCSI 에러

yueisu 2012. 8. 6. 13:43

VMware vSphere 4.x + iSCSI 스토리지 환경에서 스토리지의 패스가 Dead 상태로 변할 경우가 있습니다. 심할 경우 ESXi가 "Not Respoding" 상태가 되며, 가상머신에의 접속이 불가능해지게 됩니다. 이 경우 ESXi의 /var/log/messages에는 다음과 같은 메시지가 기록됩니다.

vmkernel: 15:20:19:21.132 cpu1:3946687)WARNING: VMW_SATP_LSI: satp_lsi_pathIsUsingPreferredController: Failed to get volume access control data for path "vmhba35:C7:T0:L1": Timeout

또는

vmkernel: 15:20:22:12.949 cpu0:3946687)WARNING: VMW_SATP_LSI: satp_lsi_pathIsUsingPreferredController: Failed to get volume access control data for path "vmhba35:C7:T0:L2": Transient storage condition, suggest retry

위와 같은 메시지는 DELL사의 MD32xxi. MD36xxi 스토리지를 이용할 경우 발생합니다. 현재 VMware사에도 이슈를 인식, 대응중으로 KB도 공개되어있습니다.


■ 원인

VMware사로부터의 회답은 다음과 같습니다.

스토리지측의 firmware가 EVPD 페이지에 대한 Inqury 명령에 대해 타임아웃 제한 시간인 5초이내에 응답을 하지않았기에

message에 대량의 로그가 기록되며 토리지의 부하가 높아질 경우는 응답지연이 발생하거나 LUN에의 패스가 끊어진다고 합니다.


■ 해결방법

① DELL 사에도 위의 문제를 인식하고 있었으며, 패치를 적용한 최신의 MD32xxi. MD36xxi firmware(버전 07.80.62.60)를 공개하고 있었습니다. 우선은 해당 스토리지의 firmware를 최신으로 적용하셔야 됩니다.

② ESXi에도 패치를 적용해야됩니다. 단지, 위의 현상에 대한 패치는 8월말이후 릴리스될 Update 3에 포함될 예정이라고 합니다.


현시점(8월 6일)의 상황으로 말하자면, 우선 스토리지의 firmware를 최신으로 올리고, ESXi의 Update 3이 릴리스되면 ESXi로 업데이트를 실시해야 됩니다.


PS 1.> MD3000i 에서도 위와 같은 로그와 현상이 일어났습니다만 최신의 firmware에서 대응되었는지, 향후 릴리스될 Update 3로 개선이 될지는 불확실합니다.

PS 2.> EVPD는 하드웨어/소프트웨어의 설정 정보가 기록되어있는거 같습니다.