virtualization/VMware

[VMware] Network dump collector 테스트시의 불가사의한 현상

yueisu 2016. 2. 22. 23:43

vSphere의 장해 테스트를 할 경우, ESXi의 PSOD를 모의로 발생시켜 덤프화일이 정상적으로 생성되는지를 확인하는 방법이 있습니다.


얼마전 도입을 마치고 최종 테스트를 실행하는 환경이 있었죠. 현장에서 테스트를 담당했던 필드 엔지니어로 부터 연락이 왔습니다.

ESXi를 크래쉬시켜 네트워크 덤프를 확인했지만 덤프가 생성되지 않는다라고 말이죠. 또한 모의 크래쉬를 실행한 ESXi를 재시작했더니 콘솔화면이 표시되지않고 "dump"라는 메시지만 표시된다는 것이었습니다. 


???


우선 네트워크 덤프가 생성되지 않는 것에 대해서 확인을 했습니다.  설정에는 전혀 문제가 없었으며 "esxcli system coredump network check"의 실행결과도 전혀 문제가 없었습니다. 혹시나해서 ESXi를 재시작한 경위를 확인했습니다. 그랬더니 필드 엔지니어로부터 의외의 대답이... "덤프 생성이 완료된 것을 확인하지 않았다"는 것이었습니다. 정확히는 덤프 생성중에 ESXi를 재.시.작. 했던 것이었습니다.   

덤프가 생성되지않는 이유는 알았습니다.  다음에는 ESXi의 콘솔화면이 표시되지 않고 "dump"라는 메시지만 표시되는 문제였습니다.

재차 필드 엔지니어에게 확인을 해보니, "dump"메시지가 표시는 되지만 F2를 누르면 정상적으로 로그인 화면이 표시되며, vCenter상에서도 해당 ESXi는 정상이라니, 단순히 콘솔상 표시의 문제인 듯 하더군요.


불가사의한 현상이죠. 관련 정보를 찾으려고 KB와 커뮤니티를 검색해보니 다음과 같은 커뮤니티의 정보를 확인할 수 있었습니다.

ESXi 5.1 PSOD and login screen missing


버전도 다르고 표시되는 메시지도 달랐습니다만, 상황은 똑같았습니다. 그래서 해당 ESXi의 설정을 확인해보니...

welcome message에 "dump"가 설정되어있더군요. 허허

"dump"를 삭제했더니 바로 콘솔에 적용이 되어 정상적인(?) 콘솔화면으로 돌아왔습니다.

문제는 왜? "dump"라는 문자가 설정되었는지였습니다. 물론 설정을 한 기억도 없습니다. 조사를 하려면 VMware의 지원을 받는게 가장 쉬운 방법입니다만, 장해도 아니고 현상 자체도 해결되었기 때문에 고객에게 보고후 대응을 종료했죠.


덤프 생성 테스트를 할 경우 참고하시고 비슷한 현상으로 고생하지 마시길...