virtualization/etc

[NexentaStor] Hang up 에러

yueisu 2012. 8. 23. 18:07

NexentaStor를 iSCSI 스토리지로 이용하고 있는 고객 인프라에서 얼마전 장애가 발생했습니다.

상황은 다음과 같았습니다.

ESXi는 물론 가상 머신에 접속불가

NexentaStor 컨솔 접속 불가, SSH 불가, 웹관리툴인 NMV 접속불가

하지만, ping 정상 소통...


결국 서버를 강제 셧다운 -> 기동으로 복구했습니다만, messages에 아무런 로그도 남아있지 않았습니다. 근본적인 원인을 모르는 상황이기에 복구가 되었어도 찜찜했죠.


복구후 SSH로 접속해서 이런 저런 로그를 살피다보니 nms.log 화일에 다음과 같은 에러가 남아있더군요.

 fault trigger 'memory-check (E3)' failed 2 times, 3 left until the configured maximum is reached

지푸라기라도 잡는 심정으로 검색을 하니 NexnetaStor 포럼에서 다음과 같은 을 찾아냈습니다.


질문자도 같은 현상이었습니다. 

관계자(?)의 답변에 의하면 버그(?) 인거 같습니다. 3.0.5 버전에서 발생한다고 하더군요. 패치가 공개되기 전까지는 다음과 같은 방법으로 회피를 할 수 있다고 내용이었습니다.

① NMV -> Data Management -> Runners 로부터 "Volume-Check" 폴트 트리거를 무효화

또는

  NMV -> Data Management -> Runners 로부터 "Volume-Check" 폴트 트리거의 [Enable_ddt_size_check] 값을 "0"로 변경

   ※ ②의 경우는 콘솔(내지는 SSH)상에서 "setup trigger volume-check property enableddtsize_check -p 0 -y" 실행도 가능합니다.


일단 ②으로 대응후 재발하는지 확인중입니다.