virtualization/VMware

[vSphere] 트러블 톱10 (1)

yueisu 2011. 11. 24. 15:51
11월 8.9일 일본에서 vForum에서 공개된 세션의 내용입니다.
vSphere의 서포트 의뢰가 자주 오는 문의사항 톱10이랍니다. 정보 공유차원에서 간단히 소개하겠습니다.

1. vCenter상에서 ESX/ESXi가 "Not Responding" 상태가 됨
  : vCenter에서 ESX/ESXi 로부터의 하트비트가 60초동안 없을 경우 발생. 자연 복귀의 경우는 신경쓰지 않아도 됨.
   자주 발생할 경우는 vCenter <-> ESX/ESXi 간의 네크워크를 의심할 것...

2,  스냅숏 관련 (KB1025279 참고)
  : 스냅숏은 백업이 아님. 업데이트나 패치적용등 가상머신 멘테넌스시 이용.
   스냅숏은 24~72시간 이상 사용하지 말 것.
   스냅숏의 체인은 2-3개가 적당. 

3. vCenter의 DB 용량 관련
  : vCenter의 DB 용량이 커져버림.
    vCenter의 설정에서 "Statistics"나 "Database Retention Policy" 를 변경하여 퍼포먼스, 태스크, 이벤트 로그의 용량       을 조절...

4.  HA 에이전트 에러 관련
  : 원인은 HA 프로세스의 크래쉬, 네트워크, 구성 에러등 여러가지...
    하지만 대부분 "Reconfigure for vSphere HA"을 실행하여 AAM 모듈을 새로 구성하는 것이 정석... --;;;

5.  클러스터내의 호스트 LUN이 APD 상태가 되었을 경우, 데이터스토어의 rescan으로 다른 LUN의 가상머신의 응답이 없어짐
   :  APD(All Path Down) 상태가 되는 것은 스토리지와의 패스가 정상적으로 기능하지 않는 상황으로 대부분이 하드웨어에 원인이 있음. 이 APD 상태에서 스토리지나 스토리지 볼륨을 rescan하면 APD 상태가 아닌 LUN의 가상머신까지도 응답이 없어짐... 
   우선은 APD 상태의 스토리지의 복구할 것...
   ESX/ESXi 4.1 Update1에서 수정되어졌음... 이전 버전은 KB1016626 대로 따라하길... --;;;;

다음에 나머지 5개를 공유하도록 하겠습니다.

역시나 톱10은 일반적인 이용법에 대한게 많은거 같네요.