
vSphere 4 Update 2에서 등장할(?) HA의 새로운 기능

yueisu 2010. 3. 31. 21:54
이란 타이틀의 기사가 소개되었네요.

새롭게 등장(이라기 보다는 보완일지도 모르겠네요)할 새로운 기능은 이른바 HA에 의한 핑퐁 현상을 방지해주는 기능이랍니다. 
이 핑퐁 현상이 무엇이냐면 말입니다.(어설픈 실력이라, 제대로 이해가 되었는지 모르겠군요)

예를들어 호스트 서버 ESX001이 장애로 인해 격리되었다고 하죠. 이 격리된 호스트 서버가 소속되어있는 HA 설정의 [가상머신 옵션]중 "호스트 격리시의 대응" 옵션에 'Power on 상태를 유지' 옵션을 선택한 경우, 호스트 서버는 네트워크 상에서 격리가 되었을지언정 가상머신들은 power on 상태가 지속된답니다. 이 경우는 이 가상머신들의 전원을 끌수 없다는군요. 15초후 스토리지상의 각 가상머신의 vmdk 화일의 lock 상태가 타임아웃되어, 같은 HA 클러스터 그룹내의 호스트 서버로주터 격리된 ESX001상의 가상머신들이 재기동됩다고 합니다.

문제는 호스트 서버 ESX 001이 장애로부터 복구, 네트워크상에 복귀했을 경우 발생한다고 하는군요. ESX001의 메모리상에는 동작중이었던 가상머신들의 vmx 프로세스가  남아있기 때문에 가상머신이 ESX001와 다른 호스트 서버 사이에서 이동을 반복하는 현상이 핑퐁 현상이라고 하는군요.

vSphere 4에서는 vmdk 화일의 lock 상태가 타임아웃되면 가상머신의 전원을 어찌할건지 물어보는 멧세지 복스가 뜬다고는 합니다만, vCenter가 아닌 ESX로 직접 vSphere Client를 접속했을 경우에만 해당이 된다고 하네요. --; 

이러한 문제를 Update 2는 자동응답 기능으로 해결하도록 한다는거 같습니다. 쿨럭

원문은 다음과 같습니다.

4 Hosts – iSCSI / NFS based storage – Isolation response: leave powered on

When one of the hosts is completely isolated, including the Storage Network, the following will happen:

Host ESX001 is completely isolated including the storage network(remember iSCSI/NFS based storage!) but the VMs will not be powered off because the isolation response is set to “leave powered on”. After 15 seconds the remaining, non isolated, hosts will try to restart the VMs. Because of the fact that the iSCSI/NFS network is also isolated the lock on the VMDK will time out and the remaining hosts will be able to boot up the VMs. When ESX001 returns from isolation it will still have the VMX Processes running in memory. This is when you will see a “ping-pong” effect within vCenter, in other words VMs flipping back and forth between ESX001 and any of the other hosts.

As of version 4.0 ESX(i) detects that the lock on the VMDK has been lost and issues a question if the VM should be powered off or not. Please note that you will(currently) only see this question if you directly connect to the ESX host. Below you can find a screenshot of this question.

With ESX 4 update 2 the question will be auto-answered though and the VM will be powered off to avoid the ping-pong effect and a split brain scenario! How cool is that…