본문 바로가기
VMware/vSAN

vCenter가 죽은 상태에서 vSAN 복구 방법(2)

by 문방사우 2023. 12. 7.

안녕하세요. 문방사우입니다.

 

저번시간엔 진행 순서와 어떻게 진행해야하는지에 대해 글로 설명했다면, 실제 이미지와 함께 보여드리고자합니다.

 

이전 글에 대한 내용은 아래 링크 확인해주세요.

 

 

vCenter가 죽은 상태에서 vSAN 복구 방법(1)

안녕하세요. 문방사우입니다. 이번 시간엔 vSphere 환경에서 vCenter Server VM이 들어있는 ESXi 물리 장비가 죽었을때 복구하는 방법에 대해 다뤄보겠습니다. vSAN을 구성하여 가상화 환경을 구축하는

cloudnotepad.tistory.com


환경 소개

테스트 환경

 

테스트 환경 정보입니다.

3개의 노드가 vCenter1 에 연결되어있습니다.

testVM의 상태를 지속적으로 확인하여 vSAN의 상태를 체크합니다.

네트워크는 vDS로 구성했으며 vmk에 대한 정보는 아래와 같습니다.

  • vmk0 : 관리
  • vmk1 : vMotion
  • vmk2 : vSAN

장애 환경 구성

처음 정의한 환경을 구성하기위해 노드 1번의 전원을 껐습니다.

 

다음으로는 vCenter를 껐습니다.

 

testVM

vSAN Datastore에 배포되어있는 testVM도 정상적으로 동작하고있는것을 확인했습니다.


호스트 재구성 작업

노드 1번에 새로운 esxi를 설치했습니다.

 

초기화로 인한 네트워크 구성 차이

포트그룹을 생성하고 VMk NIC를 추가해주었습니다.

vSAN의 IP주소는 기존의 주소가 아닌 다른 남는 주소를 활용했습니다.

 

vSAN IP주소를 다르게 설정한 부분은 바로 다음에 설명드리겠습니다.

 

노드 1번 네트워크 설정

 


vSAN 설정

vmk NIC 설정이 끝났다면, 각 호스트의 SSH 서비스를 활성화합니다.

그 후 새로 설정한 노드가 아닌 vSAN이 동작중인 노드 2번, 3번에 접속합니다.

 

새로운 노드 1번을 기존 vSAN 환경에 연결하기위해 IP정보를 추가합니다.

각 노드에 vSAN unicast 설정을 추가, 삭제 작업을 진행합니다.

 

접속하여 아래 명령어를 입력합니다.

 

esxcli vsan cluster unicastagent list

 

위 이미지처럼 vSAN의 유니케스트 관련 정보를 확인할 수 있습니다.

이 부분에서 노드1번의 IP인 192.168.200.11가 남아있는걸 볼 수 있습니다.

 

이전 데이터가 남아있기 때문에 vmk 설정에서 다른 IP로 설정하였습니다.

 

새로운 노드 1번의 정보를 추가하는 명령어를 입력합니다.

esxcli vsan cluster unicastagent add -t node -u <Host_UUID> -U true -a <Host_VSAN_IP> -p 12321

 

UUID의 정보는 새로 변경한 노드에 ssh로 접속하여 아래 명령어를 입력합니다.

cmmds-tool whoami

 

추가 후 기존 노드 1번의 IP가 등록되어있는 데이터를 삭제하는 명령어를 입력합니다.

esxcli vsan cluster unicastagent remove -a <Host_VSAN_IP>

 

노드 3번에서 동일한 작업을 진행했습니다.

추가를 완료한 사진입니다.

 

이젠 노드 1번의 vmknic에 vSAN 태그를 붙여줄 차례입니다.

노드 2번의 vmknic 정보를 확인해보면 서비스에 vSAN이 있는걸 볼 수 있지만, 노드 1번에선 확인할 수 없습니다.

노드 1번(좌) 노드 2번(우) 서비스 비교

esxi의 웹페이지로는 vSAN 태그를 추가할 수 없습니다. CLI로 접속하여 명령어를 입력하면 vSAN 태그를 붙일 수 있습니다.

CLI로 노드 1번에 접속하여 vmk의 숫자를 잘 확인하고 아래의 명령어를 입력합니다.

esxcli network ip interface tag add -i <VMkernel adapter name> -t VSAN

 

태그 추가작업을 완료한 후 기존의 vSAN에 노드 1번을 조인하는 작업을 진행합니다.

 

vSAN이 동작중인 노드에 SSH로 접속하여 아래 명령어를 입력합니다.

esxcli vsan cluster get



Cluster Information
Enabled: true
Current Local Time: 2013-09-06T18:50:39Z
Local Node UUID: 521b50a1-ad57-5028-ad51-90b11c3dd59a
Local Node State: MASTER
Local Node Health State: HEALTHY
Sub-Cluster Master UUID: 521b50a1-ad57-5028-ad51-90b11c3dd59a
Sub-Cluster Backup UUID: 52270091-d4c9-b9a0-377b-90b11c3dfe18
Sub-Cluster UUID: 5230913c-15de-dda3-045e-f4d510a93f1c
Sub-Cluster Membership Entry Revision: 1
Sub-Cluster Member UUIDs: 521b50a1-ad57-5028-ad51-90b11c3dd59a, 52270091-d4c9-b9a0-377b-90b11c3dfe18
Sub-Cluster Membership UUID: f3b22752-f055-bcc5-c622-90b11c3dd59a

입력하게되면 위와 같은 값이 나올겁니다.

 

작업에 필요한 정보는 Sub-Cluster UUID 정보입니다.

 

UUID 정보를 복사한 후 노드 1번으로 돌아가 아래 명령어를 입력합니다.

esxcli vsan cluster join -u sub_cluster_UUID

 

조금의 시간이 지나면 vSAN 조인이 완료됩니다.

 

조인이 정상적으로 되었는지 확인하기 위해 위의 esxcli vsan cluster get 명령어를 노드 1번에 입력합니다.

 

정상적으로 값이 나오면 vSAN 조인이 완료되었습니다.


vSAN 클러스터 구성

이제는 vCenter와 연동하는 작업을 진행합니다.

 

새로 배포한 vCenter에 접속하여 클러스터까지 생성합니다.

클러스터 생성할 때 vSAN 옵션을 활성화 합니다.

vSAN 활성화

클러스터 생성 후 이전의 vSAN 설정과 동일하게 설정합니다.

 

설정작업 후 호스트를 추가하고, 클러스터에 연결합니다.

 

연결하면 아래와같이 보이게됩니다.

노드 1 추가 및 vSAN 재구성

노드 1번의 디스크 그룹도 정상적으로 사용 중인것으로 보입니다.

 

발생한 오류를 확인하여보면 "vCenter가 신뢰할 수 있는 상태임" 라고 떠있는것을 볼 수 있습니다.

 

vSAN에 대한 오류는 클러스터 - 모니터 - vSAN - Skyline 상태 탭으로 넘어가서 자세하게 확인할 수 있습니다.

 

vSAN 오류들

오른쪽 기본 문제 부분의 vCenter가 신뢰할 수 있는 상태임 부분을 클릭하면 아래와 같은 이미지를 볼 수 있습니다.

ESXI 구성 업데이트

작업이 완료되면 vSAN 상태가 정상으로 변경됩니다.

 

기존 노드 1번의 vSS 네트워크 구성을 vDS에 맞게 연결해주면 완료입니다.

 

정상적으로 복구가 되었다면 아래와 같은 이미지입니다.

vSAN 정상화

VM도 연결이 끊기지않고 정상적으로 동작하는것까지 확인했습니다.

 

노드 1번의 vSAN 관련 vmknic의 IP설정을 기존과 동일하게 설정하게되면 복구 작업 완료입니다.


 

이번엔 vSAN의 노드 장애로 인해 복구하는 방법에 대해 진행해보았습니다.

 

기회가 된다면 VMware 솔루션들의 장애 발생 시 조치 방법에 대해 다뤄보도록 하겠습니다.

 

감사합니다.

'VMware > vSAN' 카테고리의 다른 글

vSAN의 2-Node 클러스터 구성  (0) 2024.03.22
vCenter가 죽은 상태에서 vSAN 복구 방법(1)  (0) 2023.12.04
VMware vSAN 구축  (0) 2023.11.29
VMware vSAN 기초  (0) 2023.09.22