vCenter 6.7 High Availability Bölüm-2

vCenter 6.7 High Availability Bölüm-1 makalesinde vCenter HA yapılandırma gereksinimleri ve Yapılandırma adımlarını anlatmaya çalışmıştık.

Bu makalede ise vCenter HA Yapılandırmasını yönetme, olası sorunlarda ortamınızda sorunları giderme yöntemlerine değineceğiz.

vCenter HA Node’ların Kapatılması ve Yeniden Başlatılması :

Cluster’daki tüm node’ları kapatıp yeniden başlatmanız gereken bir durum olduğunda , Passive Node’un Active Node rolünü almasını önlemek için belirli bir kapatma sırasını izlemeniz gerekir.

Shut down:

Shut down Prosedürü asağidaki gibidir:

1-Passive node

2-Active node

3-Witness node

Reboot:

Herhangi bir sirayla vcenter HA node’lar reboot edilebilir.

Active,Passive ve Witness Node’ların Cluster’a başarıyla katıldığını ve önceki Active Node’un bu rolü sürdürdüğünü doğrulamayı unutmamak gerekir.

vCenter HA Cluster Yapılandırmasını Düzenleme :

vCenter HA Deployment tamamlandığında High Availability Protection için Passive ve Witness Node’lar oluşturuldu.

vCenter HA aktif olduktan sonra “EDIT ” tıklanarak Maintenance Mode’u etkinleştirebilir veya vCenter HA Enable /Disable edebilirsiniz.

Mode Automatic Failover Manual failover Replication
Enable vCenter HA
Yes Yes Yes varsayılan çalışma modudur, vCenter Server appliance Automatic Failover gerçekleştirerek donanım ve yazılım hatalarından korur.

Active ve Passive Node arasında replikasyon sağlar. Cluster sağlıklı bir durumda ise, Active Node’muz Passive Node ile Automatic Failover özelliği sayesinde korunur.

Maintenance Mode
No Yes Yes Bazı bakım görevleri için kullanılır.

Maintenance Mode’da , Active ve Passive Node’lar arasında replikasyon devam eder, ancak, Automatic Failover devre dışıdır.

Disable vCenter HA
No No No Replikasyon ve failover işlemlerini devre dışı bırakır. Cluster yapılandırmasını korur. Daha sonra vCenter HA’yı tekrar etkinleştirebilirsiniz.

Cluster Maintennace veya Disable Mode’da çalışıyorsa, Active node, Passive ve Witness Node’lar kaybolsa veya erişilemese bile istemci isteklerini sunmaya devam eder.

vCenter HA Failover Başlatma :

Manuel olarak bir failover başlatabilir ve Passive Node’un Active Node haline gelmesini sağlayabiliriz.

vCenter Ha Cluster 2 şekilde failover destekler :

Automatic Failover:

Passive Node , Actice node ‘un bir hata durumunda aktif rölünü almaya çalışır.

Manuel Failover :

Kullanıcı , Initiate Failover butonunu tıklayarak Passive Node’u Active Node olmaya zorladığı işlemdir.

Sorun giderme ve test işlemleri için Manuel Failover yapılır.

Manuel Failover Prosedürü aşağıdaki gibidir:

vCenter Server login olduktan sonra vCenter seçili iken ” Configure /vCenter HA “ yolu izlenerek

“INITIATE FAILOVER” butonu tıklanır.

Initiate vCenter HA failover ekranında senkronizasyon olmadan Failover işlemi zorlama seçeneği çıkar.

Önerilen senkronizasyonu yapmaktır. “INITIATE FAILOVER ” tıklanarak işleminin başlaması sağlanır.

Failover işlemi sonrası bir sorun oluşmamış ise Passive node Active node rolü alacaktır.

vCenter HA Node Backup ve Restore Operasyonları :

vCenter HA Cluster’daki Active Node ‘un yedeklenmesi gerekmektedir.

Passive ve Witness Node yedeklenmemelidir.

Active Node’un restore işleminden önce cluster yapılandırılması kaldırılmalıdır.

Restore işleminden önce vCenter HA Node’ları power-off edilmeli ve silinmelidir.

Active node restore edildikten sonra vCenter HA yeniden konfigure edilmelidir.

vCenter HA Konfigurasyonunun Silinmesi :

Bir vCenter HA yapılandırmasını vSphere Client ‘dan kaldırabilirsiniz.

1- vCenter Server login olduktan sonra vCenter seçili iken ” Configure /vCenter HA “ yolu izlenerek

“REMOVE VCENTER HA” butonu tıklanır.

.

2- Remove vCenter HA ekranında “OK” tıklanır.

Passive ve Witness node’ların sanal makinelerinin silinmesi için ” Delete Passive and Witness node VMs ” seçilmelidir.

Active Node Standalone vCenter Server Appliance olarak çalışmaya devam edecektir.

Passive ve Witness node’lar yeni bir vCenter HA yapılandırmasında kullanılamaz.

Active Node’a eklenen ikinci NIC yapılandırma da eklenmiş olsa bile kaldırma işleminde bu NIC sunucudan kaldırılmaz.

Bozulmuş vCenter Ha Cluster Ortamında Sorun Giderme:

Bir vCenter HA Cluster’ın sağlıklı olması için, Active,Passive ve Witness Node’ların her biri tam olarak çalışır durumda olmalı ve vCenter HA Cluster Network’ü üzerinden erişilebilir olmalıdır.

Node’lardan herhangi biri başarısız olursa, Cluster ( degraded state) bozulmuş durumda kabul edilir.

Passive Node failover sırasında Active Node haline gelmez ise, Passive Node’u Active Node olmaya zorlayabiliriz.

Passive Node, Active Node rolünü almak istediğinde başarısız olabilir ve failover başarılı olmayabilir.

Örneğin, Passive Node,Active Node rolünü almak istediğinde Witness Node herhangi bir sebepten dolayı Kullanılmaz hale gelmiş olabilir.

Veya Node’lar arasında bir sekronizasyon sorunu olabilir.

Bu sorunlardan aşağıdaki gibi kurtarabilirsiniz:

1- Active Node hata çözülüp kurtarılırsa, tekrar Active Node olur.

2-Witness Node hatası çözülürse;

a-Virtual Machine Console ‘dan Passve Node’a login olunur.

b-Appliancsh komut istemcisinde “shell” girilir.

c-“vcha-reset-primary”komutu çalıştırılır.

d-Passive Node Restart edilir.

3-Active Node ve Witness Node hatadan kurtarılamazsa Passive Node Standalone vCenter Server Appliance olmaya zorlanır.

a-Active ve Witness Node silinir.

b- Virtual Machine Console ‘dan Passve Node’a login olunur.

c- Appliancsh komut istemcisinde “shell” girilir.

d-“vcha-destroy” komutu çalıştırılır.

e-Passive Node restart edilir.

VMware vCenter HA Alarm’lar ve Olaylar :

vCenter HA Cluster bozulmuş durumdaysa, alarmlar ve olaylar hatalar gösterir.

Vmware vCenter Ha logları /var/log/vmware/vcha lokasyonunda bulunur.

The following events will raise VCHA health alarm in vpxd:

Event Name

Event Description

Event Type

Category

vCenter HA cluster state is currently healthy

vCenter HA cluster state is currently healthy

com.vmware.vcha.cluster.state.healthy

info

vCenter HA cluster state is currently degraded

vCenter HA cluster state is currently degraded

com.vmware.vcha.cluster.state.degraded

warning

vCenter HA cluster state is currently isolated

vCenter HA cluster state is currently isolated

com.vmware.vcha.cluster.state.isolated

error

vCenter HA cluster is destroyed

vCenter HA cluster is destroyed

com.vmware.vcha.cluster.state.destroyed

info

The following events will raise PSC HA health alarm in vpxd:

Event Name

Event Description

Event Type

Category

PSC HA state is currently healthy

PSC HA state is currently healthy

com.vmware.vcha.psc.ha.health.healthy

info

PSC HA state is currently degraded

PSC HA state is currently degraded

com.vmware.vcha.psc.ha.health.degraded

info

PSC HA is not monitored after vCenter HA cluster is destroyed

PSC HA state is not being monitored

com.vmware.vcha.psc.ha.health.unknown

info

Cluster Status Related Events

Event Name Event Description
Event Type Category
Node {nodeName} joined back to the cluster

One node joined back to the cluster

com.vmware.vcha.node.joined

info

Node {nodeName} left the cluster

One node left the cluster

com.vmware.vcha.node.left

warning

Failover succeeded

Failover succeeded

com.vmware.vcha.failover.succeeded

info

Failover cannot proceed when cluster is in disabled mode

Failover cannot proceed when cluster is in disabled mode

com.vmware.vcha.failover.failed.disabled.mode

warning

Failover cannot proceed when cluster does not have all three nodes connected

Failover cannot proceed when cluster does not have all three nodes connected

com.vmware.vcha.failover.failed.node.lost

warning

Failover cannot proceed when vPostgres on Passive node is not ready to takeover

Failover cannot proceed when Passive node is not ready to takeover

com.vmware.vcha.failover.failed.passive.not.ready

warning

vCenter HA cluster mode changed to {clusterMode}

vCenter HA cluster mode changed

com.vmware.vcha.cluster.mode.changed

info

Database replication-related events

Event Name Event Description Event Type Event Type

Database replication mode changed to {newState}

Database replication state changed: sync, async or no replication

com.vmware.vcha.DB.replication.state.changed

info

File replication-related events

Event Name

Event Description

Event Type

Event Type

Appliance {fileProviderType} is {state}

Appliance File replication state changed

com.vmware.vcha.file.replication.state.changed

info

Back to Top