vCenter 6.7 High Availability Bölüm-2
vCenter 6.7 High Availability Bölüm-1 makalesinde vCenter HA yapılandırma gereksinimleri ve Yapılandırma adımlarını anlatmaya çalışmıştık.
Bu makalede ise vCenter HA Yapılandırmasını yönetme, olası sorunlarda ortamınızda sorunları giderme yöntemlerine değineceğiz.
vCenter HA Node’ların Kapatılması ve Yeniden Başlatılması :
Cluster’daki tüm node’ları kapatıp yeniden başlatmanız gereken bir durum olduğunda , Passive Node’un Active Node rolünü almasını önlemek için belirli bir kapatma sırasını izlemeniz gerekir.
Shut down:
Shut down Prosedürü asağidaki gibidir:
1-Passive node
2-Active node
3-Witness node
Reboot:
Herhangi bir sirayla vcenter HA node’lar reboot edilebilir.
Active,Passive ve Witness Node’ların Cluster’a başarıyla katıldığını ve önceki Active Node’un bu rolü sürdürdüğünü doğrulamayı unutmamak gerekir.
vCenter HA Cluster Yapılandırmasını Düzenleme :
vCenter HA Deployment tamamlandığında High Availability Protection için Passive ve Witness Node’lar oluşturuldu.
vCenter HA aktif olduktan sonra “EDIT ” tıklanarak Maintenance Mode’u etkinleştirebilir veya vCenter HA Enable /Disable edebilirsiniz.
Mode | Automatic Failover | Manual failover | Replication | |
Enable vCenter HA |
Yes | Yes | Yes | varsayılan çalışma modudur, vCenter Server appliance Automatic Failover gerçekleştirerek donanım ve yazılım hatalarından korur.
Active ve Passive Node arasında replikasyon sağlar. Cluster sağlıklı bir durumda ise, Active Node’muz Passive Node ile Automatic Failover özelliği sayesinde korunur. |
Maintenance Mode |
No | Yes | Yes | Bazı bakım görevleri için kullanılır.
Maintenance Mode’da , Active ve Passive Node’lar arasında replikasyon devam eder, ancak, Automatic Failover devre dışıdır. |
Disable vCenter HA |
No | No | No | Replikasyon ve failover işlemlerini devre dışı bırakır. Cluster yapılandırmasını korur. Daha sonra vCenter HA’yı tekrar etkinleştirebilirsiniz. |
Cluster Maintennace veya Disable Mode’da çalışıyorsa, Active node, Passive ve Witness Node’lar kaybolsa veya erişilemese bile istemci isteklerini sunmaya devam eder.
vCenter HA Failover Başlatma :
Manuel olarak bir failover başlatabilir ve Passive Node’un Active Node haline gelmesini sağlayabiliriz.
vCenter Ha Cluster 2 şekilde failover destekler :
Automatic Failover:
Passive Node , Actice node ‘un bir hata durumunda aktif rölünü almaya çalışır.
Manuel Failover :
Kullanıcı , Initiate Failover butonunu tıklayarak Passive Node’u Active Node olmaya zorladığı işlemdir.
Sorun giderme ve test işlemleri için Manuel Failover yapılır.
Manuel Failover Prosedürü aşağıdaki gibidir:
vCenter Server login olduktan sonra vCenter seçili iken ” Configure /vCenter HA “ yolu izlenerek
“INITIATE FAILOVER” butonu tıklanır.
Initiate vCenter HA failover ekranında senkronizasyon olmadan Failover işlemi zorlama seçeneği çıkar.
Önerilen senkronizasyonu yapmaktır. “INITIATE FAILOVER ” tıklanarak işleminin başlaması sağlanır.
Failover işlemi sonrası bir sorun oluşmamış ise Passive node Active node rolü alacaktır.
vCenter HA Node Backup ve Restore Operasyonları :
vCenter HA Cluster’daki Active Node ‘un yedeklenmesi gerekmektedir.
Passive ve Witness Node yedeklenmemelidir.
Active Node’un restore işleminden önce cluster yapılandırılması kaldırılmalıdır.
Restore işleminden önce vCenter HA Node’ları power-off edilmeli ve silinmelidir.
Active node restore edildikten sonra vCenter HA yeniden konfigure edilmelidir.
vCenter HA Konfigurasyonunun Silinmesi :
Bir vCenter HA yapılandırmasını vSphere Client ‘dan kaldırabilirsiniz.
1- vCenter Server login olduktan sonra vCenter seçili iken ” Configure /vCenter HA “ yolu izlenerek
“REMOVE VCENTER HA” butonu tıklanır.
.
2- Remove vCenter HA ekranında “OK” tıklanır.
Passive ve Witness node’ların sanal makinelerinin silinmesi için ” Delete Passive and Witness node VMs ” seçilmelidir.
Active Node Standalone vCenter Server Appliance olarak çalışmaya devam edecektir.
Passive ve Witness node’lar yeni bir vCenter HA yapılandırmasında kullanılamaz.
Active Node’a eklenen ikinci NIC yapılandırma da eklenmiş olsa bile kaldırma işleminde bu NIC sunucudan kaldırılmaz.
Bozulmuş vCenter Ha Cluster Ortamında Sorun Giderme:
Bir vCenter HA Cluster’ın sağlıklı olması için, Active,Passive ve Witness Node’ların her biri tam olarak çalışır durumda olmalı ve vCenter HA Cluster Network’ü üzerinden erişilebilir olmalıdır.
Node’lardan herhangi biri başarısız olursa, Cluster ( degraded state) bozulmuş durumda kabul edilir.
Passive Node failover sırasında Active Node haline gelmez ise, Passive Node’u Active Node olmaya zorlayabiliriz.
Passive Node, Active Node rolünü almak istediğinde başarısız olabilir ve failover başarılı olmayabilir.
Örneğin, Passive Node,Active Node rolünü almak istediğinde Witness Node herhangi bir sebepten dolayı Kullanılmaz hale gelmiş olabilir.
Veya Node’lar arasında bir sekronizasyon sorunu olabilir.
Bu sorunlardan aşağıdaki gibi kurtarabilirsiniz:
1- Active Node hata çözülüp kurtarılırsa, tekrar Active Node olur.
2-Witness Node hatası çözülürse;
a-Virtual Machine Console ‘dan Passve Node’a login olunur.
b-Appliancsh komut istemcisinde “shell” girilir.
c-“vcha-reset-primary”komutu çalıştırılır.
d-Passive Node Restart edilir.
3-Active Node ve Witness Node hatadan kurtarılamazsa Passive Node Standalone vCenter Server Appliance olmaya zorlanır.
a-Active ve Witness Node silinir.
b- Virtual Machine Console ‘dan Passve Node’a login olunur.
c- Appliancsh komut istemcisinde “shell” girilir.
d-“vcha-destroy” komutu çalıştırılır.
e-Passive Node restart edilir.
VMware vCenter HA Alarm’lar ve Olaylar :
vCenter HA Cluster bozulmuş durumdaysa, alarmlar ve olaylar hatalar gösterir.
Vmware vCenter Ha logları /var/log/vmware/vcha lokasyonunda bulunur.
The following events will raise VCHA health alarm in vpxd:
Event Name |
Event Description |
Event Type |
Category |
vCenter HA cluster state is currently healthy |
vCenter HA cluster state is currently healthy |
com.vmware.vcha.cluster.state.healthy |
info |
vCenter HA cluster state is currently degraded |
vCenter HA cluster state is currently degraded |
com.vmware.vcha.cluster.state.degraded |
warning |
vCenter HA cluster state is currently isolated |
vCenter HA cluster state is currently isolated |
com.vmware.vcha.cluster.state.isolated |
error |
vCenter HA cluster is destroyed |
vCenter HA cluster is destroyed |
com.vmware.vcha.cluster.state.destroyed |
info |
The following events will raise PSC HA health alarm in vpxd:
Event Name |
Event Description |
Event Type |
Category |
PSC HA state is currently healthy |
PSC HA state is currently healthy |
com.vmware.vcha.psc.ha.health.healthy |
info |
PSC HA state is currently degraded |
PSC HA state is currently degraded |
com.vmware.vcha.psc.ha.health.degraded |
info |
PSC HA is not monitored after vCenter HA cluster is destroyed |
PSC HA state is not being monitored |
com.vmware.vcha.psc.ha.health.unknown |
info |
Cluster Status Related Events
Event Name | Event Description |
Event Type | Category |
Node {nodeName} joined back to the cluster |
One node joined back to the cluster |
com.vmware.vcha.node.joined |
info |
Node {nodeName} left the cluster |
One node left the cluster |
com.vmware.vcha.node.left |
warning |
Failover succeeded |
Failover succeeded |
com.vmware.vcha.failover.succeeded |
info |
Failover cannot proceed when cluster is in disabled mode |
Failover cannot proceed when cluster is in disabled mode |
com.vmware.vcha.failover.failed.disabled.mode |
warning |
Failover cannot proceed when cluster does not have all three nodes connected |
Failover cannot proceed when cluster does not have all three nodes connected |
com.vmware.vcha.failover.failed.node.lost |
warning |
Failover cannot proceed when vPostgres on Passive node is not ready to takeover |
Failover cannot proceed when Passive node is not ready to takeover |
com.vmware.vcha.failover.failed.passive.not.ready |
warning |
vCenter HA cluster mode changed to {clusterMode} |
vCenter HA cluster mode changed |
com.vmware.vcha.cluster.mode.changed |
info |
Database replication-related events
Event Name | Event Description | Event Type | Event Type |
Database replication mode changed to {newState} |
Database replication state changed: sync, async or no replication |
com.vmware.vcha.DB.replication.state.changed |
info |
File replication-related events
Event Name |
Event Description |
Event Type |
Event Type |
Appliance {fileProviderType} is {state} |
Appliance File replication state changed |
com.vmware.vcha.file.replication.state.changed |
info |