Cara Aman Menghapus Node Offline dari Cluster Proxmox VE
Introduction
Saat mengelola Proxmox Cluster yang terdiri dari banyak server, ada kalanya kita perlu mengeliminasi salah satu server yang sudah tidak digunakan, misalnya karena hardware sudah usang (obsolete) dan ingin diganti dengan server baru yang lebih bertenaga. Untuk menjaga efisiensi dan kebersihan cluster, kita perlu melakukan penghapusan node tersebut secara permanen.
Preparation
Sebelum mengeksekusi penghapusan node, ada beberapa langkah krusial yang wajib dilakukan terlebih dahulu untuk menghindari kehilangan data (data loss):
-
Migrasi Workload: Pastikan semua Virtual Machine (VM), Container (LXC), serta replicated backup yang ada di dalam node tersebut sudah dipindahkan seluruhnya ke node lain yang masih aktif.
-
Matikan Server (Shutdown): Setelah node benar-benar kosong, matikan server tersebut (
poweroff). Node target harus dalam kondisi mati sebelum dihapus agar tidak merusak konfigurasi cluster (terutama pada service Corosync).
Configuration
Setelah node target dimatikan, masuk ke SSH salah satu node yang masih aktif, lalu periksa status kuorum cluster dengan command
pvecm status
Cek pada bagian Expected votes dan Total votes, berarti itu menandakan 1 node sudah offline
Setelah itu kita cek nama node yang offline menggunakan script dibawah
awk '/node \{/ {node=1; name=""; ip=""} node && /name:/ {name=$2} node && /ring0_addr:/ {ip=$2} node && /\}/ {if (name && ip) print name, ip; node=0}' /etc/pve/corosync.conf | while read -r name ip; do ! pvecm status | grep -q "$ip" && echo "Node Offline: $name ($ip)"; done
Jika sudah dapat kita bisa hapus node tersebut
pvecm delnode <NAMA NODE>
Setelah kita hapus, kita cek status cluster
pvecm status
Node sudah berhasil dihapus dari cluster, tapi kita harus hapus juga folder data nodes yang ada dicluster. (Bisa backup terlebih dahulu jika masih ada konfigurasi node tersebut)
rm -rf /etc/pve/nodes/<NAMA NODE>