⛄ etcd backup and recovery for multi-master

overall process for etcd backup and recovery

0. prereq

apt-get install ansible
cp <install_dir>/cluster/hosts /etc/ansible/hosts
apt-get install jq
export endpoint=169.56.xx
export CLUSTER_DIR=/opt/ibm-cloud-private-3.1.0/cluster

1. backup etcd

cd ~/icp-backup/scripts
./backupEtcd.sh
ls -al /tmp/etcd*

2. stop etcd

ansible master -m command -a "mkdir -p /etc/cfc/podbackup"
ansible master -m shell -a "mv /etc/cfc/pods/*.json /etc/cfc/podbackup"
ansible master -m wait_for -a  "port=4001 state=stopped"

3. stop kubelet & remove etcd data

ansible master,management -m service -a "name=kubelet state=stopped"
ansible master -m shell -a "mv  /var/lib/etcd /var/lib/old-etcd2"

4. copy backup file to other master node

ansible master -m shell -a "ls -al /tmp/etcd* "
scp /tmp/etcd....  root@master01:/tmp/snapshot.db
scp /tmp/etcd....  root@master02:/tmp/snapshot.db
scp /tmp/etcd....  root@master03:/tmp/snapshot.db

5. restore to each master node

ansible master -m script -a "./multimaster-etcd-restore.sh"
ansible master -m shell -a "mv /var/lib/etcd/restored/* /var/lib/etcd/"

6. start kubelet & etcd

docker restarting takes more than 5 min.

ansible master,management -m service -a "name=docker state=restarted"
ansible master,management -m script -a "./purge_kubelet_pods.sh"
ansible master,management -m service -a "name=kubelet state=started"

7. start etcd

ansible master -m shell -a "mv /etc/cfc/podbackup/etcd.json /etc/cfc/pods"
ansible master -m wait_for -a  "port=4001 state=started"
ansible master -m shell -a "mv /etc/cfc/podbackup/*.json /etc/cfc/pods"
ansible master -m shell -a "docker ps | grep etcd"

⚡ Remarks

cd ~/icp-backup/scripts
. ./etcd.sh
$etcdctl2 cluster-health

ansible master -m package -a "use=apt name=jq state=present"

main https://github.com/ibm-cloud-architecture/icp-backup/blob/master/docs/etcd.md
etcd restore to single https://github.com/ibm-cloud-architecture/icp-backup/blob/master/docs/etcd_restore_single.md
etcd restore to multi https://github.com/ibm-cloud-architecture/icp-backup/blob/master/docs/etcd_restore_multi.md
etcd https://github.com/haoqing0110/icp-workspace/tree/master/icp-backup-restore/etcd
etcd backup & restore https://juner417.github.io/blog/etcd-backup-and-restore/
etcd everything https://www.mirantis.com/blog/everything-you-ever-wanted-to-know-about-using-etcd-with-kubernetes-v1-6-but-were-afraid-to-ask/

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

etcd-multi-master-backup-and-recovery.md

etcd-multi-master-backup-and-recovery.md

⛄ etcd backup and recovery for multi-master

overall process for etcd backup and recovery

0. prereq

1. backup etcd

2. stop etcd

3. stop kubelet & remove etcd data

4. copy backup file to other master node

5. restore to each master node

6. start kubelet & etcd

7. start etcd

⚡ Remarks

Files

etcd-multi-master-backup-and-recovery.md

Latest commit

History

etcd-multi-master-backup-and-recovery.md

File metadata and controls

⛄ etcd backup and recovery for multi-master

overall process for etcd backup and recovery

0. prereq

1. backup etcd

2. stop etcd

3. stop kubelet & remove etcd data

4. copy backup file to other master node

5. restore to each master node

6. start kubelet & etcd

7. start etcd

⚡ Remarks