Skip to content

Latest commit

 

History

History
1511 lines (1231 loc) · 46.6 KB

avl_tree.md

File metadata and controls

1511 lines (1231 loc) · 46.6 KB

AVL树

二叉查找树的树高度影响了查找的效率,需要尽量减小树的高度,AVL树正是这样的树。

目前已经有更加完备的代码实现,请参考:https://github.com/hunterhug/gomap

一、AVL树介绍

AVL树是一棵严格自平衡的二叉查找树,1962年,发明者 Adelson-VelskyLandis 发表了论文,以两个作者的名字命名了该数据结构,这是较早发明的平衡二叉树。

定义如下:

  1. 首先它是一棵二叉查找树。
  2. 任意一个节点的左右子树最大高度差为1。

由于树特征定义,我们可以计算出其高度 h 的上界 h<=1.44log(n),也就是最坏情况下,树的高度约等于 1.44log(n)

假设高度 h 的AVL树最少有 f(h) 个节点,因为左右子树的高度差不能大于1,所以左子树和右子树最少节点为: f(h-1)f(h-2)

因此,树根节点加上左右子树的节点,满足公式 f(h) = 1 + f(h-1) + f(h-2),初始条件 f(0)=0,f(1)=1

经过数学的推算可以得出 h<=1.44log(n),由于计算过程超纲了,在此不进行演算。

树的高度被限制于 1.44log(n), 所以查找元素时使用二分查找,最坏查找 1.44log(n) 次,此时最坏时间复杂度为 1.44log(n),去掉常数项,时间复杂度为:log(n)

为了维持AVL树的特征,每次添加和删除元素都需要一次或多次旋转来调整树的平衡。调整的依据来自于二叉树节点的平衡因子:节点的左子树与右子树的高度差称为该节点的平衡因子,约束范围为 [-1,0,1]

平衡二叉查找树比较难以理解的是添加和删除元素时的调整操作,我们将会具体分析。

二、AVL树基本结构

AVL树的数据结构如下:

// AVL树
type AVLTree struct {
	Root *AVLTreeNode // 树根节点
}

// AVL节点
type AVLTreeNode struct {
	Value  int64                 // 值
	Times  int64                 // 值出现的次数
	Height int64                 // 该节点作为树根节点,树的高度,方便计算平衡因子
	Left   *AVLTreeNode // 左子树
	Right  *AVLTreeNode // 右字树
}

// 初始化一个AVL树
func NewAVLTree() *AVLTree {
	return new(AVLTree)
}

其中 Height 表示以该节点作为树的根节点时该树的高度,方便计算平衡因子。

更新树的高度,代码如下:

// 更新节点的树高度
func (node *AVLTreeNode) UpdateHeight() {
	if node == nil {
		return
	}

	var leftHeight, rightHeight int64 = 0, 0
	if node.Left != nil {
		leftHeight = node.Left.Height
	}
	if node.Right != nil {
		rightHeight = node.Right.Height
	}
	// 哪个子树高算哪棵的
	maxHeight := leftHeight
	if rightHeight > maxHeight {
		maxHeight = rightHeight
	}
	// 高度加上自己那一层
	node.Height = maxHeight + 1
}

计算树的平衡因子,也就是左右子树的高度差,代码如下:

// 计算平衡因子
func (node *AVLTreeNode) BalanceFactor() int64 {
	var leftHeight, rightHeight int64 = 0, 0
	if node.Left != nil {
		leftHeight = node.Left.Height
	}
	if node.Right != nil {
		rightHeight = node.Right.Height
	}
	return leftHeight - rightHeight
}

三、AVL树添加元素

添加元素前需要定位到元素的位置,也就是使用二分查找找到该元素需要插入的地方。

插入后,需要满足所有节点的平衡因子在 [-1,0,1] 范围内,如果不在,需要进行旋转调整。

旋转有四种情况:

  1. 在右子树上插上右儿子导致失衡,左旋,转一次。
  2. 在左子树上插上左儿子导致失衡,右旋,转一次。
  3. 在左子树上插上右儿子导致失衡,先左后右旋,转两次。
  4. 在右子树上插上左儿子导致失衡,先右后左旋,转两次。

旋转规律记忆法:单旋和双旋,单旋反方向,双旋同方向。

以下示意图摘自维基百科,阅读代码时可以参考。

3.1. 左子树插左儿子:单右旋

在左子树上插上左儿子导致失衡,需要单右旋:

因为红色元素 2 的产生,其最近的父亲节点 Root 失衡了,元素 2 导致了元素 Root=5 的失衡,需要调整。

Pivot=3 代替元素 5 的位置成为新的 Root,然后元素 5 委屈一下成为 3 的右儿子,而 3 的右儿子变成了 5 的左儿子,如上图。

相应调整后树的高度降低了,该失衡消失。我们可以看到红色元素 2 有两个儿子,实际上在添加操作时它是一个新的节点,是没有儿子的,这种有儿子的情况只发生在删除操作。

如果一时难以理解,可以多看几次图好好思考。

代码如下:

// 单右旋操作,看图说话
func RightRotation(Root *AVLTreeNode) *AVLTreeNode {
	// 只有Pivot和B,Root位置变了
	Pivot := Root.Left
	B := Pivot.Right
	Pivot.Right = Root
	Root.Left = B

	// 只有Root和Pivot变化了高度
	Root.UpdateHeight()
	Pivot.UpdateHeight()
	return Pivot
}

3.2. 右子树插右儿子:单左旋

在右子树上插上右儿子导致失衡,需要单左旋:

代码如下:

// 单左旋操作,看图说话
func LeftRotation(Root *AVLTreeNode) *AVLTreeNode {
	// 只有Pivot和B,Root位置变了
	Pivot := Root.Right
	B := Pivot.Left
	Pivot.Left = Root
	Root.Right = B

	// 只有Root和Pivot变化了高度
	Root.UpdateHeight()
	Pivot.UpdateHeight()
	return Pivot
}

3.3. 左子树插右儿子:先左后右旋

在左子树上插上右儿子导致失衡,先左后右旋:

代码如下:

// 先左后右旋操作,看图说话
func LeftRightRotation(node *AVLTreeNode) *AVLTreeNode {
	node.Left = LeftRotation(node.Left)
	return RightRotation(node)
}

直接复用了之前左旋和右旋的代码,虽然难以理解,但是画一下图,确实这样调整后树高度降了,不再失衡,一切 perfect。

3.4. 右子树插左儿子:先右后左旋

在右子树上插上左儿子导致失衡,先右后左旋:

代码如下:

// 先右后左旋操作,看图说话
func RightLeftRotation(node *AVLTreeNode) *AVLTreeNode {
	node.Right = RightRotation(node.Right)
	return LeftRotation(node)
}

3.5. 具体实现

四种旋转代码实现后,我们开始进行添加元素操作:

// 添加元素
func (tree *AVLTree) Add(value int64) {
	// 往树根添加元素,会返回新的树根
	tree.Root = tree.Root.Add(value)
}

func (node *AVLTreeNode) Add(value int64) *AVLTreeNode {
	// 添加值到根节点node,如果node为空,那么让值成为新的根节点,树的高度为1
	if node == nil {
		return &AVLTreeNode{Value: value, Height: 1}
	}
	// 如果值重复,什么都不用做,直接更新次数
	if node.Value == value {
		node.Times = node.Times + 1
		return node
	}

	// 辅助变量
	var newTreeNode *AVLTreeNode

	if value > node.Value {
		// 插入的值大于节点值,要从右子树继续插入
		node.Right = node.Right.Add(value)
		// 平衡因子,插入右子树后,要确保树根左子树的高度不能比右子树低一层。
		factor := node.BalanceFactor()
		// 右子树的高度变高了,导致左子树-右子树的高度从-1变成了-2。
		if factor == -2 {
			if value > node.Right.Value {
				// 表示在右子树上插上右儿子导致失衡,需要单左旋:
				newTreeNode = LeftRotation(node)
			} else {
				//表示在右子树上插上左儿子导致失衡,先右后左旋:
				newTreeNode = RightLeftRotation(node)
			}
		}
	} else {
		// 插入的值小于节点值,要从左子树继续插入
		node.Left = node.Left.Add(value)
		// 平衡因子,插入左子树后,要确保树根左子树的高度不能比右子树高一层。
		factor := node.BalanceFactor()
		// 左子树的高度变高了,导致左子树-右子树的高度从1变成了2。
		if factor == 2 {
			if value < node.Left.Value {
				// 表示在左子树上插上左儿子导致失衡,需要单右旋:
				newTreeNode = RightRotation(node)
			} else {
				//表示在左子树上插上右儿子导致失衡,先左后右旋:
				newTreeNode = LeftRightRotation(node)
			}
		}
	}

	if newTreeNode == nil {
		// 表示什么旋转都没有,根节点没变,直接刷新树高度
		node.UpdateHeight()
		return node
	} else {
		// 旋转了,树根节点变了,需要刷新新的树根高度
		newTreeNode.UpdateHeight()
		return newTreeNode
	}
}

一开始从树根节点开始插入新值:tree.Root = tree.Root.Add(value),因为插入值后会返回新的根节点,也就是说调整过程中树根节点会变化,所以要重新将新根节点赋予老的根节点。

func (node *AVLTreeNode) Add(value int64) 函数中,如果根节点为空,那么需要返回新的根节点:

	// 添加值到根节点node,如果node为空,那么让值成为新的根节点,树的高度为1
	if node == nil {
		return &AVLTreeNode{Value: value, Height: 1}
	}

接着,如果插入的值和节点的值一样,直接更新 Times

// 如果值重复,什么都不用做,直接更新次数
	if node.Value == value {
		node.Times = node.Times + 1
		return node
	}

否则根据值的大小,旋转插入到左子树或右子树,我们只分析插入右子树的代码:

	if value > node.Value {
		// 插入的值大于节点值,要从右子树继续插入
		node.Right = node.Right.Add(value)
		// 平衡因子,插入右子树后,要确保树根左子树的高度不能比右子树低一层。
		factor := node.BalanceFactor()
		// 右子树的高度变高了,导致左子树-右子树的高度从-1变成了-2。
		if factor == -2 {
			if value > node.Right.Value {
				// 表示在右子树上插上右儿子导致失衡,需要单左旋:
				newTreeNode = LeftRotation(node)
			} else {
				//表示在右子树上插上左儿子导致失衡,先右后左旋:
				newTreeNode = RightLeftRotation(node)
			}
		}
    }

因为值添加到了右子树,所以转换成了在右子树添加元素:node.Right = node.Right.Add(value),之后要判断根节点的平衡因子是否变化了。

值插入右子树后,要确保树根左子树的高度不能比右子树低一层。当平衡因子 factor == -2 表示右子树的高度变高了,导致 左子树-右子树 的高度从 -1 变成了 -2,所以要旋转。

判断新插入的值是在右子树的左儿子还是右儿子上:

			if value > node.Right.Value {
				// 表示在右子树上插上右儿子导致失衡,需要单左旋:
				newTreeNode = LeftRotation(node)
			} else {
				//表示在右子树上插上左儿子导致失衡,先右后左旋:
				newTreeNode = RightLeftRotation(node)
			}

如果在右子树上插上右儿子导致失衡,需要单左旋:LeftRotation(node),如果在右子树上插上左儿子导致失衡,先右后左旋:RightLeftRotation(node)

最后需要更新树根节点的高度,并返回树根(如果曾经旋转,表示树根变了,需要返回新的树根):

	if newTreeNode == nil {
		// 表示什么旋转都没有,根节点没变,直接刷新树高度
		node.UpdateHeight()
		return node
	} else {
		// 旋转了,树根节点变了,需要刷新新的树根高度
		newTreeNode.UpdateHeight()
		return newTreeNode
	}

3.6. 时间复杂度分析

添加元素时先要找到元素插入的位置,找到位置后逐层自底向上更新每个子树的树高度,并根据子树平衡是否被破坏,需要进行旋转操作。

由于树的高度最高为 1.44log(n),查找元素插入位置,最坏次数为 1.44log(n) 次。逐层更新子树高度并判断平衡是否被破坏,最坏需要 1.44log(n) 次,因此可以得知添加元素最坏时间复杂度为:2.88log(n),去掉常数项,时间复杂度为:log(n)

关于旋转次数,当插入节点后,某子树不平衡时最多旋转 2次,也就是双旋该子树即可恢复平衡,该调整为局部特征,调整完后其父层不再需要旋转。也就是说,插入操作最坏旋转两次即可。

由于代码的递归实现方式,当某子树旋转过后其父层子树仍然需要判断平衡因子,判断是否需要旋转,该操作是不必要的,因为子树旋转过后全局已经平衡了,不必再判断父层的平衡因子。

对此可以进行代码优化,在左子树或右子树插入元素后,除了返回根节点,还返回其是否旋转过的辅助变量,如:func (node *AVLTreeNode) Add(value int64) (newNode *AVLTreeNode, rotate bool) ,根据返回的辅助变量 rotate,可以:

    node.Right, rotate= node.Right.Add(value)
    if !rotate {
        //  子树没有旋转过,那么需要判断是否需要旋转

        // 平衡因子,插入右子树后,要确保树根左子树的高度不能比右子树低一层。
        factor := node.BalanceFactor()
        // 右子树的高度变高了,导致左子树-右子树的高度从-1变成了-2。
        if factor == -2 {
            if value > node.Right.Value {
                // 表示在右子树上插上右儿子导致失衡,需要单左旋:
                newTreeNode = LeftRotation(node)
            } else {
                //表示在右子树上插上左儿子导致失衡,先右后左旋:
                newTreeNode = RightLeftRotation(node)
            }
        }
    }else{
        // do nothing
    }

但此优化意义不大,因为返回辅助变量后仍然需要判断,判断辅助变量和判断平衡因子,时间复杂度一样。

插入元素进行调整后,需要递归向上更新每一棵子树高度,其时间复杂度为 log(n),但可以优化,当两棵子树高度都没有变化时,那么上面的父层子树们都不需要更新树高度,直接退出,由于是递归程序,如何向上传递这个信息,引入了额外空间成本,且不可避免仍然会出现所有层级的父节点都必须更新树高度,优化意义不是很大。

四、AVL树查找元素等操作

其他操作与二叉查找树通用,代码如下:

// 找出最小值的节点
func (tree *AVLTree) FindMinValue() *AVLTreeNode {
	if tree.Root == nil {
		// 如果是空树,返回空
		return nil
	}

	return tree.Root.FindMinValue()
}

func (node *AVLTreeNode) FindMinValue() *AVLTreeNode {
	// 左子树为空,表面已经是最左的节点了,该值就是最小值
	if node.Left == nil {
		return node
	}

	// 一直左子树递归
	return node.Left.FindMinValue()
}

// 找出最大值的节点
func (tree *AVLTree) FindMaxValue() *AVLTreeNode {
	if tree.Root == nil {
		// 如果是空树,返回空
		return nil
	}

	return tree.Root.FindMaxValue()
}

func (node *AVLTreeNode) FindMaxValue() *AVLTreeNode {
	// 右子树为空,表面已经是最右的节点了,该值就是最大值
	if node.Right == nil {
		return node
	}

	// 一直右子树递归
	return node.Right.FindMaxValue()
}

// 查找指定节点
func (tree *AVLTree) Find(value int64) *AVLTreeNode {
	if tree.Root == nil {
		// 如果是空树,返回空
		return nil
	}

	return tree.Root.Find(value)
}

func (node *AVLTreeNode) Find(value int64) *AVLTreeNode {
	if value == node.Value {
		// 如果该节点刚刚等于该值,那么返回该节点
		return node
	} else if value < node.Value {
		// 如果查找的值小于节点值,从节点的左子树开始找
		if node.Left == nil {
			// 左子树为空,表示找不到该值了,返回nil
			return nil
		}
		return node.Left.Find(value)
	} else {
		// 如果查找的值大于节点值,从节点的右子树开始找
		if node.Right == nil {
			// 右子树为空,表示找不到该值了,返回nil
			return nil
		}
		return node.Right.Find(value)
	}
}

// 中序遍历
func (tree *AVLTree) MidOrder() {
	tree.Root.MidOrder()
}

func (node *AVLTreeNode) MidOrder() {
	if node == nil {
		return
	}

	// 先打印左子树
	node.Left.MidOrder()

	// 按照次数打印根节点
	for i := 0; i <= int(node.Times); i++ {
		fmt.Println(node.Value)
	}

	// 打印右子树
	node.Right.MidOrder()
}

查找操作逻辑与通用的二叉查找树一样,并无区别。

五、AVL树删除元素

删除元素有四种情况:

  1. 删除的节点是叶子节点,没有儿子,直接删除后看离它最近的父亲节点是否失衡,做调整操作。
  2. 删除的节点下有两个子树,选择高度更高的子树下的节点来替换被删除的节点,如果左子树更高,选择左子树中最大的节点,也就是左子树最右边的叶子节点,如果右子树更高,选择右子树中最小的节点,也就是右子树最左边的叶子节点。最后,删除这个叶子节点,也就是变成情况1。
  3. 删除的节点只有左子树,可以知道左子树其实就只有一个节点,被删除节点本身(假设左子树多于2个节点,那么高度差就等于2了,不符合AVL树定义),将左节点替换被删除的节点,最后删除这个左节点,变成情况1。
  4. 删除的节点只有右子树,可以知道右子树其实就只有一个节点,被删除节点本身(假设右子树多于2个节点,那么高度差就等于2了,不符合AVL树定义),将右节点替换被删除的节点,最后删除这个右节点,变成情况1。

后面三种情况最后都变成 情况1,就是将删除的节点变成叶子节点,然后可以直接删除该叶子节点,然后看其最近的父亲节点是否失衡,失衡时对树进行平衡。

举个例子,删除叶子节点,如图:

删除节点 24,导致节点 26 的子树不平衡了,这时需要对该子树进行旋转,旋转后如图:

可以发现这时树仍然不平衡,这时是节点 22 的子树不平衡,需要继续旋转,旋转后如图:

实现代码如下:

func (node *AVLTreeNode) Delete(value int64) *AVLTreeNode {
	if node == nil {
		// 如果是空树,直接返回
		return nil
	}
	if value < node.Value {
		// 从左子树开始删除
		node.Left = node.Left.Delete(value)
		// 删除后要更新该子树高度
		node.Left.UpdateHeight()
	} else if value > node.Value {
		// 从右子树开始删除
		node.Right = node.Right.Delete(value)
		// 删除后要更新该子树高度
		node.Right.UpdateHeight()
	} else {
		// 找到该值对应的节点
		// 该节点没有左右子树
		// 第一种情况,删除的节点没有儿子,直接删除即可。
		if node.Left == nil && node.Right == nil {
			return nil // 直接返回nil,表示直接该值删除
		}

		// 该节点有两棵子树,选择更高的哪个来替换
		// 第二种情况,删除的节点下有两个子树,选择高度更高的子树下的节点来替换被删除的节点,如果左子树更高,选择左子树中最大的节点,也就是左子树最右边的叶子节点,如果右子树更高,选择右子树中最小的节点,也就是右子树最左边的叶子节点。最后,删除这个叶子节点。
		if node.Left != nil && node.Right != nil {
			// 左子树更高,拿左子树中最大值的节点替换
			if node.Left.Height > node.Right.Height {
				maxNode := node.Left
				for maxNode.Right != nil {
					maxNode = maxNode.Right
				}

				// 最大值的节点替换被删除节点
				node.Value = maxNode.Value
				node.Times = maxNode.Times

				// 把最大的节点删掉
				node.Left = node.Left.Delete(maxNode.Value)
				// 删除后要更新该子树高度
				node.Left.UpdateHeight()
			} else {
				// 右子树更高,拿右子树中最小值的节点替换
				minNode := node.Right
				for minNode.Left != nil {
					minNode = minNode.Left
				}

				// 最小值的节点替换被删除节点
				node.Value = minNode.Value
				node.Times = minNode.Times

				// 把最小的节点删掉
				node.Right = node.Right.Delete(minNode.Value)
				// 删除后要更新该子树高度
				node.Right.UpdateHeight()
			}
		} else {
			// 只有左子树或只有右子树
			// 只有一个子树,该子树也只是一个节点,将该节点替换被删除的节点,然后置子树为空
			if node.Left != nil {
				//第三种情况,删除的节点只有左子树,因为树的特征,可以知道左子树其实就只有一个节点,它本身,否则高度差就等于2了。
				node.Value = node.Left.Value
				node.Times = node.Left.Times
				node.Height = 1
				node.Left = nil
			} else if node.Right != nil {
				//第四种情况,删除的节点只有右子树,因为树的特征,可以知道右子树其实就只有一个节点,它本身,否则高度差就等于2了。
				node.Value = node.Right.Value
				node.Times = node.Right.Times
				node.Height = 1
				node.Right = nil
			}
		}

		// 找到值后,进行替换删除后,直接返回该节点
		return node
	}

	// 左右子树递归删除节点后需要平衡
	var newNode *AVLTreeNode
	// 相当删除了右子树的节点,左边比右边高了,不平衡
	if node.BalanceFactor() == 2 {
		if node.Left.BalanceFactor() >= 0 {
			newNode = RightRotation(node)
		} else {
			newNode = LeftRightRotation(node)
		}
		//  相当删除了左子树的节点,右边比左边高了,不平衡
	} else if node.BalanceFactor() == -2 {
		if node.Right.BalanceFactor() <= 0 {
			newNode = LeftRotation(node)
		} else {
			newNode = RightLeftRotation(node)
		}
	}

	if newNode == nil {
		node.UpdateHeight()
		return node
	} else {
		newNode.UpdateHeight()
		return newNode
	}
}

当删除的值不等于当前节点的值时,在相应的子树中递归删除,递归过程中会自底向上维护AVL树的特征。

  1. 小于删除的值 value < node.Value,在左子树中递归删除:node.Left = node.Left.Delete(value)
  2. 大于删除的值 value > node.Value,在右子树中递归删除:node.Right = node.Right.Delete(value)

因为删除后可能因为旋转调整,导致树根节点变了,这时会返回新的树根,递归删除后需要将返回的新根节点赋予原来的老根节点。

情况1,找到要删除的值时,该值是叶子节点,直接删除该节点即可:

		// 第一种情况,删除的节点没有儿子,直接删除即可。
		if node.Left == nil && node.Right == nil {
			return nil // 直接返回nil,表示直接该值删除
		}

情况2,删除的节点有两棵子树,选择高度更高的子树下的节点来替换被删除的节点:

		// 该节点有两棵子树,选择更高的哪个来替换
		// 第二种情况,删除的节点下有两个子树,选择高度更高的子树下的节点来替换被删除的节点,如果左子树更高,选择左子树中最大的节点,也就是左子树最右边的叶子节点,如果右子树更高,选择右子树中最小的节点,也就是右子树最左边的叶子节点。最后,删除这个叶子节点。
		if node.Left != nil && node.Right != nil {
			// 左子树更高,拿左子树中最大值的节点替换
			if node.Left.Height > node.Right.Height {
				maxNode := node.Left
				for maxNode.Right != nil {
					maxNode = maxNode.Right
				}

				// 最大值的节点替换被删除节点
				node.Value = maxNode.Value
				node.Times = maxNode.Times

				// 把最大的节点删掉
				node.Left = node.Left.Delete(maxNode.Value)
				// 删除后要更新该子树高度
				node.Left.UpdateHeight()
			} else {
				// 右子树更高,拿右子树中最小值的节点替换
				minNode := node.Right
				for minNode.Left != nil {
					minNode = minNode.Left
				}

				// 最小值的节点替换被删除节点
				node.Value = minNode.Value
				node.Times = minNode.Times

				// 把最小的节点删掉
				node.Right = node.Right.Delete(minNode.Value)
				// 删除后要更新该子树高度
				node.Right.UpdateHeight()
			}
		}

情况3和情况4,如果被删除的节点只有一个子树,那么该子树一定没有儿子,不然树的高度就大于1了,所以直接替换值后删除该子树节点:

			// 只有左子树或只有右子树
			// 只有一个子树,该子树也只是一个节点,将该节点替换被删除的节点,然后置子树为空
			if node.Left != nil {
				//第三种情况,删除的节点只有左子树,因为树的特征,可以知道左子树其实就只有一个节点,它本身,否则高度差就等于2了。
				node.Value = node.Left.Value
				node.Times = node.Left.Times
				node.Height = 1
				node.Left = nil
			} else if node.Right != nil {
				//第四种情况,删除的节点只有右子树,因为树的特征,可以知道右子树其实就只有一个节点,它本身,否则高度差就等于2了。
				node.Value = node.Right.Value
				node.Times = node.Right.Times
				node.Height = 1
				node.Right = nil
			}

核心在于删除后的旋转调整,如果删除的值不匹配当前节点的值,对当前节点的左右子树进行递归删除,递归删除后该节点为根节点的子树可能不平衡,我们需要判断后决定要不要旋转这棵树。

每次递归都是自底向上,从很小的子树到很大的子树,如果自底向上每棵子树都进行调整,约束在树的高度差不超过1,那么整棵树自然也符合AVL树的平衡规则。

删除元素后,如果子树失衡,需要进行调整操作,主要有两种:删除后左子树比右子树高,删除后右子树比左子树高。

5.1. 删除后,左子树比右子树高

如果删除了右子树的节点,左边比右边高了,不平衡了:

	// 相当删除了右子树的节点,左边比右边高了,不平衡
	if node.BalanceFactor() == 2 {
		if node.Left.BalanceFactor() >= 0 {
			newNode = RightRotation(node)
		} else {
			newNode = LeftRightRotation(node)
		}
    }

为什么要这么调整呢,看图说话,有两幅图参考:

这幅图可以看到:

  1. 黄色点5.BalanceFactor() == 2,对应:node.BalanceFactor() == 2
  2. 绿色点3.BalanceFactor() == 1,对应:node.Left.BalanceFactor() == 1

所以应该需要右旋:newNode = RightRotation(node)

这幅图可以看到:

  1. 黄色点5.BalanceFactor() == 2,对应:node.BalanceFactor() == 2
  2. 绿色点3.BalanceFactor() == -1,对应:node.Left.BalanceFactor() == -1

所以应该需要先左后右旋:newNode = LeftRightRotation(node)

还有一种特殊情况,和上面的都不一样,如图:

我们如果删除节点 22 或节点 23,这个时候根节点 20 失衡了。

  1. 根节点 20 的左子树比右子树高了 2 层,对应:node.BalanceFactor() == 2
  2. 左子树节点 13 并没有失衡,对应:node.BalanceFactor() == 0

这个时候,无论使用右旋,还是先左旋后右旋都可以使树恢复平衡,我们的 if 判断条件使用了右旋。

如果是先左旋后右旋,那么旋转后恢复平衡,如图对根结点进行旋转:

如果使用右旋也可以,如图对根结点进行旋转:

5.2. 删除后,右子树比左子树高

如果删除了左子树的节点,右边比左边高了,不平衡了:

        //  相当删除了左子树的节点,右边比左边高了,不平衡
        if node.BalanceFactor() == -2 {
		    if node.Right.BalanceFactor() <= 0 {
			newNode = LeftRotation(node)
		    } else {
			newNode = RightLeftRotation(node)
		    }
        }

为什么要这么调整呢,看图说话,有两幅图参考:

这幅图可以看到:

  1. 绿色点3.BalanceFactor() == -2,对应:node.BalanceFactor() == -2
  2. 黄色点5.BalanceFactor() == -1,对应:node.Left.BalanceFactor() == -1

所以应该需要左旋:newNode = LeftRotation(node)

这幅图可以看到:

  1. 绿色点3.BalanceFactor() == -2,对应:node.BalanceFactor() == -2
  2. 黄色点5.BalanceFactor() == 1,对应:node.Left.BalanceFactor() == 1

所以应该需要先右后左旋:newNode = RightLeftRotation(node)

当然,还有另外一种特殊情况,与 5.1 章节类似,使用左旋还是先右旋后左旋都可以,在这里就不阐述了。

5.3. 删除后,调整树高度

进行调整操作后,需要更新该子树的高度。如果没有旋转过,更新之前节点的树高度。如果曾经旋转过,树根变了,更新新的树根节点高度。

	if newNode == nil {
		node.UpdateHeight()
		return node
	} else {
		newNode.UpdateHeight()
		return newNode
	}

5.4. 时间复杂度分析

删除操作是先找到删除的节点,然后将该节点与一个叶子节点交换,接着删除叶子节点,最后对叶子节点的父层逐层向上旋转调整。

删除操作的时间复杂度和添加操作一样。区别在于,添加操作最多旋转两次就可以达到树的平衡,而删除操作可能会旋转超过两次。

如图是一棵比较糟糕的 AVL 树:

删除节点1,旋转可以一直旋转到根节点,比插入旋转最多旋转两次的次数更多。

六、验证是否是一棵AVL树

如何确保我们的代码实现的就是一棵 AVL 树呢,可以进行验证:

// 验证是不是棵AVL树
func (tree *AVLTree) IsAVLTree() bool {
	if tree == nil || tree.Root == nil {
		return true
	}

	// 判断节点是否符合 AVL 树的定义
	if tree.Root.IsRight() {
		return true
	}

	return false
}

// 判断节点是否符合 AVL 树的定义
func (node *AVLTreeNode) IsRight() bool {
	if node == nil {
		return true
	}

	// 左右子树都为空,那么是叶子节点
	if node.Left == nil && node.Right == nil {
		// 叶子节点高度应该为1
		if node.Height == 1 {
			return true
		} else {
			fmt.Println("leaf node height is ", node.Height)
			return false
		}
	} else if node.Left != nil && node.Right != nil {
		// 左右子树都是满的
		// 左儿子必须比父亲小,右儿子必须比父亲大
		if node.Left.Value < node.Value && node.Right.Value > node.Value {
		} else {
			// 不符合 AVL 树定义
			fmt.Printf("father is %v lchild is %v, rchild is %v\n", node.Value, node.Left.Value, node.Right.Value)
			return false
		}

		bal := node.Left.Height - node.Right.Height
		if bal < 0 {
			bal = -bal
		}

		// 子树高度差不能大于1
		if bal > 1 {
			fmt.Println("sub tree height bal is ", bal)
			return false
		}

		// 如果左子树比右子树高,那么父亲的高度等于左子树+1
		if node.Left.Height > node.Right.Height {
			if node.Height == node.Left.Height+1 {
			} else {
				fmt.Printf("%#v height:%v,left sub tree height: %v,right sub tree height:%v\n", node, node.Height, node.Left.Height, node.Right.Height)
				return false
			}
		} else {
			// 如果右子树比左子树高,那么父亲的高度等于右子树+1
			if node.Height == node.Right.Height+1 {
			} else {
				fmt.Printf("%#v height:%v,left sub tree height: %v,right sub tree height:%v\n", node, node.Height, node.Left.Height, node.Right.Height)
				return false
			}
		}

		// 递归判断子树
		if !node.Left.IsRight() {
			return false
		}

		// 递归判断子树
		if !node.Right.IsRight() {
			return false
		}

	} else {
		// 只存在一棵子树
		if node.Right != nil {
			// 子树高度只能是1
			if node.Right.Height == 1 && node.Right.Left == nil && node.Right.Right == nil {
				if node.Right.Value > node.Value {
					// 右节点必须比父亲大
				} else {
					fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
					return false
				}
			} else {
				fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
				return false
			}
		} else {
			if node.Left.Height == 1 && node.Left.Left == nil && node.Left.Right == nil {
				if node.Left.Value < node.Value {
					// 左节点必须比父亲小
				} else {
					fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
					return false
				}
			} else {
				fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
				return false
			}
		}
	}

	return true
}

运行请看完整代码。

七、AVL树完整代码

package main

import (
	"fmt"
)

// AVL树
type AVLTree struct {
	Root *AVLTreeNode // 树根节点
}

// AVL节点
type AVLTreeNode struct {
	Value  int64        // 值
	Times  int64        // 值出现的次数
	Height int64        // 该节点作为树根节点,树的高度,方便计算平衡因子
	Left   *AVLTreeNode // 左子树
	Right  *AVLTreeNode // 右字树
}

// 初始化一个AVL树
func NewAVLTree() *AVLTree {
	return new(AVLTree)
}

// 更新节点的树高度
func (node *AVLTreeNode) UpdateHeight() {
	if node == nil {
		return
	}

	var leftHeight, rightHeight int64 = 0, 0
	if node.Left != nil {
		leftHeight = node.Left.Height
	}
	if node.Right != nil {
		rightHeight = node.Right.Height
	}
	// 哪个子树高算哪棵的
	maxHeight := leftHeight
	if rightHeight > maxHeight {
		maxHeight = rightHeight
	}
	// 高度加上自己那一层
	node.Height = maxHeight + 1
}

// 计算平衡因子
func (node *AVLTreeNode) BalanceFactor() int64 {
	var leftHeight, rightHeight int64 = 0, 0
	if node.Left != nil {
		leftHeight = node.Left.Height
	}
	if node.Right != nil {
		rightHeight = node.Right.Height
	}
	return leftHeight - rightHeight
}

// 单右旋操作,看图说话
func RightRotation(Root *AVLTreeNode) *AVLTreeNode {
	// 只有Pivot和B,Root位置变了
	Pivot := Root.Left
	B := Pivot.Right
	Pivot.Right = Root
	Root.Left = B

	// 只有Root和Pivot变化了高度
	Root.UpdateHeight()
	Pivot.UpdateHeight()
	return Pivot
}

// 单左旋操作,看图说话
func LeftRotation(Root *AVLTreeNode) *AVLTreeNode {
	// 只有Pivot和B,Root位置变了
	Pivot := Root.Right
	B := Pivot.Left
	Pivot.Left = Root
	Root.Right = B

	// 只有Root和Pivot变化了高度
	Root.UpdateHeight()
	Pivot.UpdateHeight()
	return Pivot
}

// 先左后右旋操作,看图说话
func LeftRightRotation(node *AVLTreeNode) *AVLTreeNode {
	node.Left = LeftRotation(node.Left)
	return RightRotation(node)
}

// 先右后左旋操作,看图说话
func RightLeftRotation(node *AVLTreeNode) *AVLTreeNode {
	node.Right = RightRotation(node.Right)
	return LeftRotation(node)
}

// 添加元素
func (tree *AVLTree) Add(value int64) {
	// 往树根添加元素,会返回新的树根
	tree.Root = tree.Root.Add(value)
}

func (node *AVLTreeNode) Add(value int64) *AVLTreeNode {
	// 添加值到根节点node,如果node为空,那么让值成为新的根节点,树的高度为1
	if node == nil {
		return &AVLTreeNode{Value: value, Height: 1}
	}

	// 如果值重复,什么都不用做,直接更新次数
	if node.Value == value {
		node.Times = node.Times + 1
		return node
	}

	// 辅助变量
	var newTreeNode *AVLTreeNode

	if value > node.Value {
		// 插入的值大于节点值,要从右子树继续插入
		node.Right = node.Right.Add(value)
		// 平衡因子,插入右子树后,要确保树根左子树的高度不能比右子树低一层。
		factor := node.BalanceFactor()
		// 右子树的高度变高了,导致左子树-右子树的高度从-1变成了-2。
		if factor == -2 {
			if value > node.Right.Value {
				// 表示在右子树上插上右儿子导致失衡,需要单左旋:
				newTreeNode = LeftRotation(node)
			} else {
				//表示在右子树上插上左儿子导致失衡,先右后左旋:
				newTreeNode = RightLeftRotation(node)
			}
		}
	} else {
		// 插入的值小于节点值,要从左子树继续插入
		node.Left = node.Left.Add(value)
		// 平衡因子,插入左子树后,要确保树根左子树的高度不能比右子树高一层。
		factor := node.BalanceFactor()
		// 左子树的高度变高了,导致左子树-右子树的高度从1变成了2。
		if factor == 2 {
			if value < node.Left.Value {
				// 表示在左子树上插上左儿子导致失衡,需要单右旋:
				newTreeNode = RightRotation(node)
			} else {
				//表示在左子树上插上右儿子导致失衡,先左后右旋:
				newTreeNode = LeftRightRotation(node)
			}
		}
	}

	if newTreeNode == nil {
		// 表示什么旋转都没有,根节点没变,直接刷新树高度
		node.UpdateHeight()
		return node
	} else {
		// 旋转了,树根节点变了,需要刷新新的树根高度
		newTreeNode.UpdateHeight()
		return newTreeNode
	}
}

// 找出最小值的节点
func (tree *AVLTree) FindMinValue() *AVLTreeNode {
	if tree.Root == nil {
		// 如果是空树,返回空
		return nil
	}

	return tree.Root.FindMinValue()
}

func (node *AVLTreeNode) FindMinValue() *AVLTreeNode {
	// 左子树为空,表面已经是最左的节点了,该值就是最小值
	if node.Left == nil {
		return node
	}

	// 一直左子树递归
	return node.Left.FindMinValue()
}

// 找出最大值的节点
func (tree *AVLTree) FindMaxValue() *AVLTreeNode {
	if tree.Root == nil {
		// 如果是空树,返回空
		return nil
	}

	return tree.Root.FindMaxValue()
}

func (node *AVLTreeNode) FindMaxValue() *AVLTreeNode {
	// 右子树为空,表面已经是最右的节点了,该值就是最大值
	if node.Right == nil {
		return node
	}

	// 一直右子树递归
	return node.Right.FindMaxValue()
}

// 查找指定节点
func (tree *AVLTree) Find(value int64) *AVLTreeNode {
	if tree.Root == nil {
		// 如果是空树,返回空
		return nil
	}

	return tree.Root.Find(value)
}

func (node *AVLTreeNode) Find(value int64) *AVLTreeNode {
	if value == node.Value {
		// 如果该节点刚刚等于该值,那么返回该节点
		return node
	} else if value < node.Value {
		// 如果查找的值小于节点值,从节点的左子树开始找
		if node.Left == nil {
			// 左子树为空,表示找不到该值了,返回nil
			return nil
		}
		return node.Left.Find(value)
	} else {
		// 如果查找的值大于节点值,从节点的右子树开始找
		if node.Right == nil {
			// 右子树为空,表示找不到该值了,返回nil
			return nil
		}
		return node.Right.Find(value)
	}
}

// 删除指定的元素
func (tree *AVLTree) Delete(value int64) {
	if tree.Root == nil {
		// 如果是空树,直接返回
		return
	}

	tree.Root = tree.Root.Delete(value)
}

func (node *AVLTreeNode) Delete(value int64) *AVLTreeNode {
	if node == nil {
		// 如果是空树,直接返回
		return nil
	}
	if value < node.Value {
		// 从左子树开始删除
		node.Left = node.Left.Delete(value)
		// 删除后要更新该子树高度
		node.Left.UpdateHeight()
	} else if value > node.Value {
		// 从右子树开始删除
		node.Right = node.Right.Delete(value)
		// 删除后要更新该子树高度
		node.Right.UpdateHeight()
	} else {
		// 找到该值对应的节点
		// 该节点没有左右子树
		// 第一种情况,删除的节点没有儿子,直接删除即可。
		if node.Left == nil && node.Right == nil {
			return nil // 直接返回nil,表示直接该值删除
		}

		// 该节点有两棵子树,选择更高的哪个来替换
		// 第二种情况,删除的节点下有两个子树,选择高度更高的子树下的节点来替换被删除的节点,如果左子树更高,选择左子树中最大的节点,也就是左子树最右边的叶子节点,如果右子树更高,选择右子树中最小的节点,也就是右子树最左边的叶子节点。最后,删除这个叶子节点。
		if node.Left != nil && node.Right != nil {
			// 左子树更高,拿左子树中最大值的节点替换
			if node.Left.Height > node.Right.Height {
				maxNode := node.Left
				for maxNode.Right != nil {
					maxNode = maxNode.Right
				}

				// 最大值的节点替换被删除节点
				node.Value = maxNode.Value
				node.Times = maxNode.Times

				// 把最大的节点删掉
				node.Left = node.Left.Delete(maxNode.Value)
				// 删除后要更新该子树高度
				node.Left.UpdateHeight()
			} else {
				// 右子树更高,拿右子树中最小值的节点替换
				minNode := node.Right
				for minNode.Left != nil {
					minNode = minNode.Left
				}

				// 最小值的节点替换被删除节点
				node.Value = minNode.Value
				node.Times = minNode.Times

				// 把最小的节点删掉
				node.Right = node.Right.Delete(minNode.Value)
				// 删除后要更新该子树高度
				node.Right.UpdateHeight()
			}
		} else {
			// 只有左子树或只有右子树
			// 只有一个子树,该子树也只是一个节点,将该节点替换被删除的节点,然后置子树为空
			if node.Left != nil {
				//第三种情况,删除的节点只有左子树,因为树的特征,可以知道左子树其实就只有一个节点,它本身,否则高度差就等于2了。
				node.Value = node.Left.Value
				node.Times = node.Left.Times
				node.Height = 1
				node.Left = nil
			} else if node.Right != nil {
				//第四种情况,删除的节点只有右子树,因为树的特征,可以知道右子树其实就只有一个节点,它本身,否则高度差就等于2了。
				node.Value = node.Right.Value
				node.Times = node.Right.Times
				node.Height = 1
				node.Right = nil
			}
		}

		// 找到值后,进行替换删除后,直接返回该节点
		return node
	}

	// 左右子树递归删除节点后需要平衡
	var newNode *AVLTreeNode
	// 相当删除了右子树的节点,左边比右边高了,不平衡
	if node.BalanceFactor() == 2 {
		if node.Left.BalanceFactor() >= 0 {
			newNode = RightRotation(node)
		} else {
			newNode = LeftRightRotation(node)
		}
		//  相当删除了左子树的节点,右边比左边高了,不平衡
	} else if node.BalanceFactor() == -2 {
		if node.Right.BalanceFactor() <= 0 {
			newNode = LeftRotation(node)
		} else {
			newNode = RightLeftRotation(node)
		}
	}

	if newNode == nil {
		node.UpdateHeight()
		return node
	} else {
		newNode.UpdateHeight()
		return newNode
	}
}

// 中序遍历
func (tree *AVLTree) MidOrder() {
	tree.Root.MidOrder()
}

func (node *AVLTreeNode) MidOrder() {
	if node == nil {
		return
	}

	// 先打印左子树
	node.Left.MidOrder()

	// 按照次数打印根节点
	for i := 0; i <= int(node.Times); i++ {
		fmt.Println("value:", node.Value, " tree height:", node.BalanceFactor())
	}

	// 打印右子树
	node.Right.MidOrder()
}

// 验证是不是棵AVL树
func (tree *AVLTree) IsAVLTree() bool {
	if tree == nil || tree.Root == nil {
		return true
	}

	// 判断节点是否符合 AVL 树的定义
	if tree.Root.IsRight() {
		return true
	}

	return false
}

// 判断节点是否符合 AVL 树的定义
func (node *AVLTreeNode) IsRight() bool {
	if node == nil {
		return true
	}

	// 左右子树都为空,那么是叶子节点
	if node.Left == nil && node.Right == nil {
		// 叶子节点高度应该为1
		if node.Height == 1 {
			return true
		} else {
			fmt.Println("leaf node height is ", node.Height)
			return false
		}
	} else if node.Left != nil && node.Right != nil {
		// 左右子树都是满的
		// 左儿子必须比父亲小,右儿子必须比父亲大
		if node.Left.Value < node.Value && node.Right.Value > node.Value {
		} else {
			// 不符合 AVL 树定义
			fmt.Printf("father is %v lchild is %v, rchild is %v\n", node.Value, node.Left.Value, node.Right.Value)
			return false
		}

		bal := node.Left.Height - node.Right.Height
		if bal < 0 {
			bal = -bal
		}

		// 子树高度差不能大于1
		if bal > 1 {
			fmt.Println("sub tree height bal is ", bal)
			return false
		}

		// 如果左子树比右子树高,那么父亲的高度等于左子树+1
		if node.Left.Height > node.Right.Height {
			if node.Height == node.Left.Height+1 {
			} else {
				fmt.Printf("%#v height:%v,left sub tree height: %v,right sub tree height:%v\n", node, node.Height, node.Left.Height, node.Right.Height)
				return false
			}
		} else {
			// 如果右子树比左子树高,那么父亲的高度等于右子树+1
			if node.Height == node.Right.Height+1 {
			} else {
				fmt.Printf("%#v height:%v,left sub tree height: %v,right sub tree height:%v\n", node, node.Height, node.Left.Height, node.Right.Height)
				return false
			}
		}

		// 递归判断子树
		if !node.Left.IsRight() {
			return false
		}

		// 递归判断子树
		if !node.Right.IsRight() {
			return false
		}

	} else {
		// 只存在一棵子树
		if node.Right != nil {
			// 子树高度只能是1
			if node.Right.Height == 1 && node.Right.Left == nil && node.Right.Right == nil {
				if node.Right.Value > node.Value {
					// 右节点必须比父亲大
				} else {
					fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
					return false
				}
			} else {
				fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
				return false
			}
		} else {
			if node.Left.Height == 1 && node.Left.Left == nil && node.Left.Right == nil {
				if node.Left.Value < node.Value {
					// 左节点必须比父亲小
				} else {
					fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
					return false
				}
			} else {
				fmt.Printf("%v,(%#v,%#v) child", node.Value, node.Right, node.Left)
				return false
			}
		}
	}

	return true
}

func main() {
	values := []int64{2, 3, 7, 10, 10, 10, 10, 23, 9, 102, 109, 111, 112, 113}

	// 初始化二叉查找树并添加元素
	tree := NewAVLTree()
	for _, v := range values {
		tree.Add(v)
	}

	// 找到最大值或最小值的节点
	fmt.Println("find min value:", tree.FindMinValue())
	fmt.Println("find max value:", tree.FindMaxValue())

	// 查找不存在的99
	node := tree.Find(99)
	if node != nil {
		fmt.Println("find it 99!")
	} else {
		fmt.Println("not find it 99!")
	}

	// 查找存在的9
	node = tree.Find(9)
	if node != nil {
		fmt.Println("find it 9!")
	} else {
		fmt.Println("not find it 9!")
	}

	// 删除存在的9后,再查找9
	tree.Delete(9)
	tree.Delete(10)
	tree.Delete(2)
	tree.Delete(3)
	tree.Add(4)
	tree.Add(3)
	tree.Add(10)
	tree.Delete(111)
	node = tree.Find(9)
	if node != nil {
		fmt.Println("find it 9!")
	} else {
		fmt.Println("not find it 9!")
	}

	// 中序遍历,实现排序
	tree.MidOrder()

	if tree.IsAVLTree() {
		fmt.Println("is a avl tree")
	} else {
		fmt.Println("is not avl tree")
	}
}

运行结果:

find min value: &{2 0 1 <nil> <nil>}
find max value: &{113 0 1 <nil> <nil>}
not find it 99!
find it 9!
not find it 9!
value: 3  tree height: 0
value: 4  tree height: 1
value: 7  tree height: 0
value: 10  tree height: 0
value: 23  tree height: 1
value: 102  tree height: 1
value: 109  tree height: 0
value: 112  tree height: 0
value: 113  tree height: 0
is a avl tree

可以看到,它确实是一棵 AVL 树。

PS:我们的程序是递归程序,如果改写为非递归形式,效率和性能会更好,在此就不实现了,理解AVL树添加和删除的总体思路即可。

八、应用场景

AVL 树作为严格平衡的二叉查找树,在 windows 对进程地址空间的管理被使用到。