纸上谈兵: 树, 二叉树, 二叉搜索树

  • 时间:
  • 浏览:0

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!

树的形态和定义

树(Tree)是元素的集合。亲戚亲戚大伙先以比较直观的法律依据 介绍树。下面的数据形态是另有一一四个树:

树有多个节点(node),用以储存元素。或多或少节点之间处于一定的关系,用连线表示,连线称为边(edge)。边的中间节点称为父节点,下端称为子节点。树像是另有一一四个不断分叉的树根。

每个节点可不前要有多个子节点(children),而该节点是相应子节点的父节点(parent)。比如说,3,5是6的子节点,6是3,5的父节点;1,8,7是3的子节点, 3是1,8,7的父节点。树另有一一四个越来越父节点的节点,称为根节点(root),如图中的6。越来越子节点的节点称为叶节点(leaf),比如图中的1,8,9,5节点。从图中还可不前要看多,中间的树总共有另有一一四个层次,6处于第一层,9处于第四层。树中节点的最大层次被称为宽度。也却一段话,该树的宽度(depth)为4。

将会亲戚亲戚大伙从节点3过后 开使英语 英语 向下看,而忽略其它每种。越来越亲戚亲戚大伙看多的是另有一一四个以节点3为根节点的树:

三角形代表一棵树

再进一步,将会亲戚亲戚大伙定义孤立的另有一一四个节点是一棵树一段话,另有一一四个的树就可不前要表示为根节点和子树(subtree)的关系:

上述观察实际上给了亲戚亲戚大伙这人 严格的定义树的法律依据 :

1. 树是元素的集合。

2. 该集合可不前要为空。这时树中越来越元素,亲戚亲戚大伙称树为空树 (empty tree)

3. 将会该集合不为空,越来越该集合另有一一四个根节点,以及0个将会多个子树。根节点与它的子树的根节点用另有一一四个边(edge)相连。

中间的第三点是以递归的法律依据 来定义树,也而是在定义树的过程中使用了树自身(子树)。将会树的递归形态,或多或少树相关的操作也可不前要方便的使用递归实现。亲戚亲戚大伙将在中间看多。

(上述定义来自"Data Structures and Algorithm Analysis in C, by Mark Allen Weiss"。 我虽然有或多或少不太严格的地方。将会说空树属于树,第三点应该是 “...以及0个和多个非空子树...” )

树的实现

树的示意图将会给出了树的这人 内存实现法律依据 : 每个节点储存元素和多个指向子节点的指针。然而,子节点数目是不选着的。另有一一四个父节点将会有一定量的子节点,而另有一一四个父节点将会只另有一一四个子节点,而树的增删节点操作会让子节点的数目处于进一步的变化。这人 不选着性就将会带来一定量的内存相关操作,但会 容易造成内存的浪费。

这人 经典的实现法律依据 如下:

树的内存实现

拥有同一父节点的另有一一四个节点互为兄弟节点(sibling)。上图的实现法律依据 中,每个节点涵盖另有一一四个指针指向第另有一一四个子节点,并另有一一四个指针指向它的下另有一一四个兄弟节点。另有一一四个,亲戚亲戚大伙就可不前要用统一的、选着的形态来表示每个节点。

计算机的文件系统是树的形态,比如Linux文件管理背景知识中所介绍的。在UNIX的文件系统中,每个文件(文件夹同样是这人 文件),都可不前要看做是另有一一四个节点。非文件夹的文件被储处于叶节点。文件夹涵盖指向父节点和子节点的指针(在UNIX中,文件夹还涵盖另有一一四个指向自身的指针,这与亲戚亲戚大伙中间见到的树有所区别)。在git中,完会 类似的树状形态,用以表达整个文件系统的版本变化 (参考版本管理三国志)。

文件树

二叉搜索树的C实现

二叉树(binary)是这人 特殊的树。二叉树的每个节点最多不到有另有一一四个子节点

二叉树

将会二叉树的子节点数目选着,而是可不前要直接采用上图法律依据 在内存中实现。每个节点另有一一四个左子节点(left children)右子节点(right children)。左子节点是左子树的根节点,右子节点是右子树的根节点。

将会亲戚亲戚大伙给二叉树加另有一一四个额外的条件,就可不前要得到这人 被称作二叉搜索树(binary search tree)的特殊二叉树。二叉搜索树要求:每个节点完会 比它左子树的任意元素小,但会 不比它的右子树的任意元素大。

(将会亲戚亲戚大伙假设树中越来越重复的元素,越来越上述要求可不前要写成:每个节点比它左子树的任意节点大,但会 比它右子树的任意节点小)

二叉搜索树,注意树中元素的大小

二叉搜索树可不前要方便的实现搜索算法。在搜索元素x的过后 ,亲戚亲戚大伙可不前要将x和根节点比较:

1. 将会x等于根节点,越来越找到x,停止搜索 (终止条件)

2. 将会x小于根节点,越来越搜索左子树

3. 将会x大于根节点,越来越搜索右子树

二叉搜索树所前要进行的操作次数最多与树的宽度相等。n个节点的二叉搜索树的宽度最多为n,相当于为log(n)。

下面是用C语言实现的二叉搜索树,并有搜索插入删除寻找最大最小节点的操作。每个节点中存有另有一一四个指针,另有一一四个指向父节点,另有一一四个指向左子节点,另有一一四个指向右子节点。

(另有一一四个的实现是为了方便。节点可不前要只保存有指向左右子节点的另有一一四个指针,并实现上述操作。)

删除节点相对比较冗杂。删除节点后,有时前要进行一定的调整,以恢复二叉搜索树的性质(每个节点完会 比它左子树的任意元素小,但会 不比它的右子树的任意元素大)。

  • 叶节点可不前要直接删除。
  • 删除非叶节点时,比如下图中的节点8,亲戚亲戚大伙可不前要删除左子树中最大的元素(将会右树中最大的元素),用删除的节点来补充元素8产生的空缺。但该元素将会也完会 叶节点,而是它所产生的空缺前要或多或少元素补充…… 直到最后删除另有一一四个叶节点。上述过程可不前要递归实现。

删除节点

删除节点后的二叉搜索树

/* By Vamei */
/* binary search tree */
#include <stdio.h>
#include <stdlib.h>

typedef struct node *position;
typedef int ElementTP;

struct node {
    position parent;
    ElementTP element;
    position lchild;
    position rchild;
};

/* pointer => root node of the tree */
typedef struct node *TREE;

void print_sorted_tree(TREE);
position find_min(TREE);
position find_max(TREE);
position find_value(TREE, ElementTP);
position insert_value(TREE, ElementTP);
ElementTP delete_node(position);

static int is_root(position);
static int is_leaf(position);
static ElementTP delete_leaf(position);
static void insert_node_to_nonempty_tree(TREE, position);

void main(void) 
{
    TREE tr;
    position np;
    ElementTP element;
    tr = NULL;
    tr = insert_value(tr, 18);
    tr = insert_value(tr, 5);
    tr = insert_value(tr, 2); 
    tr = insert_value(tr, 8);
    tr = insert_value(tr, 81);
    tr = insert_value(tr, 101);
    printf("Original:\n");
    print_sorted_tree(tr);

    np = find_value(tr, 8);
    if(np != NULL) {
        delete_node(np);
        printf("After deletion:\n");
        print_sorted_tree(tr);
    }
}


/* 
 * print values of the tree in sorted order
 */
void print_sorted_tree(TREE tr)
{
    if (tr == NULL) return;
    print_sorted_tree(tr->lchild);
    printf("%d \n", tr->element);
    print_sorted_tree(tr->rchild);
}

/*
 * search for minimum value
 * traverse lchild
 */
position find_min(TREE tr)
{
    position np;
    np = tr;
    if (np == NULL) return NULL;
    while(np->lchild != NULL) {
        np = np->lchild;
    }
    return np;
}

/*
 * search for maximum value
 * traverse rchild
 */
position find_max(TREE tr)
{
    position np;
    np = tr;
    if (np == NULL) return NULL;
    while(np->rchild != NULL) {
        np = np->rchild;
    }
    return np;
}

/*
 * search for value
 *
 */
position find_value(TREE tr, ElementTP value) 
{
    if (tr == NULL) return NULL; 

    if (tr->element == value) {
        return tr;
    }
    else if (value < tr->element) {
        return find_value(tr->lchild, value);
    }
    else {
        return find_value(tr->rchild, value);
    }
}

/* 
 * delete node np 
 */
ElementTP delete_node(position np) 
{
    position replace;
    ElementTP element;
    if (is_leaf(np)) {
        return delete_leaf(np);
    }   
    else {
        /* if a node is not a leaf, then we need to find a replacement */
        replace = (np->lchild != NULL) ? find_max(np->lchild) : find_min(np->rchild);
        element = np->element;
        np->element = delete_node(replace);
        return element;
    }
}

/* 
 * insert a value into the tree
 * return root address of the tree
 */
position insert_value(TREE tr, ElementTP value) {
    position np;
    /* prepare the node */
    np = (position) malloc(sizeof(struct node));
    np->element = value;
    np->parent  = NULL;
    np->lchild  = NULL;
    np->rchild  = NULL;
 
    if (tr == NULL) tr = np;
    else {
        insert_node_to_nonempty_tree(tr, np);
    }
    return tr;
}


//=============================================

/*
 * np is root?
 */
static int is_root(position np)
{
    return (np->parent == NULL);
}

/*
 * np is leaf?
 */
static int is_leaf(position np)
{
    return (np->lchild == NULL && np->rchild == NULL);
}

/* 
 * if an element is a leaf, 
 * then it could be removed with no side effect.
 */
static ElementTP delete_leaf(position np)
{
    ElementTP element;
    position parent;
    element = np->element;
    parent  = np->parent;
    if(!is_root(np)) {
        if (parent->lchild == np) {
            parent->lchild = NULL;
        }
        else {
            parent->rchild = NULL;
        }
    }
    free(np);
    return element;
}

/*
 * insert a node to a non-empty tree
 * called by insert_value()
 */
static void insert_node_to_nonempty_tree(TREE tr, position np)
{
    /* insert the node */
    if(np->element <= tr->element) {
        if (tr->lchild == NULL) {
            /* then tr->lchild is the proper place */
            tr->lchild = np;
            np->parent = tr;
            return;
        }
        else {
            insert_node_to_nonempty_tree(tr->lchild, np);
        }
    }
    else if(np->element > tr->element) {
        if (tr->rchild == NULL) {
            tr->rchild = np;
            np->parent = tr;
            return;
        }
        else {
            insert_node_to_nonempty_tree(tr->rchild, np);
        }
    }
}

运行结果:

Original:

2

5

8

18

81

101

After deletion:

2

5

18

81

101

上述实现中的删除比较冗杂。有这人 简单的替代操作,称为懒惰删除(lazy deletion)。在懒惰删除时,亲戚亲戚大伙不要真正从二叉搜索树中删除该节点,而是将该节点标记为“已删除”。另有一一四个,亲戚亲戚大伙只用找到元素并标记,就可不前要完成删除元素了。将会有相同的元素重新插入,亲戚亲戚大伙可不前要将该节点找到,并撤出 删除标记。

懒惰删除的实现比较简单,可不前要尝试一下。树所处于的内存空间不要将会删除节点而减小。懒惰节点实际上是用内存空间换取操作的简便性。

总结

树, 二叉树, 二叉搜索树

二叉搜索树的删除

懒惰删除

欢迎继续阅读“纸上谈兵: 算法与数据形态”系列。