数据结构之二叉树
概要
参考《大话数据结构》,把常用的基本数据结构梳理一下。
本节介绍二叉树。
定义
二叉树(Binary Tree)是 \(n\) (\(n \geqslant 0\))个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
二叉树的特点:
- 每个结点最多有两棵子树,所以二叉树中不存在度大于 \(2\) 的结点。
- 左子树和右子树是有顺序的,次序不能任意颠倒。
- 即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。
所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。这两者统称为斜树。
在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
对一棵具有 \(n\) 个结点的二叉树按层序编号,如果编号为 \(i\) (\(1 \leqslant i \leqslant n\))的结点与同样深度的满二叉树中编号为 \(i\) 的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树。如图:
注意:首先满二叉树一定是一棵完全二叉树,但完全二叉树又不一定是满的,其次按层序编号相同的结点是一一对应的。从这里得出一些完全二叉树的特点:
- 叶子结点只能出现在最下两层
- 最下层的叶子一定集中在左部连续位置
- 倒数二层,若有叶子结点,一定都在右部连续位置
- 如果结点度为 \(1\),则该结点只有左孩子,即不存在只有右子树的情况
- 同样结点数的二叉树,完全二叉树的深度最小
二叉树的性质
性质 1: 在二叉树的第 \(i\) 层上至多有 \(2^{i-1}\) 个结点(\(i \geqslant 1\))。
性质 2: 深度为 \(k\) 的二叉树至多有 \(2^k-1\) 个结点(\(k \geqslant 1\))。
性质 3: 对任何一棵二叉树 \(T\),如果其终端结点数为 \(n_0\),度为 \(2\) 的结点数为 \(n_2\),则 \(n_0 = n_2 +1\).
说白了就是叶子结点数比度为 \(2\) 的结点数多一个。我们设 \(n_1\) 为度是 \(1\) 的结点数。则树 \(T\) 的结点总数 \(n=n_0+n_1+n_2\). 我们换个角度数一数树的连接线数,度为 \(1\) 的分支线为 \(1\) 条,度为 \(2\) 的分支线为 \(2\) 条,即共 \(n_1+2n_2\) 条,又显然树的连接树为结点总数减去 \(1\),即 \(n-1 = n_1+ 2n_2\),即 \(n_0 = n_2 +1\).
性质 4: 具有 \(n\) 个结点的完全二叉树的深度为 \(floor(\log_2n)+1\)(\(floor(x)\) 表示不超过 \(x\) 的最大整数)。
性质 5: 如果对一棵有 \(n\) 个结点的完全二叉树(其深度为 \(floor(\log_2n)+1\))的结点按层序编号(从第一层到 \(floor(\log_2n)+1\) 层,每层从左到右),对任一结点 \(i\)(\(1 \leqslant i \leqslant n\))有:
- 如果 \(i=1\),则结点 \(i\) 是二叉树的根,无双亲;如果 \(i>1\),则其双亲是结点 \(floor(i/2)\).
- 如果 \(2i>n\),则结点 \(i\) 无左孩子(结点 \(i\) 为叶子结点);否则其左孩子是结点 \(2i\).
- 如果 \(2i+1>n\),则结点 \(i\) 无右孩子,否则其右孩子是结点 \(2i+1\).
可以与上图结点理解。
二叉树的存储结构
二叉树的顺序存储结构
二叉树的顺序存储结构是用一维数组存储二叉树的结点,并且结点的存储位置,也就是数组的下标要能体现结点之间的逻辑关系。比如下面一棵完全二叉树:
将这棵二叉树存入到数组中,相应的下标对应其同样的位置,如下图:
对于一般的二叉树,尽管层序编号不能反映逻辑关系,但是可以将其按完全二叉树编号,只不过,把不存在的结点设置为空就行了。但是像极端的情况比如深度为 \(k\) 的右斜树,它只有 \(k\) 个结点,却需要分配 \(2^k-1\) 个存储单元空间,造成了极大的空间浪费,所以顺序存储结构一般只用于完全二叉树。
二叉链表
二叉树每个结点最多有两个孩子,所以为它设计一个数据域和两个指针域是比较自然的想法,我们称这样的链表叫做二叉链表。如图:
其中 data 是数据域, lchild 和 rchild 都是指针域,分别存放指向左孩子和右孩子的指针。二叉链表的结点结构定义代码如下:
typedef int TElemType; // TElemType 类型根据实际情况而定,这里假设为 int struct BiTNode { TElemType data; BiTNode *lchild, *rchild; };
如果有需要,还可以再增加一个指向双亲的指针域,那样就称之为三叉链表。
遍历二叉树
二叉树的遍历(traversing binary tree)是指从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次。
二叉树的遍历方式很多,如果我们限制了从左到右的习惯方式,那么主要分为四种:
前序遍历。规则是若二叉树为空,则空操作返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树。如图,遍历顺序为:ABDGHCEIF.
中序遍历。规则是若二叉树为空,则空操作返回,否则从根结点开始(注意并不是先访问根结点),中序遍历根结点的左子树,然后访问根结点,最后中序遍历右子树。如图,遍历顺序为:GDHBAEICF.
后序遍历。规则是若二叉树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后是访问根结点。如图,遍历顺序为:GHDBIEFCA.
层序遍历。规则是若二叉树为空,则空操作返回,否则从树的第一层,也就是从根结点开始访问,从上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。如图,遍历顺序为:ABCDEFGHI.
二叉树树的建立与遍历代码实现
如果我们要在内存中建立一个如下左图这样的二叉树,为了能让每个结点确认是否有左右孩子,我们对它进行扩展,就右图的样子,也就是将二叉树中每个结点的空指针引出一个虚结点,其值为一个特定值,比如“#”。我们称这种处理后的二叉树为原二叉树的扩展二叉树。扩展二叉树就可以做到一个遍历序列确定一棵二叉树。比如右图的遍历序列就为 AB#D##C##.
有了这样的准备就可以着手建立二叉树了。创建二叉树同遍历方法一样,也有不同的创建方法。现在我们用前序实现二叉树的建议。代码如下:
#include<iostream> #include<cstdio> //getchar() using namespace std; typedef char TElemType; // TElwmType 类型根据实际情况而定,这里假设为 int struct BiTNode { TElemType data; BiTNode *lchild, *rchild; }; void CreateBiTree(BiTNode* (&T)) //这里传入的是指针的引用,因为牵扯到修改指针的值 { //读入字符串 ch, 前序构造树 //cout<<"请输入创建一棵二叉树的结点数据"<<endl; TElemType ch = getchar(); //cin>>ch; if (ch == '#') //其中getchar()为逐个读入标准库函数 T = NULL; else { T = new BiTNode;//产生新的子树 T->data = ch; CreateBiTree(T->lchild);//递归创建左子树 CreateBiTree(T->rchild);//递归创建右子树 } } void PreOrderTraverse(BiTNode* T) { //前序遍历 if(T) //结点不为空时执行 { cout<< T->data; PreOrderTraverse(T->lchild); PreOrderTraverse(T->rchild); } else cout<<""; } void InOrderTraverse(BiTNode* T) { //中序遍历 if(T) //结点不为空时执行 { InOrderTraverse(T->lchild); cout<< T->data; InOrderTraverse(T->rchild); } else cout<<""; } void PostOrderTraverse(BiTNode* T) { //后序遍历 if(T) //结点不为空时执行 { PostOrderTraverse(T->lchild); PostOrderTraverse(T->rchild); cout<< T->data; } else cout<<""; } int main() { //const char* ch = "AB#D##C##"; BiTNode *T; cout<<"创建树结构,请输入字符,‘#’ 代表空:"<<endl; CreateBiTree(T); //输入 AB#D##C## cout<<"创建完毕"<<endl; cout<<T->data<<endl; cout<<"前序遍历结果:"<<endl; PreOrderTraverse(T);//输出 ABDC cout<<endl; cout<<"中序遍历结果:"<<endl; InOrderTraverse(T); //输出 BDAC cout<<endl; cout<<"后序遍历结果:"<<endl; PostOrderTraverse(T);//输出 DBCA cout<<endl; return ; }
上边主要的疑惑是指针的引用,暂时先参考二叉树建立,指针问题. 遇到修改指针的得注意了。