数据结构(算法)
什么是算法
- 解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作
- 算法就是解决问题的技巧和方式
- 算法的五个基本特性:输入,输出,有穷性,确定性,可行性
算法的特性
- 输入:算法具有零个或多个输入
- 输出:算法至少有一个或多个输出,算法一定有输出
- 有穷性:算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成
- 确定性:算法的每一个步骤都具有确定的含义,不会出现二义性;在一定条件下只有一条执行路径,相同的输入只能有唯一的输出结果;算法的每个步骤都应该被精确定义而无歧义
- 可行性:算法的每一步都必须是可行的,每一步都能通过执行有序次数完成
算法的设计要求
- 正确性:没有语法错误;对于合法的输入能产生瞒足要求的输出;非法输入能够给出说明;测试输入都有瞒足要求的输出结果
- 可读性:便于阅读,理解和交流
- 健壮性:输入数据不合法时,算法能做出相关的处理,而不是产生异常
- 时间效率高,存储量低:
算法效率的度量方法
事后统计法:通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率高低
缺陷:花费的时间好精力较大;不同的测试环境差别较大
事前分析估计法:在计算机程序编写前,依据统计方法对算法进行估计
结:高级语言编写的程序在计算机上运行时所消耗的时间取决于:
- 算法采用的策略,方案
- 编译产生的代码质量
- 问题的输入规模
- 机器执行代码的速度
由此可见,一个程序的运行时间以来于算法的好坏和问题的输入规模
★★★不记那些循环索引的递增和循环终止条件、变量声明、打印结果等操作。最终,在分析程序的运行时间里,最重要的是把程序看成是独立于程序设计语言的算法或步骤
★★★在分析一个算法的运行时间时,重要的是把基本操作的数量和输入模式关联起来
n+1 => n 常数可省
2n² => n² 系数可省
2n³+3n² => n³ 只保留最高项的阶数
判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而应该关注主项(最高项)的阶数
算法的时间复杂度
定义:语句中的执行次数 T(n) 是关于问题规模 n 的函数,进而分析 T(n) 随 n 的变化情况并确定 T(n) 的数量级。
算法是时间复杂度:T(n)=O(T(n)),表示随着问题的规模 n 的增大,算法执行时间的增长率和 T(n) 的增长率相同,称:算法的渐进时间复杂度,简称:时间复杂度
关键:执行次数==时间
分析一个算法的时间复杂度(推导大O阶)
- 用常数‘1‘取代运行时间中的所有加法常数
- 用修改后的运行次数函数中,只保留最高阶项
- 如果最高项存在且不是‘1‘,则去除这个项的系数
- 得到的最后结果就是大O阶
例 | 时间复杂度 | 术语 |
3n+4 | O(n) | 线性阶 |
3n²+4n+5 | O(n²) | 平方阶 |
3log?n+5 | O(logn) | 对数阶 |
2n+3nlog?n+4 | O(nlogn) | nlogn阶 |
n³+2n²+3n+4 | O(n³) | 立方阶 |
2?+n³+2n²+3n+4 | O(2?) | 指数阶 |
注:O(1)< O(logn) < O(n) < O(nlogn) < O(n²) < O(n³) < O(2?) < O(n!) < O(n?)
算法的空间复杂度
算法的空间复杂度通过计算机算法所需的存储空间实现;
S(n)=O(T(n));n为问题的规模,T(n)为语句关于 n 所占用的储存空间的函数。
通常,我们都用“时间复杂度”来指运行时间的需求;用“空间复杂度”指空间需求
一般,我们追求时间复杂度。