算法、数据结构

Cypress

2020-04-09

关注关注

算法、数据结构

理论基础

数据结构
- 栈，队列，链表，二叉树
算法：
- 选择，冒泡，二分查找，快速排序，希尔排序，插入排序，二叉树的排序，链表排序

什么是计算机科学？

首先明确的一点就是计算机科学不仅仅是对计算机的研究，虽然计算机在科学发展的过程中发挥了重大的作用，但是它只是一个工具，一个没有灵魂的工具而已。所谓的计算机科学实际上是对问题、解决问题以及解决问题的过程中产生产生的解决方案的研究。例如给定一个问题，计算机科学家的目标是开发一个算法来处理该问题，最终得到该问题的解、或者最优解。所以说计算机科学也可以被认为是对算法的研究。因此我们也可以感受到，所谓的算法就是对问题进行处理且求解的一种实现思路或者思想。

如何形象化的理解算法

一个常胜将军在作战之前都会进行战略的制定，目的是为了能够在最短的时间切成本消耗最低的情况下获取最终的胜利。如果将编码作为战场，则程序员就是这场战役的指挥官，你如何可以将你的程序可以在最短且消耗资源最小的情况下获取最终的执行结果呢？算法就是我们的策略！

意义

数据结构和算法思想的通用性异常的强大，在任何语言中都被使用，它们将会是我们编码生涯中伴随我们最长久利器（左膀右臂）。有一定经验的程序员最终拼的就是算法和数据结构。
数据结构和算法思想也可以帮助我们拓展和历练编码的思维，可以让我们更好的融入到编程世界的角角落落。

什么是算法分析？

刚接触编程的学生经常会将自己编写的程序和别人的程序做比对，获取在比对的过程中会发现双方编写的程序很相似但又各不相同。那么就会出现一个有趣的现象：两组程序都是用来解决同一个问题的，但是两组程序看起来又各不相同，那么哪一组程序更好呢？
a+b+c = 1000 a2 + b2 = c**2 (a,b,c均为自然数)，求出a,b,c可能的组合？

方法1

for a in range(0,1001):
    for b in range(0,1001):
        for c in range(0,1001):
            if a+b+c == 1000 and a**2+b**2 == c**2:
                print(a,b,c)

方法2

for a in range(0,1001):
    for b in range(0,1001):
        c = 1000-a-b
        if a+b+c == 1000 and a**2+b**2 == c**2:
                print(a,b,c)
0 500 500
200 375 425
375 200 425
500 0 500

评判程序优劣的方法

消耗计算机资源和执行效率（不推荐，无法直观）
计算算法执行的耗时（适当推荐，因为会受机器和执行环境的影响）
时间复杂度（推荐）

时间复杂度

评判规则：量化算法执行的操作/执行步骤的数量
最重要的项：时间复杂度表达式中最有意义的项
大O记法：就是使用时间复杂度衡量算法好坏的表现形式。
- O(最重要的项)

def sumOfN(n):
    theSum = 0 #1
    for i in range(1,n+1):
        theSum = theSum + i  	# n
    return theSum  				# 1

print(sumOfN(10))  # 55
# n+1+1 --> O(n)  # 取最重要的部分，省去数字，保留n

案例：计算下列算法的时间复杂度

a=5
b=6
c=10
for i in range(n):
   for j in range(n):
      x = i * i
      y = j * j
      z = i * j
for k in range(n):
   w = a*k + 45
   v = b*b
d = 33

# 3+3n**2+2n+1
# O(n**2)  # 取最重要的部分，省去数字，保留n；n的话保留最高影响力的

常见的时间复杂度：
- O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)

数据结构

概念：对于数据（基本类型的数据（int,float,char））的组织方式就被称作为数据结构。数据结构解决的就是一组数据如何进行保存，保存形式是怎样的。
案例：需要存储一些学生的学生信息（name,score）,那么这些数据应该如何组织呢？查询某一个具体学生的时间复杂度是什么呢？（三种组织方式）

方法1

[{
    ‘name‘:‘xxx‘,
    ‘score‘:‘xxx‘
},{
    ‘name‘:‘xxx‘,
    ‘score‘:‘xxx‘
},{
    ‘name‘:‘xxx‘,
    ‘score‘:‘xxx‘
}]
# O(n)

[{‘name‘: ‘xxx‘, ‘score‘: ‘xxx‘},
 {‘name‘: ‘xxx‘, ‘score‘: ‘xxx‘},
 {‘name‘: ‘xxx‘, ‘score‘: ‘xxx‘}]

方法2

[
    (‘name‘,‘score‘),
    (‘name‘,‘score‘),
    (‘name‘,‘score‘)
]
# O(n)

[(‘name‘, ‘score‘), (‘name‘, ‘score‘), (‘name‘, ‘score‘)]

方法3

{
    ‘zhangsan‘:{‘score‘:‘xxx‘},
    ‘lisi‘:{‘score‘:‘xxx‘}
}
# O(1) dict在查询指定变量名方面明显优于list

{‘zhangsan‘: {‘score‘: ‘xxx‘}, ‘lisi‘: {‘score‘: ‘xxx‘}}

三种组织形式基于查询的时间复杂度？
使用不同的形式组织数据，在基于查询时的时间复杂度是不一样的。因此认为算法是为了解决实际问题而设计的，数据结构是算法需要处理问题的载体。

目标

本节的目标是告诉大家Python列表和字典操作的大O 性能。然后我们将做一些基于时间的实验来说明每个数据结构的花销和使用这些数据结构的好处

实操

在列表的操作有一个非常常见的编程任务就是是增加一个列表。我们马上想到的有两种方法可以创建更长的列表，可以使用 append 方法或拼接运算符。但是这两种方法那种效率更高呢。这对你来说很重要，因为它可以帮助你通过选择合适的工具来提高你自己的程序的效率。
实例化一个空列表，然后将0-n范围的数据添加到列表中。（四种方式）
timeit模块：该模块可以用来测试一段python代码的执行速度/时长。
Timer类：该类是timeit模块中专门用于测量python代码的执行速度/时长的。原型为：class timeit.Timer(stmt=‘pass‘,setup=‘pass‘)。
- stmt参数：表示即将进行测试的代码块语句。
- setup：运行代码块语句时所需要的设置。
- timeit函数：timeit.Timer.timeit(number=100000),该函数返回代码块语句执行number次的平均耗时。

def test01():
    alist = []
    for i in range(1000):
        alist.append(i)
    return alist

def test02():
    alist = []
    for i in range(1000):
        alist = alist + [i]
    return alist

def test03():
    alist = [i for i in range(1000)]
    return alist

def test04():
    alist = list(range(1000))
    return alist

四种方式中哪种方式添加列表元素的效率最高呢？
- 计算运行平均耗时

from timeit import Timer

def test01():
    alist = []
    for i in range(1000):
        alist.append(i)
    return alist

def test02():
    alist = []
    for i in range(1000):
        alist = alist + [i]
    return alist

def test03():
    alist = [i for i in range(1000)]
    return alist

def test04():
    alist = list(range(1000))
    return alist

if __name__== ‘__main__‘:  # 这是.py文件写法
    timer1 = Timer(stmt=‘test01()‘,setup=‘from __main__ import test01‘)
    t1 = timer1.timeit(100) 
    
    timer2 = Timer(stmt=‘test02()‘,setup=‘from __main__ import test02‘)
    t2 = timer2.timeit(100)
    
    timer3 = Timer(stmt=‘test03()‘,setup=‘from __main__ import test03‘)
    t3 = timer3.timeit(100) 
    
    timer4 = Timer(stmt=‘test04()‘,setup=‘from __main__ import test04‘)
    t4 = timer4.timeit(100)
    
    print(t1,t2,t3,t4)  # 结果可以看出 t4 < t3 < t1 < t2，即t4效率最高

0.0057362 0.1003685 0.0023975999999999997 0.0010071999999999998

%%timeit  # 这是IPython特有的，jupyter notebook内置IPython
print(‘aaa‘)
# 结果中可以看出print()函数在当前条件（包括硬件）下的执行平均耗时为147 μs ± 26.5 μs

aaa
aaa
...
aaa
aaa
147 μs ± 26.5 μs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

ul 数据结构算法

Cypress

0 关注 0 粉丝 0 动态

关注关注

数据结构 & Java中的内存

顺序表，将元素顺序地存放在一块连续的存储区里，元素间的顺序关系由它们的存储顺序自然表示。链表，将元素存放在通过链接构造起来的一系列存储块中。ArrayList 的本质是对数组Object[ ] 的封装，将该数组作为它的一个属性。对 ArrayLis

mingyunxiaohai 2020-07-19

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 2020-11-06

Dubbo中的时间轮(Time Wheel)算法应用

Netty、Quartz、Kafka 以及 Linux 都有定时任务功能。在任务量大、性能要求高的场景，为了将任务存取及取消操作时间复杂度降为 O，会采用时间轮算法。指针周期性跳动，跳动到一个槽位，就执行该槽位的定时任务。需要高效的定时器算法以减少总体中断

ATenhong 2020-10-15

《Machine Learning Yearning》总结

在训练数据不足的情况下，你可以尝试引入额外的训练数据，只要它们能提供对训练有价值的信息。如果模型在引入额外数据的训练数据集和引入额外数据的测试数据集中都表现的很好，但在不引入额外数据的测试数据集中表现糟糕，那么这种情况称为：数据不匹配。此时可以考虑在目标函

bluewelkin 2020-09-16

编程语言TOP10！该如何选择适合自己的？

编程领域大约有700种代码语言。理解编程语言的重要性以及其如何影响需要执行的具体任务至关重要。一篇文章穷尽700 种语言不现实，也没有意义。因此，笔者挑选出了时下最热门的原因，在本文中一一分析其特征、优缺点和发展方向，并确定其是否有学习价值。根据设计，C

chensen 2020-11-14

前端一面基础知识 ⑥——性能优化、Web安全、Linux常用命令

④用户输入结束或暂停时，才会触发change事件，类似搜索框中输入信息停下来1秒后才会出现可能要搜索的内容。控制事件发生的频率，如控制为1秒发生一次，甚至1分钟发生一次。与服务端及网关控制的限流类似。防抖是触发间隔大于time触发，所以每次在小于间隔tim

yanzhelee 2020-10-13

Java程序员怎样打造高效率的开发环境

作为一名程序员，好的开发环境可以提升你的工作效率，事半功倍。那么一名Java程序员应该拥有什么样的开发工具呢。java程序员都知道，第一节课就会教你安装jdk。jdk是java开发工具包，包含了jvm虚拟机，你写的java代码就是通过jdk编译运行的。ja

佛系程序员J 2020-10-10

AI创业哪家强？6大选择给你方向

guojin0 2020-10-08

如何使Java程序员拥有高效率的开发环境

佛系程序员J 2020-10-08

移动APP开发有哪些框架？

现在比较流行的移动APP开发框架有以下六种：网页、混合、不仅、原生、桥接、自绘。前三种体验与Web的体验相似，后三种与原生APP的体验相似。这六种框架形式，都有自己适用的范围。无所谓好坏，适用就是好。自绘应用适用于游戏和有特殊效果的应用，最大的好处是没有平

wwzaqw 2020-09-04

那些与健康运营密切相关的衡量标准

下面，我们将和您在健康运营的过程中，企业所面临的各项挑战、痛点、以及需要衡量的各项关键指标。在此基础上，我们会进一步给出一个标准成熟度模型，以及对应的实践案例。同时，由于不同团队各司其职、各自为政，因此数据孤岛的现象在企业中屡见不鲜。对应的KPI包括：了解

zhongdaowendao 2020-09-02

mysql分库分表篇

当表的数量达到几百上千张表时，众多的业务模块都访问这个数据库，压力会非常的大，考虑对其进行分库。支持MySQL、Oracle、DB2、SQL Server、PostgreSQL等DB的常见SQL语法。基于心跳的自动故障切换，支持读写分离，支持MySQ

favouriter 2020-08-18

怎么才能隐藏的IP？打造超强IP池项目，让你自己都忘记原本的IP

随着大型网站反扒机制的增强，更改IP登陆已经成为一种最高效的方式，为此打造一款超强IP池项目，采用最新最快的Python技术——异步。编写了一个免费的异步爬虫代理池，以 Python asyncio 为基础，充分利用 Python 的异步性能，异步处理比同

奎因amp华洛 2020-08-15

移动端跨平台技术之下的变与不变

跨 Native 与 Web：商品详情页等要求有一套功能差不多的 Web 页能够在端外访问，需要跨 Native App 与 Web. 容器化 Native 跨端：将 Native App 改造成标准化的容器，进而允许一套代码跨多端标准容器运行，如 Rea

一青年 2020-08-13

数据科学家的工具列表：提高生产效率的工具包

本文转载自公众号“读芯术”。新的东西令人激动，新的框架、新的仪器、新的工具，都会让生活变得更轻松。保持更新很难，我们需要花更多的时间在其上。当然，我们并不是要一直更新到最新的发现，它可能是某个特定库的新的小版本，也可能是处于兴趣或是工作需要而寻找。应用tf

千锋 2020-08-10

JVM

新生代，老年代，永久代/元空间。晋升机制根据对象存活时间。jmap -dump:file=[文件名] pid：将进程运行的状况dump到文件中,文件通过fastThread线上工具分析。

nangongyanya 2020-08-09

MyBatis接口代理方式实现Dao层

Mybatis中namespace用于绑定dao接口，dao接口的方法对应mapper中的sql语名。--默认名为类名首字母小写-->. --environment配置数据库环境 id 属性唯一标识 -->. --dataSource数据源信息

dongxurr 2020-08-08

Python名称空间与作用域

在python解释器开始执行, 就会在内存中开辟一个空间, 每当遇到一个变量的时候, 就把变量名和值之间的关系记录下来,当遇到函数定义的时候, 解释器只是把函数名读入内存, 并检查语法是否正确，表示这个函数存在了, 至于函数内部的变量和逻辑, 解释器是不关

明天你好 2020-08-03

python List 和Numpy array 区别

一个numpy array 是内存中一个连续块，并且array里的元素都是同一类。　　 list完全不同，它的每个元素其实是一个地址的引用，这个地址又指向了另一个元素，这些元素的在内存里不一定是连续的。所以list其实是只能塞进地址的“数组”

kyelu 2020-08-03

Redis 内存压缩原理

Redis 无疑是一个大量消耗内存的数据库，因此 Redis 引入了一些设计巧妙的数据结构进行内存压缩来减轻负担。ziplist、quicklist 以及 intset 是其中最常用最重要的压缩存储结构。Redis对外提供了 string, list, h

Ashes 2020-08-03

安科网

算法、数据结构

Cypress

算法、数据结构

理论基础

什么是计算机科学？

如何形象化的理解算法

意义

什么是算法分析？

评判程序优劣的方法

时间复杂度

数据结构

目标

实操

Cypress

相关推荐

数据结构 & Java中的内存

选择困难终结者：不同问题之下的机器学习算法

Dubbo中的时间轮(Time Wheel)算法应用

《Machine Learning Yearning》总结

编程语言TOP10！该如何选择适合自己的？

前端一面基础知识 ⑥——性能优化、Web安全、Linux常用命令

Java程序员怎样打造高效率的开发环境

AI创业哪家强？6大选择给你方向

如何使Java程序员拥有高效率的开发环境

移动APP开发有哪些框架？

那些与健康运营密切相关的衡量标准

mysql分库分表篇

怎么才能隐藏的IP？打造超强IP池项目，让你自己都忘记原本的IP

移动端跨平台技术之下的变与不变

数据科学家的工具列表：提高生产效率的工具包

JVM

MyBatis接口代理方式实现Dao层

Python名称空间与作用域

python List 和Numpy array 区别

Redis 内存压缩原理

Cypress