深入理解python(二)python基础知识之数据结构
数据结构
Python中的内置数据结构(Built-in Data Structure):列表list、元组tuple、字典dict、集合set,这里只着重说前三个
>>> d=dict(zip((‘e‘,‘r‘),(1,2)))
>>> d.keys()
dict_keys([‘e‘, ‘r‘])
>>> d.values()
dict_values([1, 2])
>>> d.items()
dict_items([(‘e‘, 1), (‘r‘, 2)])
列表
列表是Python中内置可变序列,是若干元素的有序集合。列表中的每一个数据称为元素,列表的所有元素放在一对中括号 [ 和 ] 中,并使用逗号分隔开
关于列表的一些重要操作函数汇总
接下来是几个列表涉及的重要知识点
1.extend()和append()
extend()是将加入对象中的元素拼接到列表对象的后面,而append()则是将加入对象直接加入列表末尾。
例:
>>> a=[1,2,3] >>> a.append([2,3]) #使用append >>> a [1, 2, 3, [2, 3]] >>> a=[1,2,3] >>> a.extend([2,3]) #使用extend >>> a [1, 2, 3, 2, 3]
2.列表的删除
一般想到列表的删除会想到循环+remove()的方法,但是在python中这种方法可能会产生想不到的错误。
例:
>>> a=[1,2,1,1,2,3,1] >>> for x in a: ... if x==1: #寻找出等于1的元素并删除 ... a.remove(x) ... >>> a [2, 2, 3, 1]
可以看到并没有完全删除等于1的元素,原因在于python删除列表中的元素后,元素后面的索引会跟着每个加一,而遍历到的索引值不变,这就会造成一些元素被跳过的情况。
解决这个问题我们可以使用列表的浅拷贝或者使用while循环进行删除,但这两种办法并不是高效的,这里给出两种较为高效率的办法。
a.将列表倒序
>>> a=[1,2,1,1,2,3,1] >>> for x in a[::-1]: ... if x==1: ... a.remove(x) ... >>> a [2, 2, 3]
b.使用列表生成式将不删除的元素筛选出来
[val for val in my_list if val != 1]
3.切片操作和range()函数
切片返回的是对象的浅拷贝,切片使用2个冒号分隔的3个数字来完成,第一个数字表示切片开始位置(默认为0),第二个数字表示切片截止(但不包含)位置(默认为列表长度),第三个数字表示切片的步长(默认为1),当步长省略时可以顺便省略最后一个冒号。
给出几个例子:
>>> a=[2,4,6,2,1,4,7,3] >>> a[1:3] #注意结尾是不算在给出的列表之中 [4, 6] >>> a[:7:2] #将步长设置为2 [2, 6, 1, 7] >>> a[::-1] #步长为-1则为逆序 [3, 7, 4, 1, 2, 6, 4, 2] >>> a[:-2] #尾项为负数代表从最后一项相减开始 [2, 4, 6, 2, 1, 4] >>> a[3:0:-1] #逆序切片时需注意首尾的颠倒 [2, 6, 4]
关于range()函数,这里借我们老师的一个说法来说明
内置函数range()的语法为:
range([start,] stop[, step])
其接收3个参数,第一个参数表示起始值(默认为0),第二个参数表示终止值(结果中不包括这个值),第三个参数表示步长(默认为1)
该函数在Python 3中返回一个range可迭代对象,在Python 2中返回一个包含若干整数的列表。另外,Python 2还提供了一个内置函数xrange()(Python 3中不提供该函数),语法与range()函数一样,但是返回xrange可迭代对象,类似于Python 3的range()函数,其特点为惰性求值,而不是像range()函数一样返回列表。例如下面的Python 2.7代码:
>>> range(10) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> xrange(10) xrange(10) >>> list(xrange(10)) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
关于惰性求值:
大意延迟求值,即返回时不给定数据结构,根据需要来进行转化,以便于节省计算机资源,这个思路在python3中很常见。
5.zip()函数和enumerate()函数
zip(列表1,列表2,…) 将多个列表对应位置元素组合为元组,并返回包含这些元组的列表
>>> a = [1,2,3] >>> b = [4,5,6] >>> c = [7,8,9] >>> d = zip(a, b, c) >>> d [(1, 4, 7), (2, 5, 8), (3, 6, 9)] #而在Python 3中则需要这样使用: >>> a = [1, 2, 3] >>> b = [4, 5, 6] >>> c = zip(a, b) >>> c <zip object at 0x0000000003728908> >>> list(c) [(1, 4), (2, 5), (3, 6)]
同样,python3采用了惰性求值的思路
enumerate()函数:
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
例:
>>>i = 0 >>> seq = [‘one‘, ‘two‘, ‘three‘] >>> for element in seq: ... print i, seq[i] ... i +=1 ... 0 one 1 two 2 thre
6.列表推导式
例:
>>> a = [x*x for x in range(10)] >>> a [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
前面的x*x可以换成任何函数
当然也可以加入嵌套循环和条件判定
例:
>>> [(x, y) for x in range(3) for y in range(3)] [(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)] >>> [(x, y) for x in [1, 2, 3] for y in [3, 1, 4] if x != y] [(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
元组
这里大概注意两点
一个是关于解包问题
首先是字典和元组的解包:
>>> a=(1,2,3) >>> b,c,d=a >>> b 1 >>> c 2 >>> d 3 >>> a={‘a‘:1,‘b‘:2,‘c‘:3} >>> x,y,z=a >>> a {‘a‘: 1, ‘b‘: 2, ‘c‘: 3} >>> x ‘a‘ >>> y ‘b‘ >>> z ‘c‘
作为参数传参时会使用到*,这里给出例子:
列表解包时,保持列表项数与参数数一致
#解包--list,元组,集合 def connect(ip,port,username,password): print(ip) print(port) print(username) print(password) info_list=[‘192.168.1.1‘,3309,‘zhaozhao‘,‘123456‘] info_tuple=(‘192.168.1.1‘,3309,‘zhaozhao‘,‘123456‘) info_set={‘192.168.1.1‘,3309,‘zhaozhao‘,‘123456‘} connect(*info_list) connect(*info_tuple) connect(*info_set)
字典解包时,使用两个**代表对值的解包,但需要参数名称和key的值一样:
dic={"name":"zhaozhao","password":"123456"} def dic_fun(name,password): print(name) print(password) dic_fun(**dic) zhaozhao 123456
第二个是关于生成器推导式
生成器推导式和列表推导式相近,不过与列表推导式不同的是,生成器推导式的结果是一个生成器对象,而不是列表,也不是元组。使用生成器对象的元素时,可以根据需要将其转化为列表或元组,也可以使用生成器对象的next()方法(Python 2.x)或__next__()方法(Python 3.x)进行遍历,或者直接将其作为迭代器对象来使用
>>> g=((i+2)**2 for i in range(10)) >>> g <generator object <genexpr> at 0x02B15C60> >>>tuple(g) (4, 9, 16, 25, 36, 49, 64, 81, 100, 121) >>> tuple(g) () >>> g=((i+2)**2 for i in range(10)) >>> g.next() #在python 3中应改为__next__() 4 >>> g.next() 9 >>> g.next() 16 >>> g.next() 25
注意这个生成器推导式产生的对象的一个特点:一次性,如在变成一个元组后,生成的可迭代对象就变成了空值,这个和前面python3中range函数和zip函数以及map函数返回的值相近,也就是惰性求值的思想。
字典
字典其实一直是我比较烦的地方了,,,,这里借用我们老师的话对之进行一个概述
字典是键值对(key-value pair)的无序可变集合
定义字典时,每个元素的键和值用冒号分隔,元素之间用逗号分隔,所有的元素放在一对大括号{ 和 }中
字典中的每个元素包含两部分:键和值,向字典添加一个键的同时,必须为该键增添一个值
字典中的键可以为任意不可变对象,比如整数、实数、复数、字符串、元组等等
字典中的键不允许重复
这里索性就把所有关于字典的东西整理一下吧
字典的创建
#创建空字典1 d = {} print(d) #创建空字典2 d = dict() #直接赋值方式 d = {"one":1,"two":2,"three":3,"four":4} #常规字典生成式 dd = {k:v for k,v in d.items()} print(dd) #加限制条件的字典生成方式 ddd = {k:v for k,v in d.items() if v % 2 ==0} print(ddd)
访问、删除和变更
#访问字典中的数据 d = {"one":1,"two":2,"three":3,"four":4} print(d["one"]) #变更字典里面的数据 d["one"] = "eins" print(d) #删除一个数据,使用del del d["one"] print(d) #运行结果如下: {‘one‘: ‘eins‘, ‘two‘: 2, ‘three‘: 3, ‘four‘: 4} {‘two‘: 2, ‘three‘: 3, ‘four‘: 4}
还有几点:
使用字典对象的get方法获取指定键对应的值,并且可以在键不存在的时候返回指定值。如不指定,默认返回None
在Python 2.7中:
使用字典对象的items()方法可以返回字典的键、值对列表
使用字典对象的keys()方法可以返回字典的键列表
使用字典对象的values()方法可以返回字典的值列表
python3中以上几个函数返回的不再是列表,为一个可迭代的视图对象
#python3>>> d=dict(zip((‘e‘,‘r‘),(1,2))) >>> d.keys() dict_keys([‘e‘, ‘r‘]) >>> d.values() dict_values([1, 2]) >>> d.items() dict_items([(‘e‘, 1), (‘r‘, 2)])