列表等序列概述
a)、数据结构:通过某种方式组织在一起的数据元素的集合。这些数据元素可以是数字或者字符,甚至可以是其他数据结构。在python中,最基本的数据结构是序列。序列都可以进行的操作包括索引,切片,加,乘,检查成员以及循环迭代。
b)、索引:序列中的每个元素都分配一个序号 - 即元素的位置,或索引,第一个索引是0,第二个索引是1,依此类推。反过来,最后一个元素序号为-1,倒数第二为-2......如下图:
c)、列表存储方式: 例如 alist = [1, “a”, [11,22], {“k1”:”v1”}],其在内存内的存储方式是这样的:
d)在python中内建的主要序列有:
列表、元组、字典、集合、字符串、range对象、map对象等
列表的创建
list0 = [ ]
list1 = ['python', '', 1997, 2000]
list2 = [1, 2, 3, 4, 5 ]
list3 = ["a", "b", "c", "d"]
list4 = list()
list5 = list(range(10))
list6 = list("ABCDEF")
list7 = list(map(int,"123456"))
给列表添加元素
append方法 在列表最后追加元素,参数是一个元素。只能接受一个参数
。
list对象.append(p_object) (注:如下:l1.append('z') 和 list.append(l1,'z')是一回事)
l1 = ['a', 'b', 'c', 'd', ]
l1.append('e')
print(l1)
print(l1.append('e'))
# 在队尾追加,没有返回值
#['a', 'b', 'c', 'd', 'e']
#None
insert方法 在列表中插入元素
格式:list对象.insert(index,start=None,stop=None)
l1 = ['a', 'b', 'c', 'd', ]
l1.insert(3,'x') # 3 指定插入索引3这个位置,就是“d”,这个位置,把‘d’ 顶到了后面
print(l1)
# ['a', 'b', 'c', 'x', 'd']
# insert可以指定插入的位置
# 插入的内部实现如下:
l1 = ['a', 'b', 'c', 'd' ]
l1.append(0) #添加一个位置
insert = int(input("输入插入的索引:"))
data = int(input("输入插入的值:"))
if insert < 0:
#插入到第一个元素,先从后往前移动
pass
elif insert >= len(l1):
#插入到最后
pass
else:
for index in range(len(l1)-1,insert,-1): #从后到要插入的位置,依次后移一位,将插入的位置腾空
l1[index] = l1[index-1]
l1[insert] = data
extend方法 在列表中同时插入多个元素,extend在执行添加的时候,被传入的
参数必须是可迭代对象
,这样通过迭代就解决了同时传入多个参数的问题个元素
。
格式:list对象.extend(iterable)
l1 = [1, 2, 3, 4, 5, ]
l1.extend([6, 7, 8, 9])
print(l1)
l1.extend('abc')
print(l1)
l1.extend('a') # 也是可迭代对象
print(l1)
# l1.extend(1) # 报错,不可迭代
l1.extend(range(5))
print(l1)
[1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', 'b', 'c']
[1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', 'b', 'c', 'a']
[1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', 'b', 'c', 'a', 0, 1, 2, 3, 4]
# extend方法内部实现如下:
# #l1.extend(range(5))
l1 = [1, 2, 3, 4, 5]
for item in range(5):
l1.append(item)
print(l1)
删除列表的元素
pop删除元素,返回值是删除的元素,默认(无参数)删除列表中最后一个元素,有参数则为指定删除索引值,索引超出范围出错
格式:list对象.pop(index=None)
l1 = [1, 2, 3, 4, 5, 6, ]
print(l1.pop()) # 删除最后一个元素并返回该值
print(l1)
print(l1.pop(2)) #2 指定是列表中的索引,等同于l1.pop(-3)
print(l1)
[1, 2, 3, 4, 5]
[1, 2, 4, 5]
# 通过while循环删除所有元素
while len(l1)>0:
print(l1.pop())
remove 删除 没有返回值,没有默认值,
参数是元素的值,注意不是索引
。同样删除的元素不存在出错
格式:list对象.remove(value)
l1 = [1, 2, 3, 4, 5, 6, ]
print(l1.remove(2)) # 注意这个2 是真的2,不是索引值
#print(l1.remove()) # 报错
print(l1)
[1, 3, 4, 5, 6]
clear 删除 保留列表名称,清空列表里面的全部值
格式:list对象.clear()
l1 = ['a', 'b', 'c', 'd', 'e', 'b', 'c']
l1.clear()
print(l1)
del 删除 通用删除 但是一般不用,del是语句,del删除的是变量,而不是数据
l1 = [1, 2, 3, 4, 5, 6, ]
del l1[2] # 按索引
print(l1)
l1 = [1, 2, 3, 4, 5, 6, ]
del l1 # 在内存中删除l1 相当于没有定义l1
# print(l1) #报错
[1, 2, 4, 5, 6]
更改列表中元素
注意与insert插入的不同,都是以原来的为位置为参照,insert是挤开,本质是添加,而这里是替换
l1 = [1, 2, 3, ]
l1[2] = 4
print(l1)
[1, 2, 4]
查找列表中的元素
index方法返回列表中的元素值的索引,若元素不存在则出错
格式:list对象.index(value, start=None, stop=None)
l1 = ['a', 'b', 'c', 'd', 'e', 'b', 'c']
print(l1.index('a'))
print(l1.index('b',1,4)) # 两个数字分别对应起始位置和结束位置
print(l1[0:5]) #按照索引取值和字符串的用法相同
print(l1[:5])
print(l1[0:5:2])
print(l1[:-1])
print(l1[:-2])
print(l1[5:1:-2])
['a', 'b', 'c', 'd', 'e']
['a', 'b', 'c', 'd', 'e']
['a', 'c', 'e']
['a', 'b', 'c', 'd', 'e', 'b']
['a', 'b', 'c', 'd', 'e']
['b', 'd']
利用切片把列表分段
l1 = ['a', 'b', 'c', 'd', 'e', 'b', 'c']
a = int(len(l1)/2)
print(l1[:a]) #从中间位置开始,列出前面所有的元素
print(l1[a:]) #从中间位置开始,列出后面所有的元素
统计某个元素的个数count
count() 计算元素在列表中出现的次数,元素不存在返回0
格式:list对象.count(value)
print(['a','b','a'].count('a'))
给列表排序
列表 reverse() 方法对列表中的元素进行反向排序,无参数,无返回值。改变自身
格式:list对象.reverse(value)
l1 = ['a', 1, 'b', 'c', 'd', 'e', 'b', 'c']
l1.reverse()
print(l1)
# ['c', 'b', 'e', 'd', 'c', 'b', 1, 'a']
列表sort方法
列表sort 方法数字、字符串按照ASCII,中文按照unicode从小到大排序
格式:list对象.sort(key=None,reverse=False) 默认按照升序,注意不同数据类型默认不可以进行排序,出错
l1 = ['a', '1', 'b', 'c', 'd', 'e', 'b', 'A', 'Z', 'c']
l1.sort()
print(l1)
l1.sort(reverse=True)
print(l1)
['1', 'A', 'Z', 'a', 'b', 'b', 'c', 'c', 'd', 'e']
['e', 'd', 'c', 'c', 'b', 'b', 'a', 'Z', 'A', '1']
sort方法还有两个可选参数:key和reverse
a)、key在使用时必须提供一个排序过程中调用的函数:
>>>List1 = ['1', '333', '22', '55555', '4444']
>>>List1.sort(key=len)
>>>List1
['1', '22', '333', '4444', '55555']
l1 = [1,3,5,-2,-4,-6]
l2 = sorted(l1,key=abs)
print(l1)
print(l2)
b)、reverse,list.sort(reverse=True)里reverse的作用只是决定是降序还是升序排列
True代表列表降序,默认升序
cars = ['bmw', 'audi', 'toyota', 'subaru']
print(sorted(cars, reverse=True))
#打印结果:['toyota', 'subaru', 'bmw', 'audi']
>>>l=[('a', 1), ('b', 2), ('c', 6), ('d', 4), ('e', 3)]
>>>sorted(l, key=lambda x:x[0])
Out[39]: [('a', 1), ('b', 2), ('c', 6), ('d', 4), ('e', 3)]
>>>sorted(l, key=lambda x:x[0], reverse=True)
Out[40]: [('e', 3), ('d', 4), ('c', 6), ('b', 2), ('a', 1)]
>>>sorted(l, key=lambda x:x[1])
Out[41]: [('a', 1), ('b', 2), ('e', 3), ('d', 4), ('c', 6)]
>>>sorted(l, key=lambda x:x[1], reverse=True)
Out[42]: [('c', 6), ('d', 4), ('e', 3), ('b', 2), ('a', 1)]
格式: list对象.copy() ; 返回列表对象的浅复制
l1 = ['a', '1', 'b', 'c', 'd', 'e', 'b', 'A', 'Z', 'c']
print(l1.copy())
# ['a', '1', 'b', 'c', 'd', 'e', 'b', 'A', 'Z', 'c']
以下是可用作用于列表的内置函数
使用enumerate对列表枚举
l1 = ['a', 'b', 'c', 'd', 'e']
for i, x in enumerate(l1, 100): # 100指定枚举开始的数字
print(i, x)
100 a
101 b
102 c
103 d
104 e
统计列表长度、求和、求最大最小值
l1 = [1,2,3,4]
print(len(l1)) # 4
print(sum(l1)) # 10
print(max(l1)) # 4
print(min(l1)) # 1
zip函数
将多个有序序列对应位置的元素拉链式组合成元组,以zip对象返回
zip() 函数的语法格式为:zip(iterable, ...)
“zip对象” 是一个迭代器。 注意:迭代器只能前进,不能后退。
x=[1,2,3]
y=[1,2,3,4]
z=(1,2,3,4,5)
z=zip(x,y,z)
print(list(z)) # [(1, 1, 1), (2, 2, 2), (3, 3, 3)]
print(list(z)) # [ ]
列表切片(有序序列都可以切片)
一、切片概念
切片操作符 ( [ ], [ : ], [ : : ] );
切片操作基本表达式:ordered_sequence_object [ start_index : end_index : step]
step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍!
start_index:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。
end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。
二、 Python切片操作详细例子
以下示例均以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
>>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
1. 切取单个元素
>>>a[0]
>>>a[-4]
当索引只有一个数时,表示切取某一个元素。
2. 切取完整对象
>>>a[:]
>>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[::]
>>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[::-1]
>>> [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
3. start_index和end_index全为正(+)索引的情况
>>>a[1:6]
>>> [1, 2, 3, 4, 5]
step=1,从左往右取值,start_index=1到end_index=6同样表示从左往右取值。
>>>a[1:6:-1]
输出为空列表,说明没取到数据。
step=-1,决定了从右往左取值,而start_index=1到end_index=6决定了从左往右取值,两者矛盾,所以为空。
>>>a[6:2]
同样输出为空列表。
step=1,决定了从左往右取值,而start_index=6到end_index=2决定了从右往左取值,两者矛盾,所以为空。
>>>a[:6]
>>> [0, 1, 2, 3, 4, 5]
step=1,表示从左往右取值,而start_index省略时,表示从端点开始,因此这里的端点是“起点”,即从“起点”值0开始一直取到end_index=6(该点不包括)。
>>>a[:6:-1]
>>> [9, 8, 7]
step=-1,从右往左取值,而start_index省略时,表示从端点开始,因此这里的端点是“终点”,即从“终点”值9开始一直取到end_index=6(该点不包括)。
>>>a[6:]
>>> [6, 7, 8, 9]
step=1,从左往右取值,从start_index=6开始,一直取到“终点”值9。
>>>a[6::-1]
>>> [6, 5, 4, 3, 2, 1, 0]
step=-1,从右往左取值,从start_index=6开始,一直取到“起点”0。
4. start_index和end_index全为负(-)索引的情况
>>>a[ : : -1] # step为负时,默认是终止值到起始值,即[终止值 : 起始值 : -1]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
>>>a[-1:-6]
step=1,从左往右取值,而start_index=-1到end_index=-6决定了从右往左取值,两者矛盾,所以为空。
索引-1在-6的右边(如上图)
>>>a[-1:-6:-1]
>>> [9, 8, 7, 6, 5]
step=-1,从右往左取值,start_index=-1到end_index=-6同样是从右往左取值。
索引-1在6的右边(如上图)
>>>a[-6:-1]
>>> [4, 5, 6, 7, 8]
step=1,从左往右取值,而start_index=-6到end_index=-1同样是从左往右取值。
索引-6在-1的左边(如上图)
>>>a[:-6]
>>> [0, 1, 2, 3]
step=1,从左往右取值,从“起点”开始一直取到end_index=-6(该点不包括)。
>>>a[:-6:-1]
>>> [9, 8, 7, 6, 5]
step=-1,从右往左取值,从“终点”开始一直取到end_index=-6(该点不包括)。
>>>a[-6:]
>>> [4, 5, 6, 7, 8, 9]
step=1,从左往右取值,从start_index=-6开始,一直取到“终点”。
>>>a[-6::-1]
>>> [4, 3, 2, 1, 0]
step=-1,从右往左取值,从start_index=-6开始,一直取到“起点”。
5. start_index和end_index正(+)负(-)混合索引的情况
>>>a[1:-6]
>>> [1, 2, 3]
start_index=1在end_index=-6的左边,因此从左往右取值,而step=1同样决定了从左往右取值,因此结果正确
>>>a[1:-6:-1]
start_index=1在end_index=-6的左边,因此从左往右取值,但step=-则决定了从右往左取值,两者矛盾,因此为空。
>>>a[-1:6]
start_index=-1在end_index=6的右边,因此从右往左取值,但step=1则决定了从左往右取值,两者矛盾,因此为空。
>>>a[-1:6:-1]
>>> [9, 8, 7]
start_index=-1在end_index=6的右边,因此从右往左取值,而step=-1同样决定了从右往左取值,因此结果正确。
6. 多层切片操作
>>>a[:8][2:5][-1:]
>>> [4]
a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
a[:8][2:5]= [2, 3, 4]
a[:8][2:5][-1:] = [4]
理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。
7. 切片操作的三个参数可以用表达式
>>>a[2+1:3*2:7%3]
>>> [3, 4, 5]
即:a[2+1:3*2:7%3] = a[3:6:1]
8. 其他对象的切片操作
前面的切片操作以list对象为例进行说明,但实际上可进行切片操作的数据类型还有很多,包括元组、字符串、等有序对象。
>>> (0, 1, 2, 3, 4, 5)[:3]
>>> (0, 1, 2)
元组的切片操作
>>>'ABCDEFG'[::2]
>>>'ACEG'
字符串的切片操作
>>>for i in range(1,100)[2::3][-5:]:
print(i)
就是利用range()函数生成1-99的整数,然后从start_index=2(即3)开始以step=3取值,直到终点,再在新序列中取最后五个数。
三、 常用切片操作
1.取偶数位置
>>>b = a[::2]
[0, 2, 4, 6, 8]
2.取奇数位置
>>>b = a[1::2]
[1, 3, 5, 7, 9]
3.拷贝整个对象
>>>b = a[:] 切片属于浅拷贝
>>>print(b)
>>>print(id(a))
>>>print(id(b))
>>>b = a.copy()
>>>print(b)
>>>print(id(a))
>>>print(id(b))
需要注意的是:[:]和.copy()都属于“浅拷贝”,只拷贝最外层元素,内层嵌套元素则通过引用方式共享,而非独立分配内存,如果需要彻底拷贝则需采用“深拷贝”方式
4.修改单个元素
>>>a[3] = ['A','B']
[0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
5.利用切片在某个位置插入元素
>>>a[3:3] = ['A','B','C'] # 如果给切片赋值列表,则类似列表的extend方法
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
6.替换一部分元素
>>>a[3:6] = ['A','B']
[0, 1, 2, 'A', 'B', 6, 7, 8, 9]
>>>a[ : : 2] = ['a','b','c','d','e'] # 赋值个数必须与切片个数一致
['a', 1, 'b', 3, 'c', 5, 'd', 7, 'e', 9]
>>>a[ : : -2] = ['a','b','c','d','e']
[0 , 'e' , 2 , 'd' , 4 , 'c' , 6 , 'b' , 8 , 'a']
四、 总结
(一)start_index、end_index、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,即:当start_index表示的实际位置在end_index的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_index表示的实际位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
(二)当start_index或end_index省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
(三)step的正负是必须要考虑的,尤其是当step省略时。比如a[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但实际上a[-1:]=[9](注意不是9),原因在于step省略时step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了,因此结果只含有9一个元素。
(四)需要注意:“取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如上面的a[0]=0、a[-4]=6,元素0和6都是“数值型”,而母对象a却是“list”型;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如上面的a[-1:]=[9],返回的是一个只包含元素“9”的list,而非数值型“9”。
四、列表的赋值与拷贝(课外阅读)
详情请参阅:https://blog.csdn.net/as480133937/article/details/87305247
一、可变与不可变数据类型
这两者最本质的区别在于:可变不可变是指内存中的那块内容(值)是否可以被改变
(1)不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,就是不可变数据类型引用的地址的值不可改变
改变对象的值,其实是引用了不同的对象 ,如下图:
(2)可变数据类型,允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址不会改变,只是对应地址的内容改变或者地址发生了扩充,所以对于相同的值的不同对象,会存在多份,即每个对象都有自己的地址
列表的 * = 和 + =则在原地修改列表
注意:给列表赋值的情况(用id函数发现内存地址已变)
二、引用赋值
用“=”进行引用复制时,只是会给现存的对象添加一个新的引用,并不会在内存中生成新的对象,例如:
三、浅拷贝(shallow copy)
浅拷贝有三种形式:切片操作,工厂函数,copy模块中的copy函数。
1、切片操作:b = a[:] 或者 b = [each for each in a]
2、工厂函数:b = list(a)
3、copy函数:b = copy.copy(a) 或者 b=a.copy() 或者 b=list.copy(a)
浅拷贝 只拷贝父对象(一层),不会拷贝对象的内部的可变子对象(多层)。浅拷贝是指拷贝的只是原子对象元素的引用。
list1 = ["tom",18,["play","sleep"]]
# 以下三种方法都属于浅拷贝
# 1.使用copy()的方法。
list2 = list1.copy()
# 2.使用切片的方法。
list3 = list1[:]
# 3.使用list函数
list4 = list(list1)
四、深拷贝(deep copy)
深拷贝只有一种形式,copy模块中的deepcopy函数。
和浅拷贝对应,深拷贝拷贝了对象的所有元素,包括多层嵌套的元素。
深拷贝出来的对象根本就是一个全新的对象,不再与原来的对象有任何关联。
list1 = ["tom",18,["play","sleep"]]
# 深copy的方法
import copy
list2 = copy.deepcopy(list1)
五、深、浅copy的区别
深、浅copy主要区别就是在复制内部元素的可变数据类型方面。
浅copy对可变数据类型是共用一份内存地址,没有完全将原值和copy的值内存地址分开。当对可变数据类型进行改的时候,两者都会改变。
深copy则将可变数据类型存放的内存地址重新申请了一份内存空间,将两者完全分开。对可变数据类型进行改的时候,两者不会一起改变。