一、字典介绍
字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
1、字典的主要属性
*通过键而不是偏移量来读取
字典有时称为关联数组或者哈希表。它们通过键将一系列值联系起来,这样就可以使用键从字典中取出一项。如果列表一样可以使用索引操作从字典中获取内容。
*任意对象的无序集合
与列表不同,保存在字典中的项并没有特定的顺序。实际上,Python将各项从左到右随机排序,以便快速查找。键提供了字典中项的象征性位置(而非物理性的)。
*可变,异构,任意嵌套
与列表相似,字典可以在原处增长或是缩短(无需生成一份拷贝),可以包含任何类型的对象,支持任意深度的嵌套,可以包含列表和其他字典等。
*属于可变映射类型
通过给索引赋值,字典可以在原处修改。但不支持用于字符串和列表中的序列操作。因为字典是无序集合,根据固定顺序进行操作是行不通的(例如合并和分片操作)。字典是唯一内置的映射类型(键映射到值得对象)。
*对象引用表(哈希表)
如果说列表是支持位置读取对象的引用数组,那么字典就是支持键读取无序对象的引用表。从本质上讲,字典是作为哈希表(支持快速检索的数据结构)来实现的。一开始很小,并根据要求而增长。此外,Python采用最优化的哈希算法来寻找键,因此搜索是很快速的。和列表一样字典存储的是对象引用。
2、常见的字典操作
可以查看库手册或者运行dir(dict)或者help(dict),类型名为dict。当写成常量表达式时,字典以一系列"键:值(key:value)”对形式写出的,用逗号隔开,用大括号括起来。可以和列表和元组嵌套
操作 解释
D1={} 空字典
D={'one':1} 增加数据
D1[key]='class' 增加数据:已经存在就是修改,没有存在就是增加数据
D2={'name':'diege','age':18} 两项目字典
D3={'name':{'first':'diege','last':'wang'},'age':18} 嵌套
D2['name'] 以键进行索引计算
D3['name']['last'] 字典嵌套字典的键索引
D['three'][0] 字典嵌套列表的键索引
D['six'][1] 字典嵌套元组的键索引
D2.has_key('name') 方法:判断字典是否有name键
D2.keys() 方法:键列表
list(D) 获取D这个字典的的KEY的 MS按字典顺序排序成一个列表
D2.values() 方法:值列表
'name' in D2 方法:成员测试:注意使用key来测试
D2.copy() 方法:拷贝
D2.get(key,deault) 方法:默认 如果key存在就返回key的value,如果不存在就设置key的value为default。但是没有改变原对象的数据
D2.update(D1) 方法:合并。D1合并到D2,D1没有变化,D2变化。注意和字符串,列表好的合并操作”+“不同
D2.pop('age') 方法:删除 根据key删除,并返回删除的value
len(D2) 方法:求长(存储元素的数目)
D1[key]='class' 方法:增加:已经存在的数据就是修改,没有存在就是增加数据
D4=dict(name='diege',age=18) 其他构造技术
D5=dict.fromkeys(['a','b']) 其他构造技术 dict.fromkeys 可以从一个列表读取字典的key 值默认为空,可指定初始值.两个参数一个是KEY列表,一个初始值
{'a': None, 'b': None}
>>> D5=dict.fromkeys(['a','b','c'],0)
{'a': 0, 'c': 0, 'b': 0}
D6=dict(zip(keyslist.valslist)) ???
>>> D={'one':1}
{'one': 1}
列表不能通过这样的方法来增加数据,列表只能通过append方法,列表之能通过L[1]='A'这样的方法来修改已存在序列的数据。
二、实际应用中的字典
1、字典的基本操作
1)、创建字典的方法 和修改
全部数据一起添加
>>> D={'name':'diege','age':18}
{'age': 18, 'name': 'diege'}
>>> D['name']='diege'
>>> D['age']=18
{'age': 18, 'name': 'diege'}
>>> D1['age']=19
{'age': 19, 'name': 'diege'}
同样键不存在是新添加数据,键存在就是修改数据
>>> D1=dict(name='diege',age=18)
{'age': 18, 'name': 'diege'}
将数据按按key=value作为参数传递给dict()
dict(mapping) -> new dictionary initialized from a mapping object's (key, value) pairs
>>> D=dict.fromkeys(['name','age'])
{'age': None, 'name': None}
创建只有key没有value的字典。
>>> D=dict.fromkeys(['name','age'],0)
{'age': 0, 'name': 0}
2)、索引
>>> D['age']
3)、取长
>>> len(D)
4)、键存在判断-参数使用key
>>> D.has_key('name')
5)、成员判断 使用key
>>> 'age' in D
6)、字典的键查看 返回键的列表
>>> D.keys()
['age', 'name']
7)、字典的值查看 返回值的列表
>>> D.values()
[18, 'diege']
8)、拷贝
D2.copy()
2、原处修改字典
1)增加数据
>>> D['age']=18
{'age': 18, 'name': 'diege'}
>>> D1['age']=19
{'age': 19, 'name': 'diege'}
同样键不存在是新添加数据,键存在就是修改数据
2)删除数据
根据键删除
pop方法是从字典中删除一个键并返回它的值
>>> D.pop('age')
方法是从字典中删除一个键并返回它的值
>>> del D['age']
从字典前面一对K:V的方式删除,并返回K,V合成的元组
>>> D3.popitem()
('age', 18)
清空字典所有数据
D1.clear()
3)合并数据
D2.update(D1) 方法:合并。D1合并到D2,D1没有变化,D2变化。注意和字符串,列表好的合并操作”+“不同
{'name': 'diege'}
{'class': 2, 'level': 2012}
>>> D2.update(D1)
{'name': 'diege'}
{'class': 2, 'name': 'diege', 'level': 2012}
3、其他字典方法
字典方法提供很多工具,例如 字典keys,valuse和items方法分别返回字典的键列表,值列表和(key,value)对元组
key列表
>>> D2.keys()
['class', 'name', 'level']
value列表
>>> D2.values()
[2, 'diege', 2012]
K,V元组的列表
>>> D2.items()
[('class', 2), ('name', 'diege'), ('level', 2012)]
>>> D2.viewkeys()
dict_keys(['class', 'name', 'level'])
>>> D2.viewvalues()
dict_values([2, 'diege', 2012])
>>> D2.viewitems()
dict_items([('class', 2), ('name', 'diege'), ('level', 2012)])
4、语言表
>>> table={'Python':'Guido',
... 'Perl':'Larry',
... 'Tcl':'John'}
for lang in table.keys():
... print lang,'\t',table[lang]
Python Guido
Tcl John
Perl Larry
因为字典并非序列,无法像字符串和列表那样直接通过一个for语句迭代他们。但如果要遍历字典的键列表很容易。调用字典的keys()方法,返回经过排序之后所有键的列表。再用for循环进行迭代。
实际上,Python也能然给你遍历字典的键的列表,而并不用在多数for循环中调用keys方法.就任何字典D而言,写成for key in D:和写成完整的for key in D.keys():效果是一样的
>>> for key in table:
... print key
Python
>>> for key in table.keys():
... print key
Python
>>> for key in table.values():
... print key
Guido
Larry
三、字典用法注意事项
*序列运算无效。无法有序合并和分片
*对新索引赋值会增加项。
*键不一定总是字符串。任何不可变对象都可以(也就是不是列表)
1、使用字典模拟灵活的列表
当使用列表的时,对在列表末尾外的偏移赋值是非法的。
>>> L[99]='diege'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: list assignment index out of range
虽然可以使用重复预先分配足够的大的列表(例如 [0]*100)。但也可以使用字典来坐类似的事。这样就不需要这样的空间分配了。
使用整数键时,字典可以效仿列表再偏移赋值时增长
>>> [0]*100>>> L=[0]*100
>>> L[99]='diege
>>> D[99]='diege'
>>> D[99]
'diege
这样的不用将来可能会用到的会被赋值的所有位置都分配空间。这样字典很像更具灵活性的列表。
2、字典用于稀疏数据结构
例如多维数组中只有少数位置上有存储的值
>>> M[(2,3,4)]=88
>>> M[(7,8,9)]=99
>>> X=2;Y=3;Z=4
>>> M[(X,Y,Z)]
{(2, 3, 4): 88, (7, 8, 9): 99}
这个数组中只有两个位置(2,3,4),(7,8,9)有值,其他位置都未空。键是元组,他们记录非空元素的坐标。我们并不是分配一个庞大而几乎为空的三维矩阵,而是使用一个简单的两个元素的字典。通过这一方式读取空元素的时,会触发键不存在的异常。因为这些元素实质上并没有被存储。
>>> M[(5,6,7)]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: (5, 6, 7)
3、避免missing-key错误
读取不存在的键的错误在稀疏矩阵中很常见。然而可能并不希望程序因为这一次错误而被关闭。这里有三种方式可以让我们填入默认值而不会出现这样
的错误提示,
1、)使用if语句预先对键进行测试。
>>> if M.has_key((5,6,7)):
... print M[(5,6,7)]
... else:
... print 0
2)、使用try语句明确地捕获并修复这一异常。
... print M[(5,6,7)]
... except KeyError:
... print 0
3)、使用get方法为不存在的键提供一个默认值
>>> M.get((2,3,4),0)
>>> M.get((5,6,7),0)
从编程的需要方面来说,get方法是三者中最简捷的。
4、使用字典作为“记录”
一般说来,字典可以取代搜索数据结构(因为用键进行索引是一种搜索操作),并且可以表示多种结构化信息的类型。例如,字典是在程序范围中多种描述某一项
属性的方法之一。也就是说,它们能偶扮演其他语言中的“记录”和结构相同的角色。随时间通过向新键赋值来填写字典的列子
>>> rec={}
>>> rec['name']='diege'
>>> rec['age']=28
>>> rec['job']='sa/db'
>>> print rec['name']
diege
特别是在嵌套的时候,Python的内建数据类型可以很轻松地表达结构化信息。使用字典来捕获对象的属性,但是它是一次性写好的,而且嵌套了一个列表和一个字典来表达结构化属性的值。
>>> offer={'name':'diege','jobs':['sa','dba'],'web':'www.skylog.cn/~diege','home':{'state':'SH','zip':8088}}
当去读嵌套对象的元素时,只要简单地吧索引操作串起来就可以了
>>> offer['name']
'diege'
>>> offer['jobs'][1]
'dba'
>>> offer['home']['state']
5、创建字典的其他方法
>>> {'name':'diege','age':45}
{'age': 45, 'name': 'diege'}
>>> D['name']='lily'
>>> D['age']=18
{'age': 18, 'name': 'lily'}
>>> dict(name='kelly',age=19)
{'age': 19, 'name': 'kelly'}
注意这里name,age没有 ’‘括起来,因为这里是变量。
>>> dict([('name','tom'),('age',23)])
{'age': 23, 'name': 'tom'}
这里将每一个数据(属性),做为元组放到一个列表里传递给dict函数
4种方法的选择技巧
*如果可以事先拼除整个字典,那么第一种是很方便的。
*如果需要一次动态地建立字典的一个字段,第二种比较合适
*第三种关键字形式所需的代码比常量少,【但是键必须是都是字符串才可行】
*如果需要在程序运行时把键和值逐步建成序列。第四中比较有用。
zip函数把程序运行动态获得的键和值列表合并在一起(例如分析数据文件字段)
如果所有键的值都相同,可以使用特殊形式对字典进行初始化。简单传入一个键列表,以及所有键的初始值(默认为空)
>>> dict.fromkeys(['a','b','c'],0)
{'a': 0, 'c': 0, 'b': 0}