备案 控制台
学习
实践
活动
专区
工具
TVP
写文章
专栏首页 未闻Code 逆向操作,把被压平的字典还原成嵌套字典
1 0

海报分享

逆向操作,把被压平的字典还原成嵌套字典

使用 yield 压平嵌套字典有多简单? 这篇文章中,我们讲到,要把一个多层嵌套的字典压平,可以使用 yield 关键字来实现。

今天,我们倒过来,把一个已经被压平的字典还原成嵌套字典。

目标字典为:

{
    'a_b_h':1,
    'a_b_i':2,
    'a_c_j':3,
    'a_d':4,
    'a_c_k':5,
    'a_e':6

我们要把它还原为:

{
  "a": {
    "b": {
      "h": 1,
      "i": 2
    "c": {
      "j": 3,
      "k": 5
    "d": 4,
    "e": 6

要实现这个需求,我们分成两个主要的步骤。

还原每一个嵌套字典

对于 {'a_b_h':1} ,它实际上被还原以后应该是:

{'a': {'b': {'h': 1}}}

现在,写一个函数 unpack ,这个函数的作用是传入两个参数 ['a', 'b', 'h'] 1 输出 {'a': {'b': {'h': 1}}}

def unpack(key, value):
    if len(key) == 1:
        return {key[0]: value}
    else:
        prefix = key.pop(0)
        return {prefix: unpack(key, value)}

需要注意的是, unpack 函数的第一个参数是一个列表,形如: ['a', 'b', 'h'] 。运行效果如下图所示。

这个函数使用递归,把第一个参数列表一项一项拿出来,作为字典的 key,并把剩下的项作为子字典的 key。当列表只剩一个值的时候,说明已经到了最里面了,把这个值作为最里面字典的 key,第二个参数作为 value。

接下来,我们实现第二个函数 deflat ,它把目标字典分成 key, value 对,并把 key 转换为列表以后传给 unpack 函数:

def deflat(x):
    for key, value in x.items():
        yield unpack(key.split('_'), value)

deflat 函数中,我们传入目标字典。目标字典的每一对 key, value 被取出来,传入 unpack 函数构造每一个小的嵌套字典。

运行效果如下图所示:

合并字典

有了每一个嵌套字典以后,我们要做的就是把他们合并起来。

假设我们有两个字典:dst 和 src,把 src 的内容合并到 dst 字典中,有如下几种情况。

dst 中没有 src 的 key

假设 dst = {'a': 1} src = {'b': 1} ,那么合并以后, dst 变成 {'a': 1, 'b': 1}

对应代码如下:

def merge(dst, src):
    for key, value in src.items():
        if key not in dst:
            dst[key] = value

dst 中有 src 的 key 且值都是字典

假设 dst = {'a': {'b': 1}} src = {'a': {'c': 1}} ,那么由于 dst src 都有 'a' 这个 key,所以问题转换为合并 {'b': 1} {'c': 1} ,变成第一种情况。

对应代码如下:

def merge(dst, src):
    for key, value in src.items():
        if key in dst:
            merge(dst[key], value)

dst 中有 src 的 key 且值相同

在本题中,这种情况不存在,因为这会导致目标字典有相同的 key。但是字典是不能重复的。

dst 中有 src 的 key 且值的类型不同

这种情况下说明目标字典有问题,无法合并。

例如:

{
 'a_b_c': 1
 'a': 2

这种字典不存在嵌套写法,因为 {'a': 3} {'a': {'b': {'c': 1}}} 只能互相覆盖,不能合并。

完整写法

merge 函数的完整写法如下:

def merge(dst, src):
    for key, value in src.items():
        if key not in dst:
            dst[key] = value
        elif isinstance(dst[key], dict) and isinstance(value, dict):
            merge(dst[key], value)
        else:
            raise Exception('数据格式有误,不能转换为嵌套字典')

解答问题

最后我们来解答这个问题,把三个函数结合起来。运行效果如下图所示:

当传入不能被转换的目标字典时,也会正常报错

文章分享自微信公众号:
未闻Code

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

作者: kingname
原始发表时间: 2019-12-20
如有侵权,请联系 cloudcommunity@tencent.com 删除。