@

了解json整体格式

这里有一段json格式的文件,存着全球陆地和海洋的每年异常气温(这里只选了一部分):global_temperature.json

"description": { "title": "Global Land and Ocean Temperature Anomalies, January-December", "units": "Degrees Celsius", "base_period": "1901-2000" "data": { "1880": "-0.1247", "1881": "-0.0707", "1882": "-0.0710", "1883": "-0.1481", "1884": "-0.2099", "1885": "-0.2220", "1886": "-0.2101", "1887": "-0.2559"

通过python读取后可以看到其实json就是 dict 类型的数据, description和data 字段就是key
由于json存在层层嵌套的关系,示例里面的data其实也是 dict 类型,那么年份就是key,温度就是value

现在要做的是把json里的年份和温度数据保存到csv文件里

提取key和value

这里我把它们转换分别转换成 int和float 类型,如果不做处理默认是 str 类型

year_str_lst = json_data['data'].keys()
year_int_lst = [int(year_str) for year_str in year_str_lst]
temperature_str_lst = json_data['data'].values()
temperature_int_lst = [float(temperature_str) for temperature_str in temperature_str_lst]
print(year_int)
print(temperature_int_lst)

使用pandas写入csv

import pandas as pd
# 构建 dataframe
year_series = pd.Series(year_int_lst,name='year')
temperature_series = pd.Series(temperature_int_lst,name='temperature')
result_dataframe = pd.concat([year_series,temperature_series],axis=1)
result_dataframe.to_csv('./files/global_temperature.csv', index = None)

axis=1,是横向拼接,若axis=0则是竖向拼接
如果在调用to_csv()方法时不加上index = None,则会默认在csv文件里加上一列索引,这是我们不希望看见的