df
=
pd
.
DataFrame
(
)
with
open
(
r
'./colorChina.json'
,
'r'
,
encoding
=
'utf-8'
)
as
f
:
for
ff
in
f
:
data
=
json
.
loads
(
ff
)
row
=
pd
.
DataFrame
(
data
)
df
=
df
.
append
(
row
,
ignore_index
=
True
)
print
(
df
.
head
(
)
)
df
.
to_csv
(
'colorChina.csv'
,
index
=
None
,
mode
=
'a'
)
本文目标如题所述,直接上代码,运行环境python3.6import jsonimport pandas as pdimport csvdf = pd.DataFrame()with open(r'./colorChina.json','r',encoding='utf-8')as f: for ff in f: data = json.loads(ff) ...
用python 写的一个
json
转
csv
文件
的脚本,
csv
文件
的分隔符用的 '|' ,hard code 到代码里了。
使用
方法:
1. 直接执行 python
json
2
csv
.py (待转换
文件
hard code 到代码里)
2. 转换完后先打开excel ,然后从excel 里面找到转换后
文件
.
csv
打开(注意不能直接打开否则会有乱码)
补充上篇博客提到的
json
文件
数据
转换成
csv
文件
。作为数据分析最常用
文件
类型
json
与
csv
,出于一定情况下,我们需要将
json
中字典类型的数据,转换为
csv
存储,这又用到python强大的
pandas
模块了。我们一步一步来。
json
的
文件
结构
按照我的理解,
json
像是一个字典
文件
,整一个
文件
的数据存储按照字典的格式进行,即key:values,大的数据一般是多层嵌套字典。故,对
json
的数...
假设.
json
文件
中存储的数据为:
{"type": "Point", "link": "http://www.dianping.com/newhotel/22416995", "coordinates": [116.37256372996957, 40.39798447055443], "category": "经济型", "name": "北京荷塘山庄", "count": "278", "address": "北京市怀柔区黄花城村安四路", "price": "380"}
{"type": "Point", "link": "http://www.dianping.com/newhot
根据教程实现了读取
csv
文件
前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。
之所以想实现读取前面的几列是因为我手头的一个
csv
文件
恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:
GreydeMac-mini:chapter06 greyzhang$ cat data.
csv
1,name_01,coment_01,,,,
2,name_02,coment_02,,,,
3,name_03,coment_03,,,,
4,name_04,coment_04,,,,
5,name_05,coment_05,,,,
6,name_06,
首先先定义一个list,将其转存为
csv
文件
,看将会报什么错误:list=[[1,2,3],[4,5,6],[7,9,9]]
list.to_
csv
('e:/test
csv
.
csv
',encoding='utf-8')
运行后出现:Traceback (most recent call last): File "D:/Python/untitled/PcCVS.py", line 43, in ...
list1.to_
csv
("list.
csv
")
这里建立一个简单的
列表
,并
使用
to_
csv
试图将其转化为
csv
文件
,但是事实是这样做是不对的,会出现报错。
报错信息如下:
显示list没有to_
csv
属性,下面讲解正确的
使用
方法。
使用
pandas
正确的
使用
方法应该是
使用
pandas
的to_
csv
属性,将
列表
转化为
csv
文件
。
import
pandas
as pd
由于客户提供的是excel
文件
,在
使用
时期望
使用
csv
文件
格式,且对某些字段内容需要做一些处理,如从某个字段中固定的几位抽取出来,独立作为一个字段等,下面记录下
使用
acaconda处理的过程;
import
pandas
df =
pandas
.read_excel("/***/***.xlsx")
df.columns = [内部为你给你的excel每一列自定义的名称](比如我给我的excel自定义
列表
为:
["url","productName","***",。。。,"***"])
(下面开始你自己的表演,对每一列内容进行你自己需要的处理)
df["url"] = df["url"].
本文实例讲述了Python基于
pandas
实现
json
格式
转换成
dataframe的方法。分享给大家供大家参考,具体如下:
# -*- coding:utf-8 -*-
#!python3
import re
import
json
from bs4 import BeautifulSoup
import
pandas
as pd
import requests
import os
from
pandas
.io.
json
import
json
_normalize
class image_structs():
def __init__(self):
self.picture_ur