相关文章推荐
帅气的葡萄  ·  Python ...·  2 周前    · 
温暖的香烟  ·  Python reportlab表格 ...·  昨天    · 
深沉的电脑桌  ·  vscode ...·  1 年前    · 
粗眉毛的人字拖  ·  AttributeError: ...·  1 年前    · 
  • csv文件格式
  • 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。(标准英文逗号)

    格式一:无标题逗号(此处为中文逗号)分割,4个数据,最后为空字串

    sj_mino1001.jpg,715282,4FB55FE8,
    sj_mino1002.jpg,471289,93203C5C,
    sj_mino1003.jpg,451929,C4E80467,

    格式二:有标题(文件名, 文件大小 (以字节为单位),CRC 校验值, 注释 (可省略))

    filename,filesize,crc,comments
    sj_mino1001.jpg,715282,4FB55FE8,
    sj_mino1002.jpg,471289,93203C5C,
    sj_mino1003.jpg,451929,C4E80467,
  • 读取csv文件
  • csv.reader()

    csv.reader() 方法返回一个reader对象,该对象将遍历给定CSV文件中的行。

    假设我们有以下numbers.csv包含数字的文件:

    6,5,3,9,8,6,7

    以下python脚本从此CSV文件读取数据。

    #!/usr/bin/python3
    import csv
    f = open('numbers.csv', 'r')
    with f:
    	reader = csv.reader(f)
    	for row in reader:
    		print(row)
                  

    在上面的代码示例中,我们打开了numbers.csv以读取并使用csv.reader()方法加载数据。

    现在,假设CSV文件将使用其他定界符。(严格来说,这不是CSV文件,但是这种做法很常见。)例如,我们有以下items.csv文件,其中的元素由竖线字符(|)分隔:

    pen|table|keyboard
                  

    以下脚本从items.csv文件读取数据。

    #!/usr/bin/python3
    import csv
    f = open('items.csv', 'r')
    with f:
    	reader = csv.reader(f, delimiter="|")
    	for row in reader:
    		for e in row:
    			print(e)
                  

    我们delimiter在csv.reader()方法中使用参数指定新的分隔字符。

    csv.DictReader

    csv.DictReader班的运作就像一个普通的读者,但读入字典中的信息映射

    字典的键可以与fieldnames参数一起传递,也可以从CSV文件的第一行推断出来。

    我们有以下values.csv文件:

    filename,filesize,crc,comments
    sj_mino1001.jpg,715282,4FB55FE8,
    sj_mino1002.jpg,471289,93203C5C,
    sj_mino1003.jpg,451929,C4E80467,

    第一行代表字典的键,第二行代表值。

    import csv
    f = open('csv2.csv', 'r')
    with f:
    reader = csv.DictReader(f,delimiter="," )
    for row in reader: # row的类型为: <class 'collections.OrderedDict'>
    for key,value in row.items():
    print(key,':',row[key])

    这是示例的输出。

    filename : sj_mino1001.jpg
    filesize : 715282
    crc : 4FB55FE8
    comments :
    filename : sj_mino1002.jpg
    filesize : 471289
    crc : 93203C5C
    comments :
    filename : sj_mino1003.jpg
    filesize : 451929
    crc : C4E80467
    comments :
  • 写入csv文件
  • csv.writer()

    csv.writer()方法返回一个writer对象,该对象负责将用户数据转换为给定文件状对象上的定界字符串。

    用writer对象写入数据的常用方法
    writerow() 一次写入一行
    writerows() 一次写入多行

    #!/usr/bin/python3
    import csv
    nms = [[1, 2, 3, 4, 5, 6], [7, 8, 9, 10, 11, 12]]
    f = open('numbers2.csv', 'w')
    with f:
    	writer = csv.writer(f)
    	for row in nms:
    		writer.writerow(row)
                  

    该脚本将数字写入numbers2.csv文件。该writerow()方法将一行数据写入指定的文件。

    该脚本将产生以下文件(numbers2.csv):

    1,2,3,4,5,6 7,8,9,10,11,12

    可以一次写入所有数据。该writerows()方法将所有给定的行写入CSV文件。

    下一个代码示例将Python列表写入numbers3.csv文件。该脚本将三行数字写入文件。

    #!/usr/bin/python3
    import csv
    nms = [[1, 2, 3], [7, 8, 9], [10, 11, 12]]
    f = open('numbers3.csv', 'w')
    with f:
    	writer = csv.writer(f)
    	writer.writerows(nms)
                  

    运行上述程序时,以下输出将写入numbers3.csv文件:

    1,2,3 7,8,9 10,11,12

    csv写入汇总:

    import csv
    with open("student.csv", 'w', newline="") as f:  # newline=""缺省这个参数,将每行后面有个空行
        writer = csv.writer(f)
        writer.writerow(['学号', '姓名', '年龄', '性别'])  # 写入标题
        writer.writerow(['1101', '张三', 20, '男'])      # 写入记录,自动加入\n
        writer.writerow(['1102', '李四', 19, '女'])
        writer.writerow(('1103', '王五', 20, '女'))
    print("文件已写完!")
                    
    import csv
    data = [['学号', '姓名', '年龄', '性别'],
          ['1101', '张三', 20, '男'],
          ['1102', '李四', 19, '女'],
          ['1103', '王五', 20, '女']]
    with open("student.csv", 'w', newline="") as f:
        writer = csv.writer(f)
        writer.writerows(data)   # 将多行数据一次性写入
    print("文件已写完!")
                  

    (*了解)Quoting

    可以在CSV文件中引用单词。Python CSV模块中有四种不同的引用模式

  • QUOTE_ALL —引用所有字段
  • QUOTE_MINIMAL-仅引用那些包含特殊字符的字段
  • QUOTE_NONNUMERIC —引用所有非数字字段
  • QUOTE_NONE —不引用字段
  • 在下一个示例中,我们向items2.csv文件写入三行。所有非数字字段都用引号引起来。

    #!/usr/bin/python3
    import csv
    f = open('items2.csv', 'w')
    with f:
    	writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)
    	writer.writerows((["coins", 3], ["pens", 2], ["bottles", 7]))
                  

    该程序将创建以下items2.csv文件。引用项目名称,不引用数字表示的数量。

    "coins",3
    "pens",2
    "bottles",7
                  

    (*了解)CSV Dialects

    尽管CSV格式是一种非常简单的格式,但还是有许多差异,例如不同的定界符,换行或引号字符。因此,有不同的CSV方言可用。

    dialect,编码风格,默认为excel的风格,也就是用逗号(,)分隔,dialect方式也支持自定义,通过调用register_dialect方法来注册

    下一个代码示例将打印可用的方言及其特征。1

    import csv
    names = csv.list_dialects()
    for name in names:
    	print(name)
    	dialect = csv.get_dialect(name)
    	print(repr(dialect.delimiter), end=" ")
    	print(dialect.doublequote, end=" ")
    	print(dialect.escapechar, end=" ")
    	print(repr(dialect.lineterminator), end=" ")
    	print(dialect.quotechar, end=" ")
    	print(dialect.quoting, end=" ")
    	print(dialect.skipinitialspace, end=" ")
    	print(dialect.strict)
                  

    在csv.list_dialects()返回方言名称的列表和csv.get_dialect()方法返回与方言名称相关联的方言。

    $ ./dialects.py 
    excel
    ',' 1 None '\r\n' " 0 0 0
    excel-tab
    '\t' 1 None '\r\n' " 0 0 0
    ',' 1 None '\n' " 1 0 0
                  

    程序将打印此输出。有三个内置的方言excel,excel-tab和unix。

    (*了解)Custom CSV Dialect

    在本教程的最后一个示例中,我们将创建一个自定义方言。使用该csv.register_dialect()方法创建自定义方言。

    #!/usr/bin/python3
    import csv
    csv.register_dialect("hashes", delimiter="#")
    f = open('items3.csv', 'w')
    with f:
    	writer = csv.writer(f, dialect="hashes")
    	writer.writerow(("pencils", 2))
    	writer.writerow(("plates", 1))
    	writer.writerow(("books", 4))
                  

    该程序使用(#)字符作为分隔符。使用方法中的dialect选项指定方言csv.writer()。

    该程序将产生以下文件(items3.csv):

    pencils#2
    plates#1
    books#4