pandas
dataframe
读取
csv文件 数据类型
转
化
字符
变成了
数字
因为csv中包含了大量的股票代码,如果是002开头的股票,比如002111, 使用pd.
read
_csv(‘text.csv’) 则会让所有的002xxx,变成了2xxx,
前面
2个0不见了,当然你可以收工操作,填充那2个0。 不过对于
pandas
大法,何须这么麻烦?
直接在参数一栏设置一下即可:
df=pd.
read
_csv('text.csv', dtype={'code':str})
这样,把你要
转
换的列的名字设定好, “
data_child2 = pd.DataFrame(pd.
read
_
excel
('F:\\dong\\2019程序测试.xls',converters = {u'lqzydm':str,u'lqyxsm':str}))#使用converters进行
转
换
depart...
init_dir = os.path.dirname(os.path.abspath(__file__))
df = pd.
read
_
excel
(os.path.join(init_dir, '地理区域.xlsx'))
假设数据如下:
| 父级地理区域名称 | 地理区域名称 | 地区域编号 |
| | 广州#1 | 01 |
| 01 | 广州天河区#2 | 0101 |
直接使用以上代码
这里以从深交所现在的日行情数据文件为例,格式为xlsx 直接使用df = pd.
read
_
excel
(os.getcwd() + os.sep + 'stock.xlsx')
读取文件
时
,证券代码被
转
换为
数字
(000001 =>1),0被舍去,导致不正确。这里为了省去读入后在对代码进行补全的麻烦,再
读取
Excel
文件
时
:
df = pd.
read
_
excel
(os.getcwd() + os
拯救
pandas
计划(13)——提取Series
字符串
中的
数字
并计算/ 数据需求/ 需求拆解/ 需求处理/ 总结
最近发现周围的很多小伙伴们都不太乐意使用
pandas
,
转
而投向其他的数据操作库,身为一个数据工作者,基本上是张口
pandas
,闭口
pandas
了,故而写下此系列以让更多的小伙伴们爱上
pandas
。
系列文章说明:
系列名(系列文章序号)——此次系列文章具体解决的需求
windows 10
python
3.8
pandas
>=1.2.4
/ 数据需求
需要对下列有着统一格
`
pandas
.
read
_csv()` 默认会尝试根据数据内容来
自动
推断每列的数据类型,如果某列的数据是
字符串
类型,它也会
自动
读取
为
字符串
类型。如果你希望强制将所有列都
读取
为
字符串
类型,可以指定参数 `dtype=str`,如下所示:
```
python
import
pandas
as pd
df = pd.
read
_csv('data.csv', dtype=str)
这样就可以保证每列都以
字符串
类型
读取
了。