Excel数据如何导入MySQL进行数据分析?

Excel数据如何导入MySQL进行数据分析?

一、下载数据

数据来源:阿里巴巴天池

二、导入

1.新建一个数据库→导入向导→导入类型(和excel文件类型一致)

2.Excel 文件的位置→下一步

3.为源定义一些附加的选项

如果excel数据量大,可以在下面的界面设置分批导入。“第一个数据行”和“最后一个数据行”设置导入哪个范围的数据。

字段名行:1→字段名在第1行

第一个数据行:2→从第2行导入数据

最后一个数据行:10000→导入到第10000行数据结束

因为这个Excel数据很大,所以只导入10万条数据用来练习。

如果要分批导入100万行数据,第1次导入:

第一个数据行:2(表示从第2行开始导入数据,因为第1行是列字段名)

最后一个数据行:500000(表示导入到第500000行结束)

第2次导入:

第一个数据行:500001

最后一个数据行:1000000

4.选择目标表

新数据库表里导入数据,在“新建表”打钩;已有的数据库表里导入数据,不需要打钩。

5.选择导入模式

6.点击“开始”按钮执行导入

7.导入成功

8.修改列名:设计表

将列名均设置成“不是null”

9.把时间戳改为日期和时间的格式

(1).增加一列用于存放日期:

alter table userbehavior 
add 日期 varchar(255);

(2)从时间戳里抽取日期:

update userbehavior
set 日期=from_unixtime(时间戳,'yyyy-mm-dd');

(3)增加一列用于存放时间:

alter table userbehavior 
add 时间 varchar(255);

(4)从时间戳里抽取时间:

update userbehavior
set 时间=from_unixtime(时间戳,'%H:%i:%s');

10.数据处理

(1)删除缺失值

delete from 表名 
where 列名 is null;

(2)填充缺失值

select coalesce(列名, 要填充的值) 
from 表名;

(3)删除重复值

①先创建一个临时表,用于保存要删除的重复值

create table 表名1