Excel数据如何导入MySQL进行数据分析?
一、下载数据
数据来源:阿里巴巴天池
二、导入
1.新建一个数据库→导入向导→导入类型(和excel文件类型一致)
2.Excel 文件的位置→下一步
3.为源定义一些附加的选项
如果excel数据量大,可以在下面的界面设置分批导入。“第一个数据行”和“最后一个数据行”设置导入哪个范围的数据。
字段名行:1→字段名在第1行
第一个数据行:2→从第2行导入数据
最后一个数据行:10000→导入到第10000行数据结束
因为这个Excel数据很大,所以只导入10万条数据用来练习。
如果要分批导入100万行数据,第1次导入:
第一个数据行:2(表示从第2行开始导入数据,因为第1行是列字段名)
最后一个数据行:500000(表示导入到第500000行结束)
第2次导入:
第一个数据行:500001
最后一个数据行:1000000
4.选择目标表
新数据库表里导入数据,在“新建表”打钩;已有的数据库表里导入数据,不需要打钩。
5.选择导入模式
6.点击“开始”按钮执行导入
7.导入成功
8.修改列名:设计表
将列名均设置成“不是null”
9.把时间戳改为日期和时间的格式
(1).增加一列用于存放日期:
alter table userbehavior
add 日期 varchar(255);
(2)从时间戳里抽取日期:
update userbehavior
set 日期=from_unixtime(时间戳,'yyyy-mm-dd');
(3)增加一列用于存放时间:
alter table userbehavior
add 时间 varchar(255);
(4)从时间戳里抽取时间:
update userbehavior
set 时间=from_unixtime(时间戳,'%H:%i:%s');
10.数据处理
(1)删除缺失值
delete from 表名
where 列名 is null;
(2)填充缺失值
select coalesce(列名, 要填充的值)
from 表名;
(3)删除重复值
①先创建一个临时表,用于保存要删除的重复值
create table 表名1