1.将My
sql中的
数据迁移到
Hdfs文件系统中,然后通过
Hive加载
HDFS文件系统中的
数据值
2.将
Hive中的
数据迁移到指定My
sql数据库中
1.
数据迁移的过程中,由于
hive的Null值存储为"\N",My
sql存储为NULL值,二者转换时需要注意,再
数据迁移json模板中,"nullFormat": "\\N", 该配置信息就是解决了
数据迁移是存在的Null值。
2.如果
hive中没有数值DataX迁移时会出现异常
执行语句:python /opt/module/datax/bin/datax.py /opt/module/datax/job/xxx.json
学习笔记—Hive创建表
1. Hive语句的特点
HQL 语言大小写不敏感,但内容分大小写(where ,if/ case when,如:数据表内容某人名叫Tom,则条件后不能写tom,HDFS 路径名(NameNode)分大小写) ;
HQL 可以写在一行或者多行, 关键字不能被缩写也不能分行,同 SQL;
各子句一般要分行写, 使用缩进提高语句的可读性,为了美化,同SQL;
-- 为注释符号 ;
Hive 不存储数据,他是表到HDFS文件的映射关系(语句);
2. DDL
2.1 Hive的数据库DD
row formate serde
‘org.apache.hadoop.
hive.serde2.lazy.LazySimpleSerDe’
with serdeproperties(“field.elim”=’|’,“serialization.encoding”=‘GBK’)
Location ‘
hdfs://nameservice1/warehouse…’
stored as textfile
tblpropertie