从MySQL中导入 hdfs 或者 hive 都可以使用 sqoop 工具,sqoop提供了非常丰富的参数命令完成此项任务。但是有时我们的基础数据是以hive格式存储的,为了实现数据分析或挖掘的目的,需要从hive中生成聚合数据,然后导入mysql, 这样方便对接可视化的前端。
本文旨在说明如何从hive建立外部表的方式,导入mysql中。
MySQL中建表
Hive中建表
Hive导入数据
编码问题
用hive的外部表导数据到MySQL的时候,可能存在编码导致乱码的情况出现,
hive中使用utf8编码,而MySQL可以使用其他编码方式,因而需要将MySQL
也设置为utf8编码,参见如下:
定时任务
在数据仓库建立好之后,就需要从Hive仓库中抽取相应数据写入已经建好的
数据库中。数据抽取可以有多少办法, 定时任务就是其中一种。
使用crontab -e
来编辑定时任务,
参见:
- 指南
- MySQL connector
- 示例
- hive to mysql 乱码
- stack flow MySQL 编码