使用Sqoop将MySQL数据导入到Hadoop

KevinMitnick

2014-12-10

关注关注

Hadoop的安装配置这里就不讲了。

Sqoop的安装也很简单。

Sqoop的安装与使用 http://www.linuxidc.com/Linux/2014-10/108337.htm

完成sqoop的安装后，可以这样测试是否可以连接到mysql(注意：mysql的jar包要放到 SQOOP_HOME/lib 下)：

sqoop list-databases --connect jdbc:mysql://192.168.1.109:3306/ --username root --password 19891231

结果如下

即说明sqoop已经可以正常使用了。

下面，要将mysql中的数据导入到hadoop中。

我准备的是一个300万条数据的身份证数据表：

先启动hive（使用命令行：hive 即可启动）

然后使用sqoop导入数据到hive：

sqoop import --connect jdbc:mysql://192.168.1.109:3306/hadoop --username root --password 19891231 --table test_sfz --hive-import

sqoop 会启动job来完成导入工作。

完成导入用了2分20秒，还是不错的。

在hive中可以看到刚刚导入的数据表：

我们来一句sql测试一下数据：

select * from test_sfz where id < 10;

可以看到，hive完成这个任务用了将近25秒，确实是挺慢的（在mysql中几乎是不费时间），但是要考虑到hive是创建了job在hadoop中跑，时间当然多。

接下来，我们会对这些数据进行复杂查询的测试：

我机子的配置如下：

hadoop 是运行在虚拟机上的伪分布式，虚拟机OS是ubuntu12.04 64位，配置如下：

sqoop mysql hadoop hive

KevinMitnick

0 关注 0 粉丝 0 动态

关注关注

SQOOP增量抽取时，在HIVE中实现类似Oracle的merge操作

数据仓库建设中的数据抽取环节，常常需要增量抽取业务库数据。但业务库数据不是一层不变的，会根据时间发生状态变更，那么就需要同步更新变化数据到HIVE中。过去在Oracle上做数据仓库时，可以使用merge的方法合并新老数据。但hive中没有该功能，本文旨在通

victorzhzh 2020-04-07

sqoop oracle到hive，动态分区一次操作记录

sqoop，将oracle数据传递到hive，可以直接将表数据覆盖传递，也可以按select传递，这里我用的是select查询的。query里面，必须有where条件，同时必须添加\$CONDITIONS，\$CONDITIONS在执行时会自动替换位 ,但

Streamoutput 2020-03-27

大数据 hadoop ---- Sqoop、flume、chukwa

Sqoop是一款开源的工具，主要用于在Hadoop与传统的数据库间进行数据的传递，可以将一个关系型数据库中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。对于某些NoSQL数据库它也提供了连接器。Sqoop，类似于其他ET

硅步至千里 2020-02-18

Sqoop 一点通

sqoop 1 版本主要从1.4.0 到 1.4.7；sqoop 2 版本主要从1.99.1 到1.99.7。sqoop2 对 sqoop 1 主要在性能、安全方面做了优化升级，并新增了服务端，sqoop2 可以通过编程 rest api 的方式进行数据同

SignalDu 2020-02-17

2020年寒假假期总结0201

　　系统环境：hadoop2.65，mysql5.7.28，sqoop1.47，hive1.2.2，虚拟机centos7，物理机windows10. 　　2.然后利用传输工具将sql文件传给虚拟机，然后虚拟机开启mysql，使用source命令调用sql文

mycosmos 2020-02-01

错误: 找不到或无法加载主类 org.apache.sqoop.Sqoop

1.sqoop-1.4.x.tar.gz在1.4.5以上的安装包已经没有了这个jar包，在linux下上传,解压sqoop-1.4.6.bin_hadoop-2.0.4-alpha.tar.gz

飞鸿踏雪0 2020-01-30

七,sqoop 安装

将mysql放到 Sqoop 目录下的 lib。

strongyoung 2020-01-25

Sqoop的安装和使用

sqoop 是 apache 旗下一款“Hadoop 和关系数据库服务器之间传送数据”的工具。将导入或导出命令翻译成 MapReduce 程序来实现在翻译出的 MapReduce 中主要是对 InputFormat 和 OutputFormat 进行定制

sujins 2020-01-04

Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具

Sqoop是一款开源的工具，主要用于在Hadoop相关存储与传统关系数据库间进行数据传递工作。Sqoop最早是作为Hadoop的一个第三方模块存在，后来被独立成为了一个Apache项目。除了关系数据库外，对于某些NoSQL数据库，Sqoop也提供了连接器。

hitxueliang 2019-12-31

sqoop--数据库和hdfs之间的搬运工

sqoop是一款开源的工具，主要用于在hadoop和与传统的数据库之间进行的数据的传递，可以将一个关系型数据库中的数据导入到hadoop的hdfs中，也可以将hdfs的数据导入到关系型数据库中。sqoop的命名由来就是sql?hadoop，它的原理就是将导

strongyoung 2019-12-28

小记--------sqoop的简单从mysql导入到hbase操作

--hbase-row-key id//如果不指定该参数，则采用源表的key作为rowkey；可以指定一个字段作为rowkey，或者指定多个字段组合成rowkey

tlsmile 2019-12-17

sqoop面试题

--query "$2" ‘ and $CONDITIONS;‘ # 指定满足sql和条件的数据导入。--incremental 导入模式\ # 用来指定增量导入的模式，append和lastmodified. 导入数据时采用–n

eternityzzy 2019-12-14

sqoop安装与使用

需要在Hadoop的yarn-site.xml 这个配置文件中增加以下属性<property> <name>yarn.log-aggregation-enable</name> <value>true<

csdnhadoop 2019-12-01

imp exp to in mysql in hadoop

已经成功安装配置Hadoop和Mysql数据库服务器，如果将数据导入或从Hbase导出，还应该已经成功安装配置Hbase。--export-dir '/user/root/aa/part-m-00000' ##hive中被导出的文件

Franklyn 2015-06-29

大数据模块开发----结果导出

Sqoop是Hadoop和关系数据库服务器之间传送数据的一种工具。它是用来从关系数据库如：MySQL，Oracle到Hadoop的HDFS，并从Hadoop的文件系统导出数据到关系数据库。由Apache软件基金会提供。Sqoop工作机制是将导入或导出命令翻

herohope 2019-11-05

数据迁移工具Sqoop和DataX功能比较

最近由于项目需要，对Apache Sqoop和Taobao DataX工具进行了调研，这里是对二者功能的初步梳理，不会涉及技术细节和使用方法，留作日后选型参考。Sqoop是Apache下的顶级项目，用来将Hadoop和关系型数据库中的数据相互转移，可以将一

lxypeter 2017-08-09

Sqoop是什么

Sqoop是一款开源的工具，主要用于在Hadoop与传统的数据库间进行数据的传递，可以将一个关系型数据库中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。Sqoop项目开始于2009年，最早是作为Hadoop的一个第三方模

flushest 2017-01-21

Sqoop 导数据到HDFS, 用Spark SQL进行查询

serverTimezone=Asia/Shanghai \. .getOrCreate();Order order = new Order();String[] items = line.getString(0).split(",")

hanhan 2019-09-02

Linux搭建Sqoop开发环境

Sqoop是Hadoop和关系数据库服务器之间传送数据的一种工具。它是用来从关系数据库如：MySQL，Oracle到Hadoop的HDFS，并从Hadoop的文件系统导出数据到关系数据库。传统的应用管理系统，也就是与关系型数据库的使用RDBMS应用程序的交

一个人的世界 2018-04-29

解决sqoop不能找到$SQOOP_HOME/lib下面jar的问题

sqoop导入数据后hdfs下面会有相应的文件如果继续执行相同的命令会出现问题。

eternityzzy 2017-09-18

安科网

使用Sqoop将MySQL数据导入到Hadoop

KevinMitnick

KevinMitnick

相关推荐

SQOOP增量抽取时，在HIVE中实现类似Oracle的merge操作

sqoop oracle到hive，动态分区一次操作记录

大数据 hadoop ---- Sqoop、flume、chukwa

Sqoop 一点通

2020年寒假假期总结0201

错误: 找不到或无法加载主类 org.apache.sqoop.Sqoop

七,sqoop 安装

Sqoop的安装和使用

Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具

sqoop--数据库和hdfs之间的搬运工

小记--------sqoop的简单从mysql导入到hbase操作

sqoop面试题

sqoop安装与使用

imp exp to in mysql in hadoop

大数据模块开发----结果导出

数据迁移工具Sqoop和DataX功能比较

Sqoop是什么

Sqoop 导数据到HDFS, 用Spark SQL进行查询

Linux搭建Sqoop开发环境

解决sqoop不能找到$SQOOP_HOME/lib下面jar的问题

KevinMitnick