sqoop從hdfs匯出到mysql

來源:互聯網
上載者:User

標籤:blog   檔案   資料   ar   資料庫   sql   mysql   app   

create database logs;

use logs

create table weblogs_from_hdfs(
 md5 varchar(32),
 url varchar(64),
 request_date date,
 request_time time,
 ip varchar(15)
);

sqoop export -m 1 --connect jdbc:mysql://hadoop:3306/logs --username root --password root --table weblogs_from_hdfs --export-dir /data/weblogs/import --input-fields-terminated-by ‘\t‘
對於通過sqoop匯入的資料為NULL的在匯出到資料庫中時依然保持為NULL.即使在檔案中儲存為字串為‘null‘。
sqoop預設為insert 插入新的語句
--update-key ‘md5‘  則將建立更新語句,update ....where md5 = ‘.......‘
如果--update-key ‘md5‘ 設定的值沒有找到,可以設定--update-mode allowinsert 允許新增這行資料

每個mapper預設預設插入1000條記錄,然後提交事務,若mapper失敗,可能出現插入衝突或者插入重複資料,可以通過一個暫存資料表--staging-table temptableName,等一個事務完成再將資料複製到--table指定的表中,暫存資料表結構必須與最終表一致
 create table temp_table as select * from real_table where 1=0;
 暫存資料表必須為空白表,否側必須配置參數--clear-staging-table 在插入資料前清空暫存資料表


 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.