基於PHP讀取TXT檔案向資料庫匯入海量資料的方法_PHP教程

來源:互聯網
上載者:User

有一個TXT檔案,包含了10萬條記錄,格式如下:

列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1

……………………後面有10萬條………………

需求是要匯入資料庫中,資料表的結構為

word_id 自動增量
word 【adductive#1 adducting#1 adducent#1】這一個TXT記錄要轉換為3個SQL記錄
value =第三列-第四列;如果=0,則此條記錄略過不插入資料表
複製代碼 代碼如下:
$file = 'words.txt';//10W條記錄的TXT源檔案
$lines = file_get_contents($file);
ini_set('memory_limit', '-1');//不要限制Mem大小,否則會報錯
$line=explode("\n",$lines);
$i=0;
$sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";

foreach($line as $key =>$li)
{
$arr=explode(" ",$li);
$senti_value=$arr[2]-$arr[3];
if($senti_value!=0)
{
if($i>=20000&&$i<25000)//分批次匯入,避免失敗
{
$mm=explode(" ",$arr[4]);
foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】這一個TXT記錄要轉換為3個SQL記錄 {
$nn=explode("#",$m);
$word=$nn[0];
$sql.="(\"$word\",1,$senti_value,2),";//這個地方要注意到是 word有可能包含單引號(如jack's),因此我們要用雙引號來包含word(注意轉義)
}
}
$i++;
}
}
//echo $i;
$sql=substr($sql,0,-1);//去掉最後一個逗號
//echo $sql;
file_put_contents('20000-25000.txt', $sql); //大量匯入資料庫,5000條一次,大概需要40秒的樣子;一次匯入太多max_execution_time會不夠,導致失敗
?>

1,海量資料匯入到時候,要注意PHP的一些限制,可以臨時調整一下,否則會報錯

Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)

2,PHP操作TXT檔案

file_get_contents()

file_put_contents()

3,海量匯入的時候,最好分批次匯入,失敗的幾率小一些

4,海量匯入之前,指令碼一定要多次測試無誤再使用,比如用100條資料來測試

5,匯入之後,如果PHP的mem_limit還是不夠的話,程式仍然跑不起來

(建議用修改php.ini的方式來提高mem_limit,而不是用臨時的語句)

http://www.bkjia.com/PHPjc/326817.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/326817.htmlTechArticle有一個TXT檔案,包含了10萬條記錄,格式如下: 列1 列2 列3 列4 列5 a 00003131 0 0 adductive#1 adducting#1 adducent#1 a 00003356 0 0 nascent#1 a 00003553 0 0 em...

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.