Time of Update: 2015-05-28
標籤:原文: http://mp.weixin.qq.com/s?__biz=MjM5NzAyNTE0Ng==&mid=205526269&idx=1&sn=6300502dad3e41a36f9bde8e0ba2284d&key=c468684b929d2be22eb8e183b6f92c75565b8179a9a179662ceb350cf82755209a424771bbc05810db9b7203a62c7a26&ascene=0&
Time of Update: 2015-05-13
標籤:一、資料庫結構的設計 如果不能設計一個合理的資料庫模型,不僅會增加用戶端和伺服器段程式的編程和維護的難度,而且將會影響系統實際啟動並執行效能。所以,在一個系統開始實施之前,完備的資料庫模型的設計是必須的。
Time of Update: 2015-05-08
標籤: 匯出Sql檔案 在匯出時合理使用幾個參數,可以大大加快匯入的速度。 -e 使用包括幾個VALUES列表的多行INSERT文法; –max_allowed_packet=XXX 用戶端/伺服器之間通訊的緩衝區的最大大小; –net_buffer_length=XXX TCP/IP和通訊端通訊緩衝區大小,建立長度達net_buffer_length的行 注意:max_allowed_packet和net_buffer_length不能比目標資料庫的配置數值大,否則可能出錯。 例子:
Time of Update: 2015-04-28
標籤:java java學習 java面試題 INSERT語句的速度插入一個記錄需要的時間由下列因素組成,其中的數字表示大約比例:串連:(3)發送查詢給伺服器:(2)分析查詢:(2)插入記錄:(1x記錄大小)插入索引:(1x索引)關閉:(1)這不考慮開啟表的初始開銷,每個並發啟動並執行查詢開啟。表的大小以logN (B樹)的速度減慢索引的插入。加快插入的一些方法:·
Time of Update: 2015-04-17
標籤:一、基本概念大資料量下,搞mysql,以下概念需要先達成一致1)單庫,不多說了,就是一個庫 2)分區(sharding),水平分割,用於解決擴充性問題,按天拆分表 3)複製(replication)與分組(group),用於解決可用性問題 4)分區+分組,這是大資料量下,架構的實際情況 二、大資料量下,mysql常見問題及解決思路 1)常見問題如何保證可用性?各色各異的讀寫比,怎麼辦?如何做無縫倒庫,加欄位,擴容?資料量大,怎麼解決?
Time of Update: 2015-06-08
標籤:轉載自:http://soft.chinabyte.com/database/258/12609258.shtml 眾所周知,java在處理資料量比較大的時候,載入到記憶體必然會導致記憶體溢出,而在一些資料處理中我們不得不去處理海量資料,在做資料處理中,我們常見的手段是分解,壓縮,並行,臨時檔案等方法; 例如,我們要將資料庫(不論是什麼資料庫)的資料匯出到一個檔案,一般是Excel或文字格式設定的CSV;對於Excel來講,對於POI和JXL的介面,你很多時候沒
Time of Update: 2015-05-15
標籤:大資料 乘法 1.測試環境 vs2013 windows 7採用累乘的方式實現,然後再統一的進位,最後將其在轉換為字串,輸出。程式碼:#define _CRT_SECURE_NO_WARNINGS#include<iostream>struct BigDataMutliplie{private:char data_a[100];char data_b[100];int len_a;int len_b;bool
Time of Update: 2015-04-29
標籤:hashcode 演算法 大資料 資料結構 百度面試題1、海量日誌資料,提取出某日訪問百度次數最多的那個IP。IP 是32位的,最多有個2^32個IP。同樣可以採用映射的方法,比如模1000,把整個大檔案對應為1000個小檔案,再找出每個小文中出現頻率最大的 IP(可以採用hash_map進行頻率統計,然後再找出頻率最大的幾個)及相應的
Time of Update: 2015-04-29
標籤:演算法百度面試題:給定a、b兩個檔案,各存放50億個url,每個url各佔64位元組,記憶體限制是4G,讓你找出a、b檔案共同的url?Bloom Filter是由Bloom在1970年提出的一種多雜湊函數映射的快速尋找演算法。通常應用在一些需要快速判斷某個元素是否屬於集合,但是並不嚴格要求100%正確的場合。 一. 執行個體 為了說明Bloom Filter存在的重要意義,舉一個執行個體:
Time of Update: 2015-04-10
標籤:項目地址 : https://github.com/Huangtuzhi/AlibabaRecommand AlibabaRecommand Alibaba 2015 mobile recommending algorithm competition. 比賽介紹 比賽通過對使用者在移動終端上一個月的行為資料進行分析,為後一天的使用者購買行為作出預測,進行推薦。 目錄結構 ├── LICENSE #許可證└── README.md
Time of Update: 2015-06-08
標籤:hadoop 超人學院 當今最紅的名詞是大資料,掌握趨勢,才能贏得未來!首屆中國大資料技術沙龍會議暨超人學院技術交流會,邀請各位前來參會。在這裡,你可以瞭解大資料技術的趨勢,掌握企業對於技術的最新動向,學習和分享你在工作中的經驗及問題,你可以分享也可以提問,讓你掌握大資料最前沿的技術。奔跑吧,兄弟!趕快報名參加!更多精彩內容搶先看!首屆中國大資料技術沙龍會議邀請函
Time of Update: 2015-06-07
標籤:大資料:資料量大,資料價值,分析,挖掘雲端運算:一般分三層構成【IAAS,SAAS,PAAS】IAAS:基礎設施既服務SAAS:平台即服務PAAS:軟體既服務Apache Hadoop
Time of Update: 2015-05-06
標籤:最近使用WCF遇到一個問題:當用戶端向WCF服務發送一個大量資料時候,發現會提示:"讀取 XML 資料時,超出最大字串內容長度配額 (8192)。通過更改在建立 XML 讀取器時所使用的 XmlDictionaryReaderQuotas 對象的 MaxStringContentLength
Time of Update: 2015-05-04
標籤:大資料 串流 儲存處理 記憶體 硬碟
Time of Update: 2015-05-01
標籤:尊重知識,尊重作者。原文連結:http://www.thebigdata.cn/JieJueFangAn/14134.html在大資料網站看到的,方便日後查用轉來儲存。 1. 應盡量避免在 where 子句中對欄位進行 null值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 可以在num上設定預設值0,確保表中num列沒有null值,然後這樣查詢: select id from t where num=0
Time of Update: 2015-04-30
標籤: 在大資料商品化之前, 利用大資料分析工具和技術來取得競爭優勢已不再是秘密。2015年, 如果你還在職場上尋找大資料的相關工作, 那麼, 這裡介紹的9種技能,將協助你得到一個工作機會。 1.Apache Hadoop Hadoop現在已經進入第二個10年發展期了, 但不可否認的是, Hadoop在2014年出現了井噴式發展,
Time of Update: 2015-04-30
標籤:題意: f[0]=0,f[i]=f[i-1]+a or b. 求滿足L<=∑f[n]<=R的序列的種數 n<100. |a|,|b|<=10000. |L|,|R|<1e9 Solution 其實就是一個背包問題.
Time of Update: 2015-04-28
標籤:Linux大綱 1.Linux的介紹,Linux的安裝:VMware Workstation虛擬軟體安裝過程、CentOS虛擬機器安裝過程2.瞭解機架伺服器,採用真實機架伺服器部署linux
Time of Update: 2015-04-23
標籤:大資料的生態系統圖Thinking in BigData(八)大資料Hadoop核心架構HDFS+MapReduce+Hbase+Hive內部機理詳解淺談Apache Spark的6個發光點 大資料,首先你要能存的下大資料。傳統的檔案系統是單機的,不能橫跨不同的機器。HDFS(Hadoop Distributed
Time of Update: 2015-04-14
標籤:阿里資料採礦競賽 機器學習 競賽介紹:連結這篇文章記錄2015阿里天池大資料競賽中,我的一些代碼,由於目前還在比賽中,僅分享一個naive solution,基於規則,代碼首頁在我的github上:連結,下面是代碼說明。有興趣的請看代碼注釋,恕不詳述。 本repo目錄說明data 存放資料preprocess 資料預先處理rule 根據規則產生提交檔案model