International - English

Topic Center

Contact Sales

Big Data

[轉載] 利用flume+kafka+storm+mysql構建大資料即時系統

Time of Update: 2015-05-28

標籤：原文: http://mp.weixin.qq.com/s?__biz=MjM5NzAyNTE0Ng==&mid=205526269&idx=1&sn=6300502dad3e41a36f9bde8e0ba2284d&key=c468684b929d2be22eb8e183b6f92c75565b8179a9a179662ceb350cf82755209a424771bbc05810db9b7203a62c7a26&ascene=0&

大資料量資料庫最佳化 - CodeMain - 部落格園

Time of Update: 2015-05-13

標籤：一、資料庫結構的設計如果不能設計一個合理的資料庫模型，不僅會增加用戶端和伺服器段程式的編程和維護的難度，而且將會影響系統實際啟動並執行效能。所以，在一個系統開始實施之前，完備的資料庫模型的設計是必須的。

mysql 匯入大資料sql檔案

Time of Update: 2015-05-08

標籤：匯出Sql檔案在匯出時合理使用幾個參數，可以大大加快匯入的速度。 -e 使用包括幾個VALUES列表的多行INSERT文法; –max_allowed_packet=XXX 用戶端/伺服器之間通訊的緩衝區的最大大小; –net_buffer_length=XXX TCP/IP和通訊端通訊緩衝區大小,建立長度達net_buffer_length的行注意：max_allowed_packet和net_buffer_length不能比目標資料庫的配置數值大，否則可能出錯。例子：

【MySql 大資料量快速插入和語句最佳化】

Time of Update: 2015-04-28

標籤：java java學習 java面試題 INSERT語句的速度插入一個記錄需要的時間由下列因素組成，其中的數字表示大約比例：串連：(3)發送查詢給伺服器：(2)分析查詢：(2)插入記錄：（1x記錄大小）插入索引：（1x索引）關閉：(1)這不考慮開啟表的初始開銷，每個並發啟動並執行查詢開啟。表的大小以logN (B樹)的速度減慢索引的插入。加快插入的一些方法：·

教你做一個牛逼的DBA（在大資料下）

Time of Update: 2015-04-17

標籤：一、基本概念大資料量下，搞mysql，以下概念需要先達成一致1)單庫，不多說了，就是一個庫 2）分區（sharding），水平分割，用於解決擴充性問題，按天拆分表 3）複製（replication）與分組（group），用於解決可用性問題 4）分區+分組，這是大資料量下，架構的實際情況二、大資料量下，mysql常見問題及解決思路 1）常見問題如何保證可用性？各色各異的讀寫比，怎麼辦？如何做無縫倒庫，加欄位，擴容？資料量大，怎麼解決？

Java在處理大資料的時候一些小技巧

Time of Update: 2015-06-08

標籤：轉載自：http://soft.chinabyte.com/database/258/12609258.shtml 　　眾所周知，java在處理資料量比較大的時候，載入到記憶體必然會導致記憶體溢出，而在一些資料處理中我們不得不去處理海量資料，在做資料處理中，我們常見的手段是分解，壓縮，並行，臨時檔案等方法;　　例如，我們要將資料庫(不論是什麼資料庫)的資料匯出到一個檔案，一般是Excel或文字格式設定的CSV;對於Excel來講，對於POI和JXL的介面，你很多時候沒

C++實現大資料乘法

Time of Update: 2015-05-15

標籤：大資料乘法 1.測試環境 vs2013 windows 7採用累乘的方式實現，然後再統一的進位，最後將其在轉換為字串，輸出。程式碼：#define _CRT_SECURE_NO_WARNINGS#include<iostream>struct BigDataMutliplie{private:char data_a[100];char data_b[100];int len_a;int len_b;bool

大資料處理演算法三：分而治之/hash映射 + hash統計 + 堆/快速/歸併排序

Time of Update: 2015-04-29

標籤：hashcode 演算法大資料資料結構百度面試題1、海量日誌資料，提取出某日訪問百度次數最多的那個IP。IP 是32位的，最多有個2^32個IP。同樣可以採用映射的方法，比如模1000，把整個大檔案對應為1000個小檔案，再找出每個小文中出現頻率最大的 IP（可以採用hash_map進行頻率統計，然後再找出頻率最大的幾個）及相應的

大資料處理演算法二：Bloom Filter演算法

Time of Update: 2015-04-29

標籤：演算法百度面試題：給定a、b兩個檔案，各存放50億個url，每個url各佔64位元組，記憶體限制是4G，讓你找出a、b檔案共同的url？Bloom Filter是由Bloom在1970年提出的一種多雜湊函數映射的快速尋找演算法。通常應用在一些需要快速判斷某個元素是否屬於集合，但是並不嚴格要求100%正確的場合。一. 執行個體　　為了說明Bloom Filter存在的重要意義，舉一個執行個體：　　

2015阿里天池大資料比賽演算法設計

Time of Update: 2015-04-10

標籤：項目地址 : https://github.com/Huangtuzhi/AlibabaRecommand AlibabaRecommand Alibaba 2015 mobile recommending algorithm competition. 比賽介紹比賽通過對使用者在移動終端上一個月的行為資料進行分析，為後一天的使用者購買行為作出預測，進行推薦。目錄結構 ├── LICENSE #許可證└── README.md

首屆中國大資料技術沙龍會議邀請函

Time of Update: 2015-06-08

標籤：hadoop 超人學院當今最紅的名詞是大資料，掌握趨勢，才能贏得未來！首屆中國大資料技術沙龍會議暨超人學院技術交流會，邀請各位前來參會。在這裡，你可以瞭解大資料技術的趨勢，掌握企業對於技術的最新動向，學習和分享你在工作中的經驗及問題，你可以分享也可以提問，讓你掌握大資料最前沿的技術。奔跑吧，兄弟！趕快報名參加！更多精彩內容搶先看！首屆中國大資料技術沙龍會議邀請函

大資料雲端運算

Time of Update: 2015-06-07

標籤：大資料：資料量大，資料價值，分析，挖掘雲端運算：一般分三層構成【IAAS,SAAS,PAAS】IAAS:基礎設施既服務SAAS:平台即服務PAAS:軟體既服務Apache Hadoop

WCF用戶端傳輸大資料到服務端失敗配置問題

Time of Update: 2015-05-06

標籤：最近使用WCF遇到一個問題:當用戶端向WCF服務發送一個大量資料時候,發現會提示:"讀取 XML 資料時，超出最大字串內容長度配額 (8192)。通過更改在建立 XML 讀取器時所使用的 XmlDictionaryReaderQuotas 對象的 MaxStringContentLength

大資料流式處理一個不能忽視的問題

Time of Update: 2015-05-04

標籤：大資料串流儲存處理記憶體硬碟

[轉] 大資料量慣用最佳化方法

Time of Update: 2015-05-01

標籤：尊重知識，尊重作者。原文連結：http://www.thebigdata.cn/JieJueFangAn/14134.html在大資料網站看到的，方便日後查用轉來儲存。　　1. 應盡量避免在 where 子句中對欄位進行 null值判斷，否則將導致引擎放棄使用索引而進行全表掃描，如：　　select id from t where num is null　　可以在num上設定預設值0，確保表中num列沒有null值，然後這樣查詢：　　select id from t where num=0

2015年獲得大資料頂尖職位必備的9項技能

Time of Update: 2015-04-30

標籤：在大資料商品化之前, 利用大資料分析工具和技術來取得競爭優勢已不再是秘密。2015年, 如果你還在職場上尋找大資料的相關工作, 那麼, 這裡介紹的9種技能，將協助你得到一個工作機會。 1.Apache Hadoop Hadoop現在已經進入第二個10年發展期了, 但不可否認的是, Hadoop在2014年出現了井噴式發展,

WHU 1579 Big data (DP)

Time of Update: 2015-04-30

標籤：題意： f[0]=0,f[i]=f[i-1]+a or b. 求滿足L<=∑f[n]<=R的序列的種數 n<100. |a|,|b|<=10000. |L|,|R|<1e9 Solution 其實就是一個背包問題.

大資料雲端運算學習內容

Time of Update: 2015-04-28

標籤：Linux大綱 1.Linux的介紹，Linux的安裝：VMware Workstation虛擬軟體安裝過程、CentOS虛擬機器安裝過程2.瞭解機架伺服器，採用真實機架伺服器部署linux

大資料工程的生態系統圖

Time of Update: 2015-04-23

標籤：大資料的生態系統圖Thinking in BigData（八）大資料Hadoop核心架構HDFS+MapReduce+Hbase+Hive內部機理詳解淺談Apache Spark的6個發光點大資料，首先你要能存的下大資料。傳統的檔案系統是單機的，不能橫跨不同的機器。HDFS（Hadoop Distributed

2015阿里天池大資料競賽-Solution

Time of Update: 2015-04-14

標籤：阿里資料採礦競賽機器學習競賽介紹：連結這篇文章記錄2015阿里天池大資料競賽中，我的一些代碼，由於目前還在比賽中，僅分享一個naive solution，基於規則，代碼首頁在我的github上：連結，下面是代碼說明。有興趣的請看代碼注釋，恕不詳述。本repo目錄說明data 存放資料preprocess 資料預先處理rule 根據規則產生提交檔案model

總頁數： 74 1 .... 70 71 72 73 74 Go to: 前往

聯繫我們

該頁面正文內容均來源於網絡整理，並不代表阿里雲官方的觀點，該頁面所提到的產品和服務也與阿里云無關，如果該頁面內容對您造成了困擾，歡迎寫郵件給我們，收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至： info-contact@alibabacloud.com 進行舉報並提供相關證據，工作人員會在 5 個工作天內聯絡您，一經查實，本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More