Time of Update: 2016-07-02
標籤:背景:當資料庫裡面的資料達到幾百萬條上千萬條的時候,如果要分頁的時候(不過一般分頁不會有這麼多),如果業務要求這麼做那我們需要如何解決呢?我用的本地一個自己生產的一張表有五百多萬的表,來進行測試,表名為big_data;首先我們看如下幾條sql語句:在這之前我們開啟profiling來監測sql語句執行的情況。set
Time of Update: 2016-07-04
標籤:項目內容 技術 知識 清理 統計 近期交接了前期的大資料項目,對之前的項目內容做一個總結。也算是梳理一下項目的架構,對前期也算是一個總結,為後期的學習打下一個基礎。清理資料
Time of Update: 2016-07-05
標籤:企業級大資料處理方案有三種業務情境:1.離線處理;(mapreduce(第一代)、sparksql(第二代))2.即時處理;(資料庫操作、storm)3.准即時處理。(spark
Time of Update: 2016-07-04
標籤:當你有了一隻美麗的爬蟲後你可以做很多有意思的事情,比如爬蟲爬到了很多餐飲資料後就可以做餐飲地區活躍度分析了,這些分析指標是很有意義的,特別是對準備開店的人。首先要將資料從福士點評、美團或其他網站資料擷取下來,方式可以從美食產品入口,然後找到餐飲公司資訊,然後找到地址,地區等資訊。採集的時候要做好防重策略,這樣可以節省很多時間,還有就是不要並發太大,以免影響正常的業務。將採集到的資料寫入資料庫,以備後用。有了這些資料就可以對餐飲公司的分布做統計分析了,能很容易統計出某個城市餐飲公司的地區分布
Time of Update: 2016-07-01
標籤:大資料 單機版 偽分布式版 redhat6.4 hadoop2.7.2 ssh rsync http 保護模式 0660 644 Hadoop Local (Standalone) Mode(單機版)的安裝純粹只是為練手,練完了單機版,下面該練練Pseudo-Distributed
Time of Update: 2016-07-01
標籤:java 技術 開發 學習心得 公開課 從事JavaEE開發有三年,感覺自己對於Web開發的東西掌握也就是一般的水平,突然發現自己沒有以前對技術的那種熱愛了,後來51CTO上看到大資料的相關課程,參加了徐培成老師的大資料的公開課,突然發現老師對大資料的理解很是簡單直接,讓我突然對大資料特別的感興趣,並且自己有一定的Java
Time of Update: 2016-06-30
標籤:專業培訓 最新動向 就業市場 工程師 公開課 升職啦
Time of Update: 2016-06-30
標籤:轉行 時間都去哪了? ——記我將要到來的工作四周年 不知不覺間,工作馬上就要滿四周年了。從初出校門的楞小夥,變成了人夫,也即將成為人父,總是會感歎,“時間都去哪了?” 還記得剛工作那時,每天上班都很煎熬,領導分配的工作,很多東西都不會,需要請教項目組的其他同事,有時候,老是請教別人覺得很簡單的問題,也會讓自己覺得很臉紅。所以,自己就告訴自己,一定要自己好好努力,
Time of Update: 2016-06-30
標籤:轉行 時間都去哪了? ——記我將要到來的工作四周年 不知不覺間,工作馬上就要滿四周年了。從初出校門的楞小夥,變成了人夫,也即將成為人父,總是會感歎,“時間都去哪了?” 還記得剛工作那時,每天上班都很煎熬,領導分配的工作,很多東西都不會,需要請教項目組的其他同事,有時候,老是請教別人覺得很簡單的問題,也會讓自己覺得很臉紅。所以,自己就告訴自己,一定要自己好好努力,
Time of Update: 2016-07-01
標籤: 現在的社會是一個高速發展的社會,科技發達,資訊流通,人們之間的交流越來越密切,生活也越來越方便,大資料就是這個高科技時代的產物,那麼什麼是大資料呢? 接下來就為你介紹下大資料:大資料是需要新處理模式才能具有更強的決策力、洞察發現力和流程最佳化能力來適應海量、高增長率和多樣化的資訊資產。
Time of Update: 2016-06-30
標籤:升職啦 跳槽啦 加薪啦 考證啦 作為一個搬磚的低級碼農,在複製和粘貼中漫無目的的度過數個春秋,直到某天發現進來的90後才發現自己已經在虛偽無用的搬磚技能中麻木了太長時間。是時候展現真正的技術了---大資料。
Time of Update: 2016-06-30
標籤:性價比高 教育培訓 最新動向 專業培訓 線上視頻 報名參加第一期培訓馬上就要結束了,特此紀念下第一次參加職業培訓,第一次線上視頻教學。
Time of Update: 2016-06-28
標籤:引言 大資料查詢分析是雲端運算中核心問題之一,自從Google在2006年之前的幾篇論文奠定雲端運算領域基礎,尤其是GFS、Map-Reduce、Bigtable被稱為雲端運算底層技術三大基石。GFS、Map-Reduce技術直接支援了Apache Hadoop項目的誕生。Bigtable和Amazon
Time of Update: 2016-06-26
標籤:一個穩定可靠的系統離不開監控,我們不僅監控服務是否存活,還要監控系統的健全狀態。健全狀態主要是對這些組件的核心metrics採集、抓取、分析和警示。一、監控的資料監控的日誌資料一般包括:v APP、PC、Web 等系統運行Log:採用Flume-NG搜集v 使用者日誌 : 採用Flume-NG搜集v 後端Server(SOA)日誌:採用Flume-NG搜集v 巨量資料元件的Metrics:JMX和HTTPv M
Time of Update: 2016-06-26
標籤: 大資料已經成為一種發展趨勢,得到越來越多的公司參與。最近從事大資料系統設計開發和Recommendation Engine方面的工作,分幾篇文章兩個系列把自己的心得記錄一下,和大家分享一下大資料方面的經驗。整個平台包括監控系統、日誌分析系統、推薦系統。按資料業務步驟劃分,分為資料擷取、清洗、儲存、分析和服務。整個資料流程如: 實際項目中和這流程圖有點差異。前端日誌搜集採用的Flume。大資料系統之系統設計
Time of Update: 2016-06-23
標籤:工作這麼多年了,從零開始學習 大資料,現在把提綱儲存一下。一、Hadoop入門,瞭解什麼是Hadoop1、Hadoop產生背景2、Hadoop在大資料、雲端運算中的位置和關係3、國內外Hadoop應用案例介紹4、國內Hadoop的就業情況分析及課程大綱介紹5、分布式系統概述6、Hadoop生態圈以及各組成部分的簡介7、Hadoop核心MapReduce例子說明二、Distributed File SystemHDFS,是資料庫管理員的基礎課程1、Distributed
Time of Update: 2016-06-23
標籤:大資料 hadoop 2.7.2 單機版 local (standalone) mode 安裝 對APACHE的開源項目做了一個簡單的分析之後,下一步就是去一窺hadoop的真容了。直接存取HADOOP官網地址,這裡就是學習hadoop的官方渠道了,以下內容摘自官網: What Is Apache
Time of Update: 2016-06-21
標籤:第四屆CCF大資料學術會議徵文通知2016年10月,蘭州
Time of Update: 2016-06-21
標籤:
Time of Update: 2016-06-19
標籤:1、hadoop、Hive、sqoop、spark、storm、odps、dremel、hbase(hadoop、spark重要)2、oracle、mysql後台開發,以及對量海資料處理、高並發請求處理3、熟悉Linux,Shell或Python等語言4、互連網行業資料採礦5、分布式、多線程及高效能的設計與編碼及效能調優(重要)6、熟悉Internet基本協議(如TCP/IP. HTTP等)內容及相關應用7、設計模式、交易處理、緩衝架構、搜尋引擎、任務調試、Web