Time of Update: 2015-08-17
標籤:一、準備在正式開始本內容之前,需要先從github下載相關代碼。該代碼可以建立兩個資料庫,分別名為test_01和mysql_shiyan ,並在mysql_shiyan資料庫中建4個表(department,employee,project,table_1),然後向其中插入資料。具體操作如下,首先輸入命令進入Desktop:cd Desktop然後再輸入命令,下載代碼:git clone http://git.shiyanlou.com/shiyanlou/SQL5下載完成後,
Time of Update: 2015-08-17
標籤:一、準備在正式開始本內容之前,需要先從github下載相關代碼,搭建好一個名為mysql_shiyan的資料庫(有三張表:department,employee,project),並向其中插入資料。具體操作如下,首先輸入命令進入tmp目錄:cd /tmp然後再輸入命令,下載代碼:git clone http://git.shiyanlou.com/shiyanlou/SQL6下載完成後,輸入“cd
Time of Update: 2015-08-19
標籤:一、文字值1. 字串字串指用單引號(‘‘’)或雙引號(‘"’)引起來的字元序列。例如:‘a string‘"another string"如果SQL伺服器模式啟用了NSI_QUOTES,可以只用單引號引用字串。用雙引號引用的字串被解釋為一個識別符。字串可以有一個可選字元集引介詞和COLLATE子句:[_charset_name]‘string‘ [COLLATE collation_name]例如:SELECT _latin1‘string‘
Time of Update: 2015-08-16
標籤:準備在正式開始本內容之前,需要先從github下載相關代碼,搭建好一個名為mysql_shiyan的資料庫(有三張表:department,employee,project),並向其中插入資料。具體操作如下,首先輸入命令進入Desktop:cd Desktop然後再輸入命令,下載代碼:git clone http://git.shiyanlou.com/shiyanlou/SQL4下載完成後,輸入“cd
Time of Update: 2015-08-16
標籤:一、簡介約束是一種限制,它通過對錶的行或列的資料做出限制,來確保表的資料的完整性、唯一性。本節實驗就在操作中熟悉MySQL中的幾種約束。二、內容1、約束分類聽名字就知道,約束是一種限制,它通過對錶的行或列的資料做出限制,來確保表的資料的完整性、唯一性。在MySQL中,通常有這幾種約束:約束類型:主鍵預設值唯一外鍵非空關鍵字:PRIMARY KEYDEFAULTUNIQUEFOREIGN KEYNOT
Time of Update: 2015-08-15
標籤:一、練習內容1、建立資料庫首先,我們建立一個資料庫,給它一個名字,比如“mysql_shiyan”,以後的幾次實驗也是對mysql_shiyan這個資料庫進行操作。 語句格式為“CREATE DATABASE <資料庫名字>;”,(注意不要漏掉“;”)因此具體命令為:CREATE DATABASE mysql_shiyan;建立成功後輸入命令“show
Time of Update: 2015-08-14
標籤:分類:海量資料處理面試題1.海量日誌資料,提取出某日訪問百度次數最多的那個IP。 首先是這一天,並且是訪問百度的日誌中的IP取出來,逐個寫入到一個大檔案中。注意到ip是32位的,最多有個2^32個ip。同樣可以採用映射的方法,比如模1000,把整個大檔案對應為1000個小檔案,在找出每個小檔案中出現頻率最大的ip(可以採用hash_map進行頻率統計,然後再找出頻率最大的幾個)及相應的頻率。然後再在這1000個最大的ip中,找出那個頻率最大的ip,即為所求。或者如下闡述: 演算法思想:
Time of Update: 2015-08-31
標籤:經常看到一些詞一起出現,今天總結下。 日後再看All from Apache Offical Docs 1/apache kafka what is kafka? kafka is a distributed, partipationed, replicated commit log service,. It provides the functionlity of a messaging system, but with a unique
Time of Update: 2015-08-29
標籤:初識hadoop前言之前在學校的時候一直就想學習大資料方面的技術,包括hadoop和機器學習啊什麼的,但是歸根結底就是因為自己太懶了,導致沒有堅持多長時間,加上一直為offer做準備,所以當時重心放在C++上面了(雖然C++也沒怎麼學),計劃在大四下有空餘時間再來慢慢學習。現在實習了,需要這方面的知識,這對於我來說,除去校招時候投遞C++職位有少許影響之外,無疑是有很多的好處。所以,接下來的很長日子,我學習C++之外的很多時間都必須要花在大資料上面了。那麼首先呢,先來認識一下這處理大資料的
Time of Update: 2015-08-29
標籤:雲端運算 標準 雲端運算標準化需求分析:從技術角度看 概念和定義:通過標準化統一雲端運算的概念、定義及內容; 互操作:需要制定分散式運算資源、儲存資源之間的介面標準,以便更好地解決互操作問題; 虛擬化:需要制定網路、硬體等各種資源虛擬化的格式規範,解決資源的虛擬化、調度和流轉問題; 應用開發和部署:需要制定虛擬資源集區應用開發介面規範,為上層應用的開發部署及應用提供更好
Time of Update: 2015-08-28
標籤:本篇為這一段時間以來我對大資料相關技術的學習心得及理解,主要涉及以下幾個方面: noSql, 叢集, 資料採礦, 機器學習,雲端運算,大資料,以及Hadoop和Spark。主要都是一些初級的概念澄清之類的東西,並且比較淩亂,慎入。* 1. NoSQL我的理解是,NoSQL主要用於儲存一些非結構化資料, 是關聯式資料庫與檔案儲存體方式(比如視頻檔案就適合使用檔案的方式儲存)的過度。** 1.1 NoSQL的分類: 列儲存: Hbase(BigTable的開源實現),可儲存結構化資料。
Time of Update: 2015-08-27
標籤:商業智慧 商業智慧bi 650) this.width=650;" src="http://www.powerbibbs.com/data/attachment/forum/201508/18/085926m6tnm49cnv5d1u81.jpg" width="827" height="1170" alt="085926m6tnm49cnv5d1u81.jpg" />650) this.width=650;" src="
Time of Update: 2015-08-21
標籤:前幾天做一個批量發訊息的功能,因為要向訊息表中批量寫入資料,用的EF架構的插入方法;不用不知道,一用嚇一跳;就10000條資料就耗時好幾分鐘,對應追求使用者體驗的我來說這是極不能容忍的,後來改為拼接SQL,效能提高了好幾倍;現在來分享一下經驗:原始的方法類似這種: 1 public ActionResult Add(ItemDetails entity) 2 { 3 var sw = new Stopwatch(); 4
Time of Update: 2015-08-18
標籤:上周末參加了IBM Analytics舉辦的“大資料駭客馬拉松(Big Data Hackathon)北京站”比賽,4個人組隊拿到了第一名,非常的開心,也非常的不容易,我們四個wesor像共事了很久一樣,各司其職配合默契,拿下了最後的錦標。第一天9點到晚上11點多,本想熬夜可是受限於主辦方場地,第二天9點到下午三點,連吃飯都端著盤子對著電腦。這兩天累的一直緩解不過來,睡覺都覺得累的睡不著,但是確實學到了很多的東西,從比賽中,從隊友身上……
Time of Update: 2015-08-17
標籤:86講 http://www.tudou.com/programs/view/30qvTnUD3nE/for運算式的產生器定義和過濾器 本節都是學過的,所以就不多說什麼了//val content=for(x<-List(1,2,3); y<-
Time of Update: 2015-08-16
標籤: java.math.BigInteger系列教程(四)BigInteger的誕生原因
Time of Update: 2015-08-16
標籤:我們使用 sbt 建立、測試、運行和提交作業。該教程會解釋你在我們的課程中將會用到的所有 sbt 命令。工具安裝頁說明了如何安裝 sbt。我們一般將代碼和庫做成jar包,通過spark-submit 提交到spark 叢集上運行。1)下載安裝:
Time of Update: 2015-08-16
標籤:1.kafka是一種高輸送量的分布式發布訂閱訊息系統,它可以處理消費者規模的網站中的所有動作流資料Step 1: Download the codeDownload the 0.8.2.0 release and un-tar it.> tar -xzf kafka_2.10-0.8.2.0.tgz> cd kafka_2.10-0.8.2.0Step 2: Start the server首先要create
Time of Update: 2015-08-15
標籤:問題引入:1.給40億個不重複的unsigned
Time of Update: 2015-08-15
標籤:雜湊hash使用雜湊,實現6428633條CSDN賬戶資料的簡單查詢#define _CRT_SECURE_NO_WARNINGS#include <stdio.h>#include <stdlib.h>char path[256] = "E:\\Big_Data\\csdn.txt";#define N 6428633unsigned int BKDRHash(char *str);struct beitai{char