Time of Update: 2015-11-02
標籤:相對於使用MapReduce或者Spark Application的方式進行資料分析,使用Hive SQL或Spark SQL能為我們省去不少的代碼工作量,而Hive SQL或Spark SQL本身內建的各類UDF也為我們的資料處理提供了不少便利的工具,當這些內建的UDF不能滿足於我們的需要時,Hive SQL或Spark
Time of Update: 2015-11-03
標籤:使用Spark SQL的基礎是“註冊”(Register)若干表,表的一個重要組成部分就是模式,Spark
Time of Update: 2015-11-03
標籤:一、安裝easy_install參考文章:http://www.cnblogs.com/huangjacky/archive/2012/03/28/2421866.html安裝wget https://bootstrap.pypa.io/ez_setup.py -O - | python 安裝到了預設的python2.6.6版本裡面【如果是2.7.5的版本呢,參考最下面的參考文章】測試是否安裝成功easy_installeasy_install Twisted
Time of Update: 2015-10-30
標籤:Spark SQL使用時需要有若干“表”的存在,這些“表”可以來自於Hive,也可以來自“暫存資料表”。如果“表”來自於Hive,它的模式(列名、列類型等)在建立時已經確定,一般情況下我們直接通過Spark
Time of Update: 2015-11-02
標籤: import cx_OracleTraceback (most recent call last):File "", line 1, in ?ImportError: libclntsh.so.10.1: cannot open shared object file: No such file or
Time of Update: 2015-11-03
標籤:準備工作:cmd 命令列下安裝pymssql:pip install pymssql 查詢的資料庫如下: 代碼如下:#coding=utf-8import pymssqlclass MSSQLOBJ(object): def __init__(self, user, password, dbname, host=‘local‘, port=1433): self._connect =
Time of Update: 2015-10-27
標籤:執行個體1、取得MYSQL版本# -*- coding: UTF-8 -*-#安裝MYSQL DB for pythonimport MySQLdb as mdbcon = Nonetry: #串連mysql的方法:connect(host=‘localhost‘,user=‘root‘,passwd=‘root‘,db=‘test‘,port=3306) con = mdb.connect(‘localhost‘, ‘root‘, ‘root‘, ‘test‘)
Time of Update: 2015-10-19
標籤:樣本 Spark SQL註冊“暫存資料表”執行“Join”(Inner Join、Left Outer Join、Right Outer Join、Full Outer Join) 代碼 from pyspark import SparkConf, SparkContextfrom pyspark.sql import SQLContext, Row conf = SparkConf().setAppName("
Time of Update: 2015-10-06
標籤:看完視頻,自己練習一遍. 還是遇到問題,不過最終還是解決了.貼上完成的代碼.CREATE TABLE `NewTable` (`acctid` int(11) NOT NULL AUTO_INCREMENT COMMENT ‘賬戶ID‘ ,`money` int(11) NULL DEFAULT NULL COMMENT ‘餘額‘ ,PRIMARY KEY (`acctid`))ENGINE=InnoDBDEFAULT CHARACTER SET=utf8
Time of Update: 2015-09-27
標籤:1. 需要從oracle網站下載一下兩個包instantclient-basic-linux.x64-11.2.0.4.0.zipinstantclient-sdk-linux.x64-11.2.0.4.0.zip2. 下載後解壓到某目錄下,如:/oracle3. 根據解壓後的 BUILD.txt 步驟進行配置: 3.1 cat .bash_profile # .bash_profile# Get the aliases and functionsif [ -f ~
Time of Update: 2015-09-19
標籤:python
Time of Update: 2015-09-16
標籤:python mysqldb——MySQLdb模組 常用的函數: commit() 提交 rollback() 復原cursor用來執行命令的方法: callproc(self, procname, args):用來執行預存程序,接收的參數為預存程序名和參數列表,傳回值為受影響的行數 execute(self, query, args):
Time of Update: 2015-09-17
標籤:查看python的版本#python -V Python 2.6.61.下載Python-2.7.3#wget http://python.org/ftp/python/2.7.3/Python-2.7.3.tar.bz22.解壓#tar -jxvf Python-2.7.3.tar.bz23.更改工作目錄#cd Python-2.7.34.安裝#./configure#make all #make install#make clean#make
Time of Update: 2015-09-06
標籤:python mysql #!/usr/bin/pythonimport MySQLdbdef select(table,value,item,res): try: conn=MySQLdb.connect(host=‘localhost‘,user=‘root‘,db=‘shop‘,port=3306)
Time of Update: 2015-08-30
標籤:上篇文章建立了一個空的網站。現在我們要準備正式我們的網站開發咯。那麼開發的第一步是啥呢?當然是要確定做什麼網站了。每個人的開發習慣可能不盡相同,有點可能是從前端開始設計,有的可能是從資料庫開始設計(不得不說django在資料庫操作方面是很強大的)。我屬於後者,因為我對前端不太熟悉,哈哈!我要做一個公司內部團體訂餐系統,方便統一訂餐。功能需求很簡單:公司每天要訂餐,訂餐每天定一家餐館的菜。我想到需要建立如下資料庫表:餐館(Restaurant)、商品分類(Category)、商品(good)
Time of Update: 2015-08-30
標籤: 1 #coding=utf-8 2 import MySQLdb 3 conn = MySQLdb.Connect(host = ‘127.0.0.1‘,port=3306,user=‘root‘,passwd=‘‘,db=‘test‘,charset=‘utf8‘) 4 cursor = conn.cursor() 5 6 try: 7 #插入資料 8 sql_insert = "insert into orders(order_id,product_id)
Time of Update: 2015-11-05
標籤:在許多程式設計語言中都包含有格式化字串的功能,比如C和Fortran語言中的格式化輸入輸出。Python中內建有對字串進行格式化的操作%。 模板格式化字串時,Python使用一個字串作為模板。模板中有格式符,這些格式符為真實值預留位置,並說明真實數值應該呈現的格式。Python用一個tuple將多個值傳遞給模板,每個值對應一個格式符。比如下面的例子: Python 1print("I‘m %s. I‘m %d
Time of Update: 2015-10-08
標籤: http://www.cnblogs.com/toutou/p/4778818.html Ctrl+/注釋(取消注釋)選擇的行Shift + Enter開始新行Ctrl + Enter智能換行TAB Shift+TAB縮排/取消縮排所選擇的行Ctrl + Alt + I自動縮排行 Ctrl + Y刪除當前插入符所在的行Ctrl + D 複製當前行、或者選擇的塊Ctrl + Shift + J合并行 Ctrl + Shift +
Time of Update: 2015-09-15
Python如何記錄日誌,Python記錄日誌python的日誌記錄非常簡單,短短几行代碼就能實現日誌記錄,注釋比較清楚了,不詳細解釋了。Python代碼 #encoding: utf-8import logging#擷取日誌對象,可以帶名字,不帶名字返回root Loggerlogger =
Time of Update: 2015-08-30
python監控windows的CPU,Memory,Disk,pythonmemory有一批windows系統需要監控,無論是zabbix、nagios都需要安裝相關外掛程式,操作起來比較麻煩。python的psutil模組可以跨平台監控linux、windows、mac等,於是使用python寫監控指令碼,然後利用py2exe工具將其打包成exe後,直接將其放到windows下直接運行即可。1.安裝python2.7(32位)在https://www.python.org/downloads