Time of Update: 2017-01-19
本文執行個體講述了python中ConfigParse模組的用法,分享給大家供大家參考。具體方法如下:寫配置一般用ConfigParse.RawConfigParse類讀配置用ConfigParse.ConfigParse類代碼如下:寫設定檔:import ConfigParser import time config = ConfigParser.RawConfigParser() task = {} task["id"] = 1 task["package"] = "exe" task[
Time of Update: 2017-01-19
本文執行個體講述了Python基於twisted實現簡單的web伺服器,分享給大家供大家參考。具體方法如下:1. 建立htm檔案夾,在這個檔案夾中放入顯示的網頁檔案2. 在htm檔案夾的同級目錄下,建立web.py,web.py的內容為:from twisted.web.resource import Resource from twisted.web import server from twisted.web import static from twisted.internet
Time of Update: 2017-01-19
本文以執行個體分析了Python中asyncore模組的原理及用法,分享給大家供大家參考。具體分析如下:asyncore庫是python的一個標準庫,它是一個非同步socket的封裝。我們操作網路的時候可以直接使用socket等底層的庫,但是asyncore使得我們可以更加方便的操作網路,避免直接使用socket,select,poll等工具時需要面對的複雜。這個庫很簡單,包含了一個函數和一個類* loop()函數*
Time of Update: 2017-01-19
接下來準備用糗百做一個爬蟲的小例子。但是在這之前,先詳細的整理一下Python中的Regex的相關內容。Regex在Python爬蟲中的作用就像是老師點名時用的花名冊一樣,是必不可少的神兵利器。一、
Time of Update: 2017-01-19
前面說到了urllib2的簡單入門,下面整理了一部分urllib2的使用細節。1.Proxy 的設定urllib2 預設會使用環境變數 http_proxy 來設定 HTTP Proxy。如果想在程式中明確控制 Proxy 而不受環境變數的影響,可以使用代理。建立test14來實現一個簡單的代理Demo:複製代碼 代碼如下:import urllib2 enable_proxy = True proxy_handler =
Time of Update: 2017-01-19
在開始後面的內容之前,先來解釋一下urllib2中的兩個個方法:info / geturl urlopen返回的應答對象response(或者HTTPError執行個體)有兩個很有用的方法info()和geturl()1.geturl():這個返回擷取的真實的URL,這個很有用,因為urlopen(或者opener對象使用的)或許會有重新導向。擷取的URL或許跟請求URL不同。以人人中的一個超級連結為例,我們建一個urllib2_test10.py來比較一下原始URL和重新導向的連結:
Time of Update: 2017-01-19
一、網路爬蟲的定義網路爬蟲,即Web Spider,是一個很形象的名字。把互連網比喻成一個蜘蛛網,那麼Spider就是在網上爬來爬去的蜘蛛。網路蜘蛛是通過網頁的連結地址來尋找網頁的。從網站某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中的其它連結地址,然後通過這些連結地址尋找下一個網頁,這樣一直迴圈下去,直到把這個網站所有的網頁都抓取完為止。如果把整個互連網當成一個網站,那麼網路蜘蛛就可以用這個原理把互連網上所有的網頁都抓取下來。這樣看來,網路爬蟲就是一個爬行程式,一個抓取網頁的程式。
Time of Update: 2017-01-19
本文執行個體講述了python中二維陣列的變換方法。分享給大家供大家參考。具體方法如下:先看如下代碼:arr = [ [1, 2, 3], [4, 5, 6], [7, 8,9], [10, 11, 12]] print map(list, zip(*arr)) print '_-------------------------------------------------' print [[r[col] for r in arr] for col in range(len(arr[0]))
Time of Update: 2017-01-19
本文執行個體講述了python實現上傳樣本到virustotal並查詢掃描資訊的方法。分享給大家供大家參考。具體方法如下:import simplejson import urllib import urllib2 import os MD5 = "5248f774d2ee0a10936d0b1dc89107f1" MD5 = "12fa5fb74201d9b6a14f63fbf9a81ff6" #do not have report on virustotal.com ###
Time of Update: 2017-01-19
本文執行個體講述了python擷取檔案版本資訊、公司名和產品名的方法,分享給大家供大家參考。具體如下:該python代碼可得到檔案版本資訊、公司名和產品名。其他的資訊都在返回的字典中。具體代碼如下: def _getCompanyNameAndProductName(self, file_path): """ Read all properties of the given file return them as a dictionary. """
Time of Update: 2017-01-19
數字類型 數字提供了標量貯存和直接存取。它是不可更改類型,也就是說變更數位值會產生新的對象。當然,這個過程無論對程式員還是對使用者都是透明的,並不會影響軟體的開發方式。 Python 支援多種數字類型:整型、長整型、布爾型、雙精確度浮點型、十進位浮點型和複數。 建立數值對象並用其賦值 (數字對象) 建立數值對象和給變數賦值一樣同樣簡單:複製代碼 代碼如下:>>> anInt=1>>> along=-555555555555L>>>
Time of Update: 2017-01-19
關聯規則挖掘(Association rule mining)是資料採礦中最活躍的研究方法之一,可以用來發現事情之間的聯絡,最早是為了發現超市交易資料庫中不同的商品之間的關係。(啤酒與尿布)基本概念1、支援度的定義:support(X-->Y) = |X交Y|/N=集合X與集合Y中的項在一條記錄中同時出現的次數/資料記錄的個數。例如:support({啤酒}-->{尿布}) = 啤酒和尿布同時出現的次數/資料記錄數 = 3/5=60%。2、自信度的定義:confidence(X--&
Time of Update: 2017-01-19
一、多線程同步由於CPython的python解譯器在單線程模式下執行,所以導致python的多線程在很多的時候並不能很好地發揮多核cpu的資源。大部分情況都推薦使用多進程。python的多線程的同步與其他語言基本相同,主要包含:Lock & RLock :用來確保多線程多共用資源的訪問。Semaphore : 用來確保一定資源多線程訪問時的上限,例如資源集區。 Event :
Time of Update: 2017-01-19
queue和pipe的區別: pipe用來在兩個處理序間通訊。queue用來在多個進程間實現通訊。 此兩種方法為所有系統多進程通訊的基本方法,幾乎所有的語言都支援此兩種方法。1)Queue & JoinableQueuequeue用來在進程間傳遞訊息,任何可以pickle-able的對象都可以在加入到queue。multiprocessing.JoinableQueue 是
Time of Update: 2017-01-19
一、picklepickle模組用來實現python對象的序列化和還原序列化。通常地pickle將python對象序列化為二進位流或檔案。 python對象與檔案之間的序列化和還原序列化:複製代碼 代碼如下:pickle.dump()pickle.load()如果要實現python對象和字串間的序列化和還原序列化,則使用:複製代碼 代碼如下:pickle.dumps()pickle.loads() 可以被序列化的類型有:* None,True 和 False;*
Time of Update: 2017-01-19
類代碼:# -*- coding:gbk -*-import osclass TABFILE: def __init__(self, filename, dest_file = None): self.filename = filename if not dest_file: self.dest_file = filename else: self.dest_file = dest_file self.filehandle = None
Time of Update: 2017-01-19
本文執行個體講述了python有認證的加密解密實現方法。分享給大家供大家參考。具體實現方法如下:最近在做python的加解密工作,同時加完密的串能在php上能解出來,網上也找了一些靠譜的資料,剛好也有時間我就總結了一下python在加密與解密這塊的代碼,今後可能還能用的上。相對於php而言python這塊加解密組件較多的,分別是:python-crypto - 這個組件是基本組件,使用的函式相對比較複雜。ezPyCrypto - 相對簡單,但他作出來的公私密金鑰無法與其他程式相相容 &
Time of Update: 2017-01-19
本文執行個體講述了Python提示[Errno 32]Broken pipe導致線程crash錯誤解決方案。分享給大家供大家參考。具體方法如下:1. 錯誤現象ThreadingHTTPServer 實現的 http 服務,如果用戶端在伺服器返回前,主動中斷連線,則伺服器端會報 [Errno 32] Broken pipe 錯,並導致處理線程 crash.下面先看個例子,python 版本: 2.7範例程式碼複製代碼 代碼如下:#!/usr/bin/env python#!coding=utf-8
Time of Update: 2017-01-19
本文執行個體講述了決策樹的python實現方法。分享給大家供大家參考。具體實現方法如下:決策樹演算法優缺點:優點:計算複雜度不高,輸出結果易於理解,對中間值缺失不敏感,可以處理不相關的特徵資料缺點:可能會產生過度匹配的問題適用資料類型:數值型和標稱型演算法思想:1.決策樹構造的整體思想:決策樹說白了就好像是if-else結構一樣,它的結果就是你要產生這個一個可以從根開始不斷判斷選擇到葉子節點的樹,但是呢這裡的if-else必然不會是讓我們認為去設定的,我們要做的是提供一種方法,電腦可以根據這種方
Time of Update: 2017-01-19
使用pythonbrew複製代碼 代碼如下:easy_install pythonbrew[root@li637-23 schirm]# pythonbrew_installWell-done! Congratulations!The pythonbrew is installed as: /root/.pythonbrewPlease add the following line to the end of your ~/.bashrc [[ -s