Time of Update: 2018-12-08
下面就先定義一個函數: 複製代碼 代碼如下:def foo(): print('function') foo() 在上述代碼中,定義了一個名為foo的函數,這個函數沒有參數。最後一行代碼的功能是調用這個函數。這是一個函數的最簡單形式。下面來介紹一下有參數的函數: 複製代碼 代碼如下:def foo(): print('function') def foo1(a,b): print(a+b) foo()
Time of Update: 2018-12-08
首先下載最新版本的python。www.python.org,目前版本為3.1。 接下來是安裝,在windows下python的安裝與其他應用程式一樣,不多複述。 在windows下,即可以使用命令列的方式,也可以使用IDLE來開發python。首先介紹命令列的方式:設定PATH,將python的安裝路徑添加至PATH環境變數中即可。在命令列中輸入python,會顯示相應的版本號碼,並進入至python工作環境中去。另外一種方式是IDLE,這個是python預設安裝的開發環境。
Time of Update: 2018-12-08
例如:'string'、"string"、"""string"""或者是'''string'''。在使用上,單引號和雙引號沒有什麼區別。三引號的主要功能是在字串中可以包含換行。也就是說,在三引號中的字串,如果其中的內容在程式中是分行的,那麼,在使用中也是分行的。這樣就不需要顯示的使用"\n"來換行了。 像多數程式設計語言一樣,python中的字串是不可變的。同樣,對於轉移字元的處理,也和其他語言類似。如“ 'What's your name?' ”,在這個字串內部,出現了“ '
Time of Update: 2018-12-08
源碼如下 :儲存成utf-8 bd.py 檔案 複製代碼 代碼如下:#!/usr/bin/env python # -*- coding: utf-8 -*- import sys import urllib ,urllib2 import re def baidu(w): url= "http://www.baidu.com/s?" values = { "w":w.encode('gbk','ignore') } data = urllib.urlencode(values) newurl
Time of Update: 2018-12-08
>>> "hello".encode("hex") '68656c6c6f'相應的還可以>>> '68656c6c6f'.decode("hex") 'hello'查了一下手冊,還有這些codec可用CodecAliasesOperand typePurposebase64_codecbase64, base-64byte stringConvert operand to MIME base64bz2_codecbz2byte stringCompress
Time of Update: 2018-12-08
一、網路知識的一些介紹 socket 是網路連接端點。例如當你的Web瀏覽器請求www.jb51.net上的首頁時,你的Web瀏覽器建立一個socket並命令它去串連 www.jb51.net的Web伺服器主機,Web伺服器也對來自的請求在一個socket上進行監聽。兩端使用各自的socket來發送和 接收資訊。 在使用的時候,每個socket都被綁定到一個特定的IP地址和連接埠。IP地址是一個由4個數組成的序列,這4個數均是範圍
Time of Update: 2018-12-08
要匹配字串中1個反斜線應該怎麼寫Regex?"\\",這樣行嗎?試試就知道了,re模組拋異常了,因為"\\"就是一個反斜線,對於Regex解析器來說,是一個逸出字元,但是後面啥也沒有,自然就報錯了,"\\\"三個肯定是不行的,試試四個"\\\\",完美匹配。 複製代碼 代碼如下:import re re_str_patt = "\\\\" reObj = re.compile(re_str_patt) str_test = "abc\\cd\\hh" print
Time of Update: 2018-12-08
以前提取這些檔案用的是一同事些的批次檔;用起來不怎麼順手,剛好最近在學些python,所有就自己動手寫了一個python提取檔案的小程式;1、原理 提取檔案的原理很簡單,就是到一個指定的目錄,找出最後修改時間大於給定時間的檔案,然後將他們複製到目標目錄,目標目錄的結構必須和原始目錄一致,這樣工程人員拿到後就可以直接覆蓋整個目錄; 2、實現 為了程式的通用,我定義了下面的設定檔 config.xml複製代碼 代碼如下:<?xml version="1.0" encoding="utf-8"?
Time of Update: 2018-12-08
代碼如下: 複製代碼 代碼如下:import sys, urllib import datetime,time def getDate(): strday=datetime.datetime.now().__str__() strday=strday.split()[0] return strday #url = "http://www.kingnic.com/list/2009-06-16.txt" def getUrl(dateStr=None): baseUrl ="http://www.
Time of Update: 2018-12-08
下面是用python寫的,使用lxml來做html分析,從網上看到的,說是分析速度最快的哦,不過沒有驗證過。好了,上代碼。 複製代碼 代碼如下:import urllib import urllib2 import urlparse import lxml.html def url_with_query(url, values): parts = urlparse.urlparse(url) rest, (query, frag) = parts[:-2], parts[-2:] return
Time of Update: 2018-12-08
1. self, cls 不是關鍵字 在python裡面,self, cls 不是關鍵字,完全可以使用自己寫的任意變數代替實現一樣的效果 代碼1 複製代碼 代碼如下:class MyTest: myname = 'peter' def sayhello(hello): print "say hello to %s" % hello.myname if __name__ == "__main__": MyTest().sayhello() 代碼1中, 用hello代替掉了self,
Time of Update: 2018-12-08
複製代碼 代碼如下:# coding=utf-8 from BeautifulSoup import BeautifulSoup, Tag, NavigableString from SentenceSpliter import SentenceSpliter from os.path import basename,dirname,isdir,isfile from os import makedirs from shutil import copyfile import io import
Time of Update: 2018-12-08
def cndebug(obj=False): """ Author : Nemon Update : 2009.7.1 TO use : cndebug(obj) or cndebug() or MyObject.debug=cndebug License: GPL """ print('='*80) print('='*30 + ' GLOBAL VARIABLES ' +'='*30) print('='*80) g=globals() for x,y in g.iteritems():
Time of Update: 2018-12-08
複製代碼 代碼如下:def find_file_by_pattern(pattern='.*', base=".", circle=True): '''''尋找給定檔案夾下面所有 ''' re_file = re.compile(pattern) if base == ".": base = os.getcwd() final_file_list = [] print base cur_list = os.listdir(base) for item in cur_list: if item =
Time of Update: 2018-12-08
二元運算子 特殊方法 + __add__,__radd__ - __sub__,__rsub__ * __mul__,__rmul__ / __div__,__rdiv__,__truediv__,__rtruediv__ // __floordiv__,__rfloordiv__ % __mod__,__rmod__ ** __pow__,__rpow__ << __lshift__,__rlshift__ >> __rshift__,__rrshift__ &
Time of Update: 2018-12-08
複製代碼 代碼如下:########################## # # # 為了避免截斷中文字元 # # 檔案要求是 unicode 編碼 # # txt檔案另存新檔對話方塊下面有下拉框,可選存 # # 儲編碼格式 # # # ########################## import os import struct filename = str(raw_input("Please enter an old file name: ")) filenamepre =
Time of Update: 2018-12-08
1.元字元: . 它匹配除了換行字元外的任何字元,在 alternate 模式(re.DOTALL)下它甚至可以匹配換行 ^ 匹配行首。除非設定 MULTILINE 標誌,它只是匹配字串的開始。 $ 匹配行尾,行尾被定義為要麼是字串尾,要麼是一個換行字元後面的任何位置。 * 重複0或N次 + 重複1或N次 ? 重複0或1次 {} 該限定符的意思是至少有 m 個重複,至多到 n 個重複 [] 它們常用來指定一個字元類別,所謂字元類別就是你想匹配的一個字元集 \
Time of Update: 2018-12-08
1.match() 從開始位置開始匹配 2.search() 任意位置匹配,如果有多個匹配,只返回第一個 3.finditer() 返回所有匹配 4.每次匹配,都是盡量最大匹配。例如: >>> m = re.compile('abc[bcd]*b') >>> m.findall('abcbcbcb') ['abcbcbcb'] 其實abcbcb也是匹配的abc[bcd]*b的,不過只返回一個最大的匹配值。 5.split()方法
Time of Update: 2018-12-08
複製代碼 代碼如下:# coding:utf-8 import os import sys def cut_and_paste_file(source, destination): ''' source: file path 中文 destination: directory path ''' def format_path(path): if not os.path.isabs(path): path =
Time of Update: 2018-12-08
ip正則式為:r'(([12][0-9][0-9]|[1-9][0-9]|[1-9])\.){3,3}([12][0-9][0-9]|[1-9][0-9]|[1-9])' 以下為一個樣本 #-*- coding:utf-8 -*- import re def ip(): '驗證IP的正則式' def match_group(p): s = '''211.210.209.108 gan ffad1.210.2.108 d ffad1.210.2.109afa''' com =