python寫簡單爬蟲的五種方法

擷取html的方法【一】:使用urllib# -*- coding: UTF-8 -*-import urllib ' 擷取web頁面內容並返回'def getWebPageContent(url):    f = urllib.urlopen(url)    data = f.read()    f.close()return data url = 'http://blog.csdn.net'content =

去除python list中的重複值

在一篇很牛的介紹python中list去重的部落格(http://www.peterbe.com/plog/uniqifiers-benchmark)中收集到的: view plaincopy to clipboardprint? 1. from random import shuffle, randint 2. import re 3. from sets import Set 4. def f1(seq): # Raymond Hettinger 5. #

Python list 操作

建立列表sample_list =['a',1,('a','b')]Python 列表操作sample_list = ['a','b',0,1,3]得到列表中的某一個值value_start = sample_list[0]end_value = sample_list[-1]刪除列表的第一個值delsample_list[0]在列表中插入一個值sample_list[0:0] = ['sample value']得到列表的長度list_length =

簡單而直接的Python web 架構:web.py

轉自:http://www.oschina.net/question/5189_4306 web.py 是一個Python 的web 架構,它簡單而且功能強大。web.py 是公開的,無論用於什麼用途都是沒有限制的。先讓大家感受一下web.py 的簡單而強大:import weburls = ( '/(.*)', 'hello')class hello: def GET(self, name): i = web.input(times=1) if not

簡明 Python 編程規範v2 .

賴勇浩(http://laiyonghao.com)註:之前發布一篇《簡明 Python 編程規範》(見:http://blog.csdn.net/lanphaday/article/details/2834883),本是我給當時所在的公司制定的,發表到部落格的時候,對齊等問題都有一些錯誤,還包括一些錯別字。到後來,我又有做過修正。大概在 2010 年 8 年,我又由 C++ 開發轉到 Python 開發,便在那之前的基礎上潤飾和完善,形成第二版。前段時間

Python程式碼統計

用py簡單的實現了一個統計程式碼的小工具#/usr/bin/pythonimport os#count the line of a single filedef CountLine(path): tempfile = open(path) res = 0 for lines in tempfile: res += 1 print "%s %d" %(path, res) #output the file

python 三方包源碼編譯錯誤

在編譯jpype   python setup.py build 時遇到如下錯誤:4-2.4/src/native/python/jpype_javaarray.oIn file included from src/native/python/jpype_javaarray.cpp:18:src/native/python/include/jpype_python.h:24:20: error: Python.h: No such file or

Python 資料庫介面模組

轉自:http://wiki.woodpecker.org.cn/moin/DatabaseModules專用資料庫連接模組MySQLMySQL -- 最流行的開來源資料庫MySQL-Python -- MySQL 的 Python 介面http://dustman.net/andy/python/python-and-mysql -- MySQL-Python 作者的 PresentationSQLiteSQLite -- 小巧輕便的嵌入式資料庫pysqlite -- SQLite

python datetime格式化參數

坑爹啊,記憶力不行,老是記不住,都用了這麼久了,記在這裡以後來翻。DirectiveMeaningNotes%aLocale’s abbreviated weekdayname. %ALocale’s full weekday name. %bLocale’s abbreviated monthname. %BLocale’s full month name. %cLocale’s appropriate date andtime representation. %dDay of the

Python橋接Java工具JPype

JPype這玩意可以橋接Java,在Python中調用Java的類,比較好用,對外介面不多,不過需要注意的是python和java類型匹配的問題.可以參考官方文檔http://jpype.sourceforge.net/doc/user-guide/userguide.html過程中遇到個小問題,設定classpath時,-D前面留了一個空格,導致始終找不到類的錯誤,很坑爹。jvmArg = "-Djava.class.path=%s" %

Python檔案讀寫

 今天在看Python檔案讀寫操作,發現python這東西真不錯。#開啟檔案和進行寫操作f=open(‘test.txt’,'w’)f.write(‘hello’)f.writelines(['hi','haha'])#多行輸入f.close()#append dataf=open(‘test.txt’,'a’)f.write(‘hello’)f.writelines(['hi','haha'])f.close()#連續寫入後會自動關閉open(‘test.txt’,'a’).write(‘11

在Java中調用Python

在執行之前都需要把jython對應的包載入進去,這個是必須的。 1.在java類中直接執行python語句import javax.script.*;import org.python.util.PythonInterpreter;import java.io.*;import static java.lang.System.*;public class FirstJavaScript{ public static void main(String args[]) {

java調用python

python.javaimport java.util.List;import org.python.core.PyException;import org.python.core.PyInteger;import org.python.core.PyObject;import org.python.util.PythonInterpreter;public class python { public static void main(String []args)throws

用python把xml和xsl轉換為html

前些天用python處理xml的轉換的一個小程式,用來把xml,xsl轉換成html。用的libxml2,所以還要先安裝了libxml2模組才能使用。# -*- coding: mbcs -*- #!/usr/bin/python import libxml2, libxslt class compoundXML:     def __init__(self):         self._result = None         self._xsl = None         self._

python模組之threading: 在python中使用多線程

    python是支援多線程的,並且是native的線程。主要是通過thread和threading這兩個模組來實現的。thread是比較底層的模組,threading是對thread做了一些封裝的,可以更加方便的被使用。這裡需要提一下的是python對線程的支援還不夠完善,不能利用多CPU,但是下個版本的python中已經考慮改進這點,讓我們拭目以待吧。   

Python擷取作業系統版本資訊

    最近,想在我的YouMoney(http://code.google.com/p/youmoney/)裡面增加提取使用者作業系統版本資訊。比如windows使用者,可能要返回Windows XP ,或者Windows 2003, 蘋果使用者應該返回Mac OS X 10.5.8。用了很多辦法,包括在mac系統裡調用系統命令,取環境變數,等等。最後無意發現,原來python裡裡面有個platform模組就可以幹這件事情。省事啊!     mac上這麼幹 localhost:~ apple$

python模組之StringIO

    

使用python發送簡單的郵件

前些時間,論壇上有人討論怎麼用python發送需要認證的郵件,我在我的FreeBSD在telnet到163的的smtp伺服器,分析了一下,就用python寫個了發送郵件的程式,感覺有點粗糙,但還算能工作。import smtplib, base64class SimpleSendMail:    def __init__(self, smtp_server, from_addr, to_addr, user, passwd):        self.from_addr = from_addr 

python的print對編碼的處理

    python的print會對輸出的文本做自動的編碼轉換,而檔案對象的write方法就不會做,因此,當一些字串用print輸出正常時,write到檔案確不一定和print的一樣。    print轉換的目的編碼和環境變數有關,Windows XP是轉換為gbk的。在linux下是按照環境變數來轉換的。在linux下使用locale命令就可以看到。比如我的是:[zhaowei@papaya zhaowei]$

用python格式化css檔案

    最近研究研究了css,少不了去網上分析一下別人的網頁, 但很多網站的css檔案都是要麼寫在一行,要麼一個換行都沒有,看起來極其痛苦,所以寫一個指令碼轉換一下,轉換為比較有可讀性的格式。下面就是這個指令碼:import string, sysimport re, StringIOTAB=4def format(ss):    f = open (ss, "r")    data = f.read()    f.close()        dlen = len(data)    i = 0

總頁數: 2974 1 .... 279 280 281 282 283 .... 2974 Go to: 前往

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.