Time of Update: 2018-07-30
【注】:下述操作過程是結合多種網路方法,然後自己實踐的結果。寫在這裡,主要目的是加深記憶,也希望能協助後來者 Python中檔案的讀寫包含三個步驟:開啟檔案,讀/寫檔案,關閉檔案。 檔案開啟之後必須關閉,因為在磁碟上讀寫檔案的功能是由作業系統提供的,檔案作為對象,被開啟後會佔用作業系統的資源,而作業系統在同一時間內開啟檔案的數量是有限的。 開啟檔案: f=open('路徑/檔案名稱',
Time of Update: 2018-07-30
#-*- coding: utf-8-*- import os import sys import fnmatch import glob from win32com import client as wc #將檔案夾下的word檔案轉化為txt檔案 def word2txt(): path='D:\code\my_projects\project01\source'
Time of Update: 2018-07-30
# 源碼如下: #!/usr/bin/env python#coding=utf-8import osfrom PIL import Image, ImageDrawimport cvdef detect_object(image): '''檢測圖片,擷取人臉在圖片中的座標''' grayscale = cv.CreateImage((image.width, image.height), 8, 1) cv.CvtColor(image, grayscale,
Time of Update: 2018-07-30
之前寫了一個從記錄檔中(txt檔案)提取特定的日誌,寫入mysql資料庫的指令碼,由於日誌太大,維護人員把日誌打包壓縮成了tar.gz格式。 之前txt檔案單個檔案超過2G,把單個txt檔案打包壓縮成一個tar.gz檔案了。所以我的python指令碼也需要修改。(伺服器centos6.3) 本來想過一個方案,就是把tar.gz解壓出來,然後再讀取,讀取完成後再把這個解壓出來的檔案刪除掉,這個方案不是不可行,但不是很好,一個大檔案的解壓縮比較慢,另一個解壓後比較占伺服器磁碟。
Time of Update: 2018-07-30
在處理文本的時候,首先要做的是讀取一下文字檔,一般的方法如下: corpus = open('這個位置放檔案絕對路徑', 'r').readlines() 將這個文字檔按行讀取,每行一個元素放到一個list中。但是需要將整個文字檔先全部裝入記憶體中。 如果文字檔太大,不能一次性讀入記憶體怎麼辦。要使用Python中的迭代器,一次讀取一個成員,然後對這個成員進行某種操作就可以了。 具體方法如下: class
Time of Update: 2018-07-30
f.readline()讀取一行,是以字串的形式返回。所以()內是讀取的位元,空為讀完本行。 import codecsimport linecachef = codecs.open('text.txt','w','utf-8')f.write('Using Python\n')f.write('line1\n')f.write('line2\n')f.write('By CXX\n')f.close()f= codecs.open('text.txt','r','utf-8')print
Time of Update: 2018-07-30
1. pop():括弧中不加參數表示刪除列表最後一個元素,也可以加下標參數刪除 players = ['charles','martina','michael','florence','eli']players.pop()print players 運行結果如下: ['charles', 'martina', 'michael', 'florence'] 2. remove():按元素刪除,括弧中加入要刪除的元素 players = ['charles','martina',
Time of Update: 2018-07-30
建立一個Scrapy項目 定義提取的Item 編寫爬取網站的 spider 並提取 Item 編寫 Item Pipeline 來儲存提取到的Item(即資料) Scrapy由 Python 編寫。如果您剛接觸並且好奇這門語言的特性以及Scrapy的詳情, 對於已經熟悉其他語言並且想快速學習Python的編程老手, 我們推薦 Learn Python The Hard Way
Time of Update: 2018-07-30
昨天用readlines讀取一個檔案,運行一會好好就自動掛掉,找了半天也找不出原因,然後問師兄列表元素個數是否有上限。我為什麼這麼問了,因為我的檔案有13G,775,149,707行。師兄說沒有,這就奇了怪了,就算按列表讀進去記憶體會耗費很多倍,但是我的記憶體夠大啊,1T 啊。師兄記憶體耗用過大的話,程式帶不動。好吧,任務結束後去看看具體原因。那麼只好用readline了,這樣就不耗記憶體了,一行行讀進去。
Time of Update: 2018-07-30
在 web 應用中經常會出現 iframe 嵌套的應用,假設頁面上有 A、B 兩個 iframe,其中 B 在 A 內,那麼定位 B 中的內容則需要先到 A,然後再到 B。 iframe 中實際上是嵌入了另一個頁面,而 webdriver 每次只能在一個頁面識別,因此需要用 switch_to.frame 方法去擷取 iframe 中嵌入的頁面,對那個頁面裡的元素進行定位。 如果iframe裡有id或者name,使用switch_to_frame()可以很方便的定位到,如 例1:
Time of Update: 2018-07-30
# coding:gbkimport sysimport localedef p(f): print '%s.%s(): %s' % (f.__module__, f.__name__, f())# 返回當前系統所使用的預設字元編碼p(sys.getdefaultencoding)# 返回用於轉換Unicode檔案名稱至系統檔案名稱所使用的編碼p(sys.getfilesystemencoding)# 擷取預設的地區設定並返回元祖(語言,
Time of Update: 2018-07-30
#Copyright (c)2017, 東北大學軟體學院學生# All rightsreserved#檔案名稱:a.py# 作 者:孔雲#問題描述:#問題分析:。代碼如下:import networkx as ne #匯入建網路模型包,命名neimport matplotlib.pyplot as mp #匯入科學繪圖包,命名mp#BA scale-free degree network
Time of Update: 2018-07-30
一、題目描述 二、解法 def minNumberInRotateArray(rotateArray): # write code here p1 = 0 p2 = len(rotateArray)-1 mid = p1 while rotateArray[p1]>=rotateArray[p2]: if p2 - p1 ==1: mid = p2 break mid
Time of Update: 2018-07-30
或者是對python的unicode理解得不透徹,時常遇到各種各樣的中文亂碼問題,今天,在email應用中,中文亂碼又出來搗亂了,經過一段時間的誤打誤撞,搞出了一個解決方案: # -*- coding: utf-8 -*-'''Created on 2010-6-21 @author: Administrator''' import emailfrom email.MIMEText import MIMETextfrom email.MIMEMultipart
Time of Update: 2018-07-30
在部落格(Python 本機資料擷取 網址:http://blog.csdn.net/sxingming/article/details/51333663)中,我們詳細介紹了python中檔案讀寫的各種方法。 本文通過例子具體樣本一下readline( )函數的使用,所用的例子均是從檔案"C:\Users\Administrator\Desktop\test.txt"中讀取資料,檔案內容如下: >>>
Time of Update: 2018-07-30
1、搭建環境 這裡我使用的是anaconda,anaconda裡面整合了很多關於python科學計算的第三方庫,主要是安裝方便,anaconda中內建Spyder。 這裡下載anaconda 比較推薦使用Python2.7 在anaconda下安裝Scrapy也很簡單。CMD進入命令列,直接輸入conda install scrapy,然後點“y”,很簡單就可以安裝成功。 這樣就搭建好了環境。 2、初步瞭解Scrapy Scrapy官網教程,建議看看哦
Time of Update: 2018-07-30
之前寫過類比登入新浪微博的文章,然而我並沒有去爬過微博的資料,覺得有點浪費,於是就想寫一個代碼來發微博。寫完之後覺得如果能自動發微博就好了,但是我又不可能24小時開始(晚上12點後還會斷網),也沒有vps(窮學生狗),找過幾個免費vps未果,然後想到之前用過新浪SAE,就想能不能在上面試試。 試了一天左右終於讓我試出來了。。 基本實現了: 1、定時發送,這裡是定時半小時 2、離線自動,基於sae,無需開電腦blabla
Time of Update: 2018-07-30
如上圖,本次將挑python的內建函數中常用的簡要示範一下 為了方便看,將同類方法的函數連在一起示範; abs():取絕對值 >>> print(abs(-2345))2345 /# 0,[],”“,(),{},None 這些字元python中會當作布爾值Flase all():都為真,才為真 #all不接受多個字串作為參數,只能將這些參數放到一個列表(或元祖等)中>>> print(all(0,True,1,['qwe','
Time of Update: 2018-07-30
內建函數 Build-in Function,啟動python解譯器,輸入dir(__builtins__), 可以看到很多python解譯器啟動後預設載入的屬性和函數,這些函數稱之為內建函數, 這些函數因為在編程時使用較多,cpython解譯器用c語言實現了這些函數,啟動解譯器 時預設載入。 這些函數數量眾多,不宜記憶,開發時不是都用到的,待用到時再help(function), 查看如何使用,或結合百度查詢即可,在這裡介紹些常用的內建函數。 range
Time of Update: 2018-07-30
採用工具是Anaconda的python軟體工具,因為其包含python語句外,還包含許多統計函數 2、具體使用步驟 1)資料庫資料匯出成csv檔案,其中有需進行md5加密欄位2)csv匯入至python中3)載入md5函數 4)進行md5加密 5)匯出加密後資料 MD5是什麼? MD5為電腦安全領域廣泛使用的一種散列函數,用以提供訊息的完整性保護。 1991年,Rivest開發出技術上更為趨近成熟的md5演算法。