標籤:python、weather、xml、gzip
近來公司大螢幕的天氣介面老是出問題,之前用的是webservice的http://www.webxml.com.cn/WebServices/WeatherWebService.asmx這個介面,坑的是每個月的25號該服務暫停維護,因此不得不尋找新的介面替換。。。
然後我在網站上找了很多介面(大都是到期的或者非免費的!)。。。類似
國家氣象局提供的天氣預報介面http://www.weather.com.cn/data/sk/101010100.html
2014年6月最新更新的http://www,weather.com.cn/adat/sk/101010100.html
http://webservice.36wu.com/weatherService.asmx
以上這些我都試過了。。。沒幾天這些資料就各種出問題!!!
接下來我就把我的最近新找的一個萬年曆的天氣介面(http://wthrcdn.etouch.cn/WeatherApi?citykey=101230101)執行個體展示給大家
注意:以上的citykey可以根據不同城市自行修改的。。。因為我是公司內部應用,城市不變,我就寫死了,後面大家也可以自己去找一個根據IP擷取城市,然後再擷取對應編碼,最後擷取天氣資訊的樣本,這個在網站上應該也能找的到的,我之前看到過。
接下來廢話少說,我就把我的可啟動並執行python代碼貼進來吧
#-*-coding:utf-8-*-import urllib2import timeurl=‘http://wthrcdn.etouch.cn/WeatherApi?citykey=101230101‘f = urllib2.urlopen(url)headers = f.info()rawdata = f.read()‘‘‘值得注意的是這個萬年曆網址給的xml檔案是經過gzip壓縮的檔案,純粹的下載下來的話是會有問題的所以這裡進行gzip的解壓縮操作‘‘‘if (‘Content-Encoding‘ in headers and headers[‘Content-Encoding‘]) or (‘content-encoding‘ in headers and headers[‘content-encoding‘]): import gzip import StringIO data = StringIO.StringIO(rawdata) gz = gzip.GzipFile(fileobj=data) rawdata = gz.read() gz.close()result=rawdata.decode(‘UTF-8‘)#print resulth=open ( ‘test.xml‘, ‘w‘ ) #這裡我把來源資料存在本目錄下的test.xml檔案裡面h.write(rawdata)h.close() try: import xml.etree.cElementTree as ETexcept ImportError: import xml.etree.ElementTree as ET def change_node_text(nodelist,text,is_add=False,is_delete=False): for node in nodelist: if is_add: node.text += text elif is_delete: node.text = "" else: node.text = textdef write_weather_xml(tree,out_path): tree.write(out_path,encoding="UTF-8",xml_declaration=True) tree = ET.ElementTree(file="./test.xml")root = tree.getroot()‘‘‘print(root[0].tag)print(root[2].tag)print(root[3].tag)print(root[5].tag)print(root[4].tag)print(root[13][0][0].tag)print(root[13][0][1].tag)print(root[13][0][2].tag)‘‘‘if __name__ == "__main__": #這邊使用主函數的方法來運行時因為我們需要擷取即時的資料,因此要寫成一個迴圈裡面 while True: print(‘城市:‘.decode(‘GBK‘)+root[0].text) city=‘城市:‘.decode(‘GBK‘)+root[0].text print(‘當前溫度:‘.decode(‘GBK‘)+root[2].text+‘℃‘.decode(‘GBK‘)) wendu=‘當前溫度:‘.decode(‘GBK‘)+root[2].text+‘℃‘.decode(‘GBK‘) print(‘風力:‘.decode(‘GBK‘)+root[3].text) fengli=‘風力:‘.decode(‘GBK‘)+root[3].text print(‘風向:‘.decode(‘GBK‘)+root[5].text) fengxiang=‘風向:‘.decode(‘GBK‘)+root[5].text print(‘濕度:‘.decode(‘GBK‘)+root[4].text) shidu=‘濕度:‘.decode(‘GBK‘)+root[4].text print(‘日期:‘.decode(‘GBK‘)+root[12][0][0].text) riqi=‘日期:‘.decode(‘GBK‘)+root[12][0][0].text print(‘最‘.decode(‘GBK‘)+root[12][0][2].text+"~"+‘最‘.decode(‘GBK‘)+root[12][0][1].text) temperature=‘最‘.decode(‘GBK‘)+root[12][0][2].text+"~"+‘最‘.decode(‘GBK‘)+root[12][0][1].text print city+‘ ‘+wendu+‘ ‘+fengli+‘ ‘+fengxiang+‘ ‘+shidu+‘ ‘+riqi+‘ ‘+temperature print "===============================================================================" tree1 = ET.ElementTree(file="./Weather.xml") #這裡是因為我們這邊程式原本設定好了一個格式,因此只能將資料填回該檔案才行 change_node_text(tree1.findall("City"),city) change_node_text(tree1.findall("TodayWeather"),wendu) change_node_text(tree1.findall("Wind"),fengli+‘ ‘+fengxiang) change_node_text(tree1.findall("Date"),time.strftime( "%Y-%m-%d %A", time.localtime(time.time()) )) change_node_text(tree1.findall("Temperature"),temperature) change_node_text(tree1.findall("PicUrl"),shidu) tree1.write("Weather.xml",encoding="UTF-8",xml_declaration=True) time.sleep(1200) #最後這個是因為我不希望程式一直運行,太浪費資源了,所以設定為每隔20分鐘進行一次,也就是讓程式擷取完一次後休眠20分鐘
==========================================================
以上代碼還有許多冗餘的,因為是趕時間完成的,我也就隨便寫寫這個指令碼,本人不是專門負責python開發的,如有錯誤還望大家指正
對了,以上程式還有一個問題,就是有的時候因為颱風啊,暴雨啊,雷雨啊什麼的,來源資料的xml檔案對應的節點會多一個警告的節點,由於本人精力有限,就沒有做過多的處理,日後再對代碼進行更正吧!
下面附上我們公司的weather.xml檔案格式
<?xml version="1.0" encoding="utf-8"?><Weather> <City></City> <TodayWeather></TodayWeather> <Wind></Wind> <Date></Date> <Temperature></Temperature> <PicUrl></PicUrl></Weather>
本文出自 “jong先生” 部落格,請務必保留此出處http://jong001.blog.51cto.com/6765224/1675655
Python天氣預報資料擷取指令碼