2018年春運火車票今天開售,手把手教你用Python搶票回家過年....,開售python

來源:互聯網
上載者:User

2018年春運火車票今天開售,手把手教你用Python搶票回家過年....,開售python

作者 protream

原文:http://www.jianshu.com/p/f411d7e10c41

說明:本文編輯protream 和marvin的文章成篇


首先看看如何快速查看剩餘火車票?


當你想查詢一下火車票資訊的時候,你還在上12306官網嗎?或是開啟你手機裡的APP?下面讓我們來用Python寫一個命令列版的火車票查看器, 只要在命令列敲一行命令就能獲得你想要的火車票資訊!如果你剛掌握了Python基礎,這將是個不錯的小練習。


介面設計


一個應用寫出來最終是要給人使用的,哪怕只是給你自己使用。所以,首先應該想想你希望怎麼使用它?讓我們先給這個小應用起個名字吧,既然及查詢票務資訊,那就叫它tickets好了。我們希望使用者只要輸入出發站,到達站以及日期就讓就能獲得想要的資訊,所以tickets應該這樣被使用:

$ tickets from to date

另外,火車有各種類型,高鐵、動車、特快、快速和直達,我們希望可以提供選項只查詢特定的一種或幾種的火車,所以,我們應該有下面這些選項:


  • -g   高鐵

  • -d    動車

  • -t    特快

  • -k    快速

  • -z    直達


這幾個選項應該能被組合使用,所以,最終我們的介面應該是這個樣子的:

$ tickets [-gdtkz] from to date

介面已經確定好了,剩下的就是實現它了。


開發環境


寫Python程式的一個良好實踐是使用virtualenv這個工具建一個虛擬環境。我們的程式使用Python3開發,下面在你的工作目錄下建一個檔案夾tickets,進去建立一個虛擬環境:

$ virtualenv -p /usr/bin/python3 venv

通過下面的命令啟用它:

$ . venv/bin/activate
解析參數


Python有很多寫命令列應用的工具,如argparse, docopt, options...這裡,我們選用docopt這個簡單易用的工具,我們先安裝它:

$ pip3 install docopt

docopt可以按我們在文檔字串中定義的格式來解析參數,在tickets.py中:


# coding: utf-8

"""Train tickets query via command-line.Usage:    tickets [-gdtkz] <from> <to> <date>Options:    -h,--help        顯示協助菜單    -g               高鐵    -d               動車    -t               特快    -k               快速    -z               直達Example:    tickets 南京 北京 2016-07-01    tickets -dg 南京 北京 2016-07-01"""

from docopt import docopt

def cli():    """command-line interface"""    arguments = docopt(__doc__)    print(arguments)

if __name__ == '__main__':    cli()

下面我們運行一下這個程式:

$ python3 tickets.py 上海 北京 2016-07-01

我們得到下面的參數解析結果:

{'-d': False, '-g': False, '-k': False, '-t': False, '-z': False, '<date>': '2016-07-01', '<from>': '上海', '<to>': '北京'}
擷取資料


參數已經解析好了,下面就是如何擷取資料了,這也是最主要的部分。首先我們開啟12306,進入餘票查詢頁面,如果你使用chrome,那麼按F12開啟開發人員工具,選中Network一欄,在查詢方塊鐘我們輸入上海北京,日期2016-07-01, 點擊查詢,我們在調試工具發現,查詢系統實際上請求了這個URL

https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP


並且返回的是Json格式的資料!接下來問題就簡單了,我們只需要構建請求URL然後解析返回的Json資料就可以了。但是我們發現,URL裡面from_stationto_station並不是漢字,而是一個代號,而使用者輸入的是漢字,我們要如何擷取代號呢?我們開啟網頁源碼看看有沒有什麼發現。


啊哈!果然,我們在網頁裡面找到了這個連結:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955。這裡面貌似是包含了所有車站的中文名,拼音,簡寫和代號等資訊, 我們在項目目錄下將它儲存為stations.html。但是這些資訊擠在一起,而我們只想要中文名和大寫字母的代號資訊,怎麼辦呢?


BINGO!Regex,我們寫個小指令碼來匹配提取出想要的資訊吧, 在parse.py中:

# coding: utf-8

import re
from pprint import pprint

with open('stations.html', 'r') as f:    text = f.read()    stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', text)    pprint(dict(stations), indent=4)

我們運行這個指令碼,它將以字典的形式返回所有車站和它的大寫字母代號, 我們將結果重新導向到stations.py中,

$ python3 parse.py > stations.py

我們為這個字典加名字,stations, 最終,stations.py檔案是這樣的:

stations = {        '一間堡': 'YJT',    '一面坡': 'YPB',     ...     '龍鎮': 'LZA',    '龍骨甸': 'LGM'
}

現在,使用者輸入車站的中文名,我們就可以直接從這個字典中擷取它的字母代碼了:

...
from stations import stations

def cli():    arguments = docopt(__doc__)    from_staion = stations.get(arguments['<from>'])    to_station = stations.get(arguments['<to>'])    date = arguments['<date>']    # 構建URL    url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format(        date, from_staion, to_station)

萬事俱備,下面我們來請求這個URL擷取資料吧!這裡我們使用requests這個庫, 先安裝它:

$ pip3 install requests

它提供了非常簡單易用的介面,

...
import requests

def cli():    ...    # 添加verify=False參數, 不驗證認證    r = requests.get(url, verify=False)    print(r.json())

從結果中,我們可以觀察到,與車票有關的資訊需要進一步提取:

def cli():    ...    r = requsets.get(url);    rows = r.json()['data']['datas']
顯示結果


資料已經擷取到了,剩下的就是提取我們要的資訊並將它顯示出來。prettytable這個庫可以讓我們它像MySQL資料庫那樣格式化顯示資料。

$ pip3 install prettytable

這樣使用它:

...
from prettytable import PrettyTable

def cli():    ...    headers = '車次 車站 時間 曆時 商務 一等 二等 軟臥 硬臥 軟座 硬座 無座'.split()    pt = PrettyTable()    pt._set_field_names(headers)
   for row in rows:
       # 從row中根據headers過濾資訊, 然後調用pt.add_row()添加到表中        ...    print(pt)


其次我們看看如何自動搶:


來自:Python中文社區(號:python-china)

作者:marvin,互連網從業者,現居上海張江


使用Python+Splinter自動重新整理搶票,可以成功搶到。(依賴自己的網路環境太厲害,還有機器的好壞)

Splinter是一個使用Python開發的開源Web應用測試載入器,它可以幫你實現自動瀏覽網站和與其進行互動,Splinter執行的時候會自動開啟你指定的瀏覽器,訪問指定的URL。然後你所開發的類比的任何行為,都會自動完成,你只需要坐在電腦面前,像看電影一樣看著螢幕上各種動作自動完成然後收集結果即可。

12306搶票Python程式碼片段

1、實現自動登入的函數:

2、開始購票的函數


原始碼地址下載:https://pan.baidu.com/s/1eSClOXW

分享朋友圈 也是另一種讚賞

The more we share, The more we have

 

歡迎加入資料君高效資料分析社區


加我私人進入大資料乾貨群:tongyuannow 











目前100000+人已關注加入我們

       

       






相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.