python3.6+BeautifulSoup4.2 爬取各類app應用資訊並下載app包

來源:互聯網
上載者:User

標籤:報錯   2.7   imp   utf8   port   exist   編輯   .exe   config   

---------------環境配置---------------

1、在Windows作業系統下安裝python-3.6.4-amd64.exe

2、配置環境變數

Path變數:如C:\Users\Administrator\AppData\Local\Programs\Python\Python36\

開啟cmd命令視窗,輸入:python命令,可以進入python 編輯命令行,即可。

3、把beautifulsoup4-4.6.0.tar.gz解壓後,放在Python36\目錄下,在cmd中...\Python36\beautifulsoup4-4.6.0\下執行命令

python setup.pyinstall ,安裝成功不報錯。

4、把get-pip.py放在...\Python36\目錄下,執行命令:python get-pip.py,安裝pip成功。

5、在...\Python36\Scripts目錄下,開啟cmd,匯入requests、pymysql、urllib等模組,執行命令如下

pip installrequests

pip installpymysql

pip installurllib

測試一下python的環境---匯入幾個包,不報錯即可

import requests

from bs4 importBeautifulSoup

import pymysql

fromurllib.request import urlopen

 

-------------執行app應用資訊爬取-----

1、首先把app爬取指令碼getmiAppInfo整個檔案夾放在...\Python36\Lib\site-packages目錄下

2、修改資料庫設定檔

\GetAllAppInfo\baseconfig.ini

如下:

[db]

DB_HOST=192.168.2.73

DB_PORT=3306

DB_USERNAME=root

DB_PASSWORD=cecgw

DB_BASEDATA=app

3、需要建立一個mysql資料庫,資料庫名稱為app

執行表建立指令碼

------------------------------

-- Tablestructure for appinfo1

------------------------------

DROP TABLE IFEXISTS `appinfo1`;

CREATE TABLE`appinfo1` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `channel` varchar(50) DEFAULT NULL,

  `Faclassname` varchar(255) DEFAULT NULL,

  `subclassname` varchar(100) DEFAULT NULL,

  `appname` varchar(255) DEFAULT NULL,

  `score` varchar(50) DEFAULT NULL,

  `loadcounts` varchar(50) DEFAULT NULL,

  `size` varchar(50) DEFAULT NULL,

  `author` varchar(255) DEFAULT NULL,

  `updatetime` varchar(50) DEFAULT NULL,

  `version` varchar(100) DEFAULT NULL,

  `supsystem` varchar(100) DEFAULT NULL,

  `suplang` varchar(50) DEFAULT NULL,

  `appurl` varchar(255) DEFAULT NULL,

  `loadurl` varchar(255) DEFAULT NULL,

  `str1` varchar(255) DEFAULT NULL,

  `str2` varchar(255) DEFAULT NULL,

  `str3` varchar(255) DEFAULT NULL,

  `str4` varchar(255) DEFAULT NULL,

  `str5` varchar(255) DEFAULT NULL,

  PRIMARY KEY (`id`)

) ENGINE=InnoDBAUTO_INCREMENT=1038 DEFAULT CHARSET=utf8;

4、運行app爬取指令碼

開啟...\Python36\Lib\site-packages\GetAllAppInfo\目錄,開啟cmd,

執行命令python RunMain.py

根據渠道說明,輸入渠道標號

如輸入1,自動執行‘360手機小幫手’渠道的app應用資訊爬取

儲存到資料庫後,根據loadurl需要下載app.apk包下載到\GetAllAppInfo\pkg,請執行python appDownload.py

注意:

原始碼詳見

連結:https://pan.baidu.com/s/1ggOJl2j 密碼:0auz

python3.6+BeautifulSoup4.2 爬取各類app應用資訊並下載app包

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.