標籤:指定 返回 空間 擷取 style bsp 用途 娛樂 nbsp
讓我們來拉取Twitter帳號@NyTimes的最近20條微博。
我們可以建立變數來存放待拉取的微博數量(即count),以及待拉取的使用者(即name)。然後用這兩個參數調用user_timeline()函數。下面是更新後的代碼(注意,在代碼的頂部應該保持認證和API對象的建立)。
# 傳入認證資訊,並建立API對象 api = tweepy.API(auth) # 待拉取微博的使用者 name = "nytimes" # 待拉取的微博數量 tweetCount = 20 # 使用上面的參數,調用user_timeline函數 results = api.user_timeline(id=name, count=tweetCount) # 遍曆所拉取的全部微博 for tweet in results: # 列印存在微博對象中的text欄位 print tweet.text
輸出的結果看起來像這樣:
這種類型資料的流行應用程式套件括有:
對指定的使用者進行分析,分析他們是如何與世界進行互動的
尋找Twitter的影響者並分析他們的粉絲的趨勢和互動情況
監控某個使用者的粉絲的變化情況
樣本3:使用關鍵字尋找微博
這是最後一個樣本:擷取包含某個關鍵字的最新的微博。如果想在Twitter世界中監控某個話題,或者甚至想看下你的商業被提到的情況,這都是相當有用的。假設現在想看下Twitter談論Toptal的情況怎樣。
翻閱完Tweept文檔,search()函數似乎是完成我們目標的最佳工具。
這裡最重要的參數是q——查詢參數,即要尋找的關鍵字。
還可以設定lang參數,這樣就只會取到想要的語言的微博。這裡只返回英文(“en”)的微博。
現在可以修改代碼,以體現要做的改變。首先建立存放參數(query和language)的變數,然後通過API對象調用相應的函數。最後在迴圈中也列印了發布微博的使用者的終端名稱。
# 傳入認證資訊,並建立API對象 api = tweepy.API(auth) # 你想尋找的關鍵字 query = "Toptal" # 語言代碼(遵循ISO 639-1標準) language = "en" # 使用上面的參數,調用user_timeline函數 results = api.search(q=query, lang=language) # 遍曆所拉取的全部微博 for tweet in results: # 列印存在微博對象中的text欄位 print tweet.user.screen_name,"Tweeted:",tweet.text
最後結果看起來像是這樣:
以下是使用這些資訊的一些實用途徑:
建立空間圖表,查看你們公司在世界哪些地方被提到最多
對微博進行情感分析,看下關於你們公司的整體意見是正面還是負面
建立關於發布你們公司或者產品相關微博中最熱門的使用者的社交圖表
在後續的文章中,會覆蓋到部分這些主題。
結論
Twitter的API介面在資料採礦應用中非常有用,並且關於公眾的意見能提供大量的見解。如果Twitter API介面和大資料分析是你未來會感興趣的東西,建議查看Twitter API介面,Tweepy和Twitter的頻率限制指南以擷取更多資訊。
在本教程,我們只是簡單地講了基本的訪問和拉取。然而,Twitter的API介面還可用來服務於錯綜複雜的大資料問題,涉及人,趨勢,和非常複雜以致單憑人類心智無法掌控的社交圖。
巨弘娛樂 juhongyulept.com
新貝娛樂 xinbeiyuLe.cn
吉美娛樂 jimeiyulept.com
無極娛樂 wujiyule88.cn
七彩娛樂 qicaiyulept.cn
Twitter資料採礦:如何使用Python分析大資料 (3)