阿里雲 大資料教你玩轉娛樂圈

來源:互聯網
上載者:User

” 不僅如此,Public Recognition原來還是阿里小ai的一隻“眼睛”,協助小ai成功預測了《我是歌手》決賽的粉絲投票排行。今天大廚帶你一起用他闖一闖娛樂圈。

 必備產品:http://click.aliyun.com/m/5647/

 單價:UI福士版 69元/年 8月2日 10:00準時開售!

阿里雲Public Recognition的應用情境則包括政府機關、傳媒機構、金融行業、地產行業、教育行業、醫學行業、旅遊行業、企業品牌等。

 

一、註冊與購買

此前它以每個月1元(UI體驗版)的體驗價格(現在升級為UI福士版69元/元)向公眾開放,大廚就以這個價格任性地嘗試了一把——首先開啟阿里雲·數加的官方連結,然後點擊該網頁左邊的“立即購買”,就能進行註冊、繳費與使用了。

 

二、使用流程——以近期吳亦凡事件為例

註冊並開通“Public Recognition”服務之後,便能進行配置檢測專題、關鍵詞和參數並分析採集內容變化趨勢了。

(一) 設定監控的專題和關鍵詞

首次進入“Public Recognition”管理主控台,需要為分析對象配置監控專題和關鍵詞, 可以用監控專題的一個或多個關鍵片語合進行描述。

數加官網“快速開始”稱:

“系統後台將採集包含這些關鍵片語合的文章內容,進行匯總分析。後續一些統計功能將主要針對監控專題進行操作,所以盡量為每個分析對象建立一個單獨的監控專題。”

八卦的大廚為這次熱熱鬧鬧的吳亦凡事件專門開闢了一個專題並設定了關鍵片語合—首先點擊後台管理的關鍵字,繼而點擊添加專題,然後進行關鍵詞配置。

大廚一口氣添加了吳亦凡、小G娜、卓偉、加拿大炮王等一系列熱點詞彙,選擇了包括新聞、論壇、微博、微信在內的所有給定來源站點,產生的專題如下:

據官方說明,關鍵詞配置的要點如下:

“配置關鍵詞時主要考慮以下兩方面因素。(注意:系統後台每10分鐘才會更新全域的關鍵詞採集策略,因此新的關鍵詞提交配置之後,需要10分鐘左右生效。)

○ 採集範圍:需要在哪些類型的網站上採集內容。來源站點類型可以包括:新聞、論壇、貼吧、微博、微信、政府網站和視頻類網站。

○ 組合技巧:關鍵詞如何組合,是否添加同義、近義、通假或網上用語的變體,這可能需要花一些時間逐步調整。另外,請不要設定過於寬泛的關鍵片語合,例如“網路”、“安全”等單個詞,這會採集過多不相關的文章,導致您的採集數量配額快速耗盡。如下圖所示,一次可大量新增多個關鍵片語合,每一行表示一個關鍵片語合。根據您訂購的版本不同,關鍵片語合的數量(即行數)有不同的上限。一個關鍵片語合可以由單個或者多個片語成,詞與詞之間用空格分隔,表示“與”的關係:必須同時 包含一行中所有詞的資訊才會被採集。”

(二) 查看採集內容

這下就能開始關注輿情動態了,點擊左側導覽列的“新輿情”或者“全部輿情就”可以查看關鍵詞採集到的文章列表。列表中標題字型加粗的表示未讀文章,點擊某一條文章將在右側顯示文章的詳細資料。

大廚隨機點開其中一篇文本,如下圖,情感已經被自動設定為“負面”,而標籤、情感(正面、中性、負面)、風險等級、備忘等資訊都可以進行自訂,同時,大廚將這篇資訊設定為有效。

值得注意的是,標記訓練是機器學習的過程,據官方說明:

標記訓練“可手動勾選文章標題,批量標記為‘有效’、‘無效’或‘已讀’。‘有效’表示這些文章是值得重點關注的,‘無效’表示這些文章屬於幹擾資訊。手動標記的過程,實際上是在訓練背景智能分類模型,一般經過100篇左右的標記訓練之後,系統的分類模型將越來越準確,結合‘過濾規則’可以實現智能過濾, 後續採集到不相關的內容(如廣告、幹擾資訊、垃圾資訊),即可自動歸入‘資源回收筒’。”

同時,該應用還提供了文章的搜尋功能,點擊文章上面的搜尋按鈕,便可以從多維度篩選文章。

(三) 查看結果分析報表

最後點擊左側導覽列的“首頁”,便可以查看相關分析報表,可以查看“今天”、“7天”、“30天”的分析結果。

三、結果展示

大廚檢測了從6月21日到6月24日關於此事件的結果。

來源站點類型和熱詞雲分析如下圖所示,結果顯示:微博成為此次事件的主要輿論場,符合大家的潛在認知。

然而,關於採集到的輿情數量,大廚心有疑問。在微博搜尋“吳亦凡”的發文數量遠遠超過“Public Recognition”在微博四天內共收集到的2萬多條。這說明該應用的資料篩選有著自己的一套標準,且該標準擷取的樣本量明顯偏小,“大資料”的收集能力還需後續觀察。

結果顯示:

對於這次吳亦凡負面事件的公眾情感分析,6.21-6.24日的均值為1,公眾的正面情緒稍微佔據上風,說明大量粉絲甚至是腦殘粉持續進行輿論攻勢。

6.23日公眾的正面情緒有較高的上升,這與吳亦凡名譽侵權案立案具有一致性。

以6.24日為例,全天的對此事件的看法相對中性,但在清晨四點到10點達到情感高峰,說明雙方的立場對峙以支援者佔據上風(反對者可能都在睡夢中)。

一言以蔽之,大廚對該應用之於發文的自動情感判斷相當服氣,雖然有一些文章存在偏頗之處,但大部分都能準確定性。

分析結果顯示6.21-6.24日?——熱門事件TOP10為:

通過上述圖表可知,吳亦凡此番事件的後續發酵和走向與一些熱時間點事件和炒作有關——吳亦凡名譽侵權案位居熱門事件前二,6.22日下午的立案帶動輿情數量走向高峰。這說明了吳亦凡方的公關做法在實質的走向中起到了影響和帶領粉絲進行輿情反攻的作用。

四、 功能點評

優點:

1.情感分析較為出色,能夠較為準確地表現輿情走向。

2.自動化操作和檢測,介面簡潔,使用簡單。

缺點:

1.目前應用平台不太成熟,存在一些bug。

a) 刪除設定的專題後,專題內的關鍵詞並不會在輿情的介面消失,還是會繼續在雲端載入資料,且無法刪除。

b) 首頁的分析結果並非根據某一單一專題得出,而是所有關鍵詞的匯總分析結果,且無法設定,這一點十分不合理。例如你有兩個不同需要檢測的專題“京東618”和“吳亦凡”,首頁的情感分析、詞雲統計很有可能是所有檢測文本的集合結果,目前無法實現對不同專題的差異化結果顯示。因此,該平台目前對具有單一的檢測主題的受眾較為適用。

2.抓取的資料量不夠完整,且輿情數量很容易達到上限。(大廚僅僅檢測了4天吳亦凡事件,控制台的上方便有如下提示。)

 

3.若干更為實用的工具還未向公眾開放。如下圖,開放介面下的傳播路徑分析等功能還未開放,因此資料的使用和分析具有局限性。

PS:大廚發現,前幾日的1元體驗版現今已悄然下架,取而代之的是69元/年的福士版,據負責人透露:1元錢的體驗版為上個月的活動價,對資料量進行了控制,每天僅能抓取1萬條資訊,功能較弱;而今的69元/年的福士版,每天可以抓取30萬條資訊,大大提升了該平台的分析容量,算是真正商業化了。這確也部分解答了大廚的體驗困惑。當然,大廚只是體驗了初級版,各位boys或者girls,值得擁有福士版!

Public Recognition地址:http://click.aliyun.com/m/5647/

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.