不論「大資料」概念是不是個陷阱,我們的時代,互聯網巨頭坐擁海量資訊是無人可以否認的事實,社區產品和社交產品賴以生存的基礎就是從使用者那兒來的資料。
他們都是怎樣八仙過海、各顯神通讓你感受到大資料的? 比如,去年年終的時候,你肯定看到眾多好友在微信朋友圈兒分享了一張「訂制」的圖片,在微信產品成長歷程的時間軸中標注你加入的時點;你可能在登錄豆瓣電臺後,才發現通過一個特別的回憶通道,豆瓣已經幫你記錄了一年來的音樂足跡, 從哪天註冊哪天聽第一首歌哪天聽的很悲傷...... 無一遺漏;如果你是知乎使用者,你肯定搭乘了一架「時光機」,直到這時一組組資料才讓你猛然發現,你曾經寫下的回答已經被上萬的人分享......
這些貼心而極具煽情功效的產品背後,就是基於資料採礦的最基本形態。 這些體貼的資料化產品,常常為你一邊絞盡腦汁寫年度總結一邊擔心年底紅包縮水的灰暗生活提供些許慰藉(支付寶的帳單除外,這差不多是提醒了「過去一年造了太多孽」的恐嚇信吧...... )
你知道SNS霸主Facebook是怎麼玩轉大資料的嗎? Facebook知道你什麼時候跟別人約會,什麼時候分手——對,就這麼簡單。
《大西洋月刊》一篇最新的文章發佈了一張有趣的關係圖(如下),顯示了Facebook部分使用者發帖數隨時間變化圖。 這是什麼意思?
這張圖來自Facebook。 就在今年情人節後第三天,Facebook通過其開發博客公佈了其資料研究部門科學家團隊的一項發現,即利用Facebook網站的統計資料,可以判斷發帖的使用者是否、何時擦出了愛的火花。 聯想到一首古詩「不識廬山真面目,只緣身在此山中」,換句話說,Facebook可能還比某些情侶早一步察覺他們之間萌生了愛意。
和傳統線下結為戀人的過程類似,社交網路的使用者確立戀愛關係也會經歷所謂的「求愛」階段。 Facebook的科學家卡洛斯·迪烏克(CarlosDiuk)透露,沿著時間軸觀察,在一段網戀的求愛期,兩位Facebook使用者的發帖都會增多。 而一旦真正認准了對方就是意中人,兩人在對方Facebook留言板上發的帖子都會減少。 原因可能是共浴愛河的戀人花了更多的時間表下相處。
迪烏克這樣用數位來解釋上面的一切:
我們通過大量資料發現,在成為戀人之前的100天裡,日後墜入情網的兩人相互發帖緩慢地逐步增加。 假設戀情正式開始的那天是「第零天」,這類帖子的數量是從「第零天」起越來越少。 我們發現,「第零天」以前發帖最高峰的12天裡,平均每天發1.67貼;而「第零天」以後發帖最少的85天裡,平均每天每天發佈1.53貼。
再加上點兒常識和心理學分析,解釋這個現象就更簡單:戀人之間求愛結束以後,雙方共處的時間增加,線上互動就給線下現實世界的互動讓位了。
迪烏克說,資料還顯示了另一個有趣的趨勢,即在告別單身之後,情侶之間普遍愛意大漲,互動的內容會越來越甜蜜,傳遞正能量。 正如Facebook的下圖趨勢線所示,在第零天和第零天之後的第一天,戀人之間發帖數量劇增(比對上圖)。
活躍使用者規模已經達到2.7億的Facebook掌握了數以億計的這類使用者資訊。 而Facebook這項分析的資料收集物件是2010年4月到2013年10月之間宣佈戀愛滿周年的情侶使用者,並未包括這期間戀愛關係有變的使用者。 在分析戀人們彼此多相愛的時候,主要針對英語使用者。
迪烏克的同事、Facebook資料研究團隊的另一位科學家格登·史塔特(BogdanState)還透露了兩項好玩兒的發現:
第一、如果通過Facebook發展的一段戀愛關係能維持三個月以上時間,很可能會持續四年甚至更久;
第二、戀人分手可能性最大的月份是5月、6月和7月。
這顯然是快要取代心理學專家和搞社會調研的那群人的飯碗的節奏了。
不過你可能會說,這種研究差不多也算情人節行銷吧? 不瞞你說Facebook還真的是喜歡利用情人節檔期來玩轉資料分析。
早在2012年始,Facebook的資料研究團隊就開始利用使用者主動公開感情的資料做出一些有趣的嘗試。 2011年底,Facebook開始讓使用者在社交網路上分享自己(資料來自Spotify外掛程式)的收聽習慣,Facebook的資料工作團隊也同一時間開始工作。
這些帶著一顆八卦新的資料工程師們,將情感關係和音樂這兩個概念融合在一起,能夠挖掘出哪些歌曲是使用者開始一段新感情時喜歡播放的,而哪些歌曲是在他們分手後常提到的。 具體的分析工具我們不得而知,然而看看這份發佈于2012年情人節當天的排行榜吧,是不是比一味的情人節推廣廣告更討巧、更有趣味?
新的感情開始時人們最喜歡的歌曲:Don’tWannaGoHome(音樂人JasonDerulo的《不想回家》);而最受歡迎的失戀歌曲TOP10包括:
「Don’tWannaGoHome」byJasonDerulo
「LoveonTop」byBeyonc
「HowtoLove」byLilWayne
「JusttheWayYouAre」byBrunoMars
「GoodFeeling」byFloRida
「ItGirl」byJasonDerulo
「StereoHearts」byGymClassHeroesfeaturingAdamLevine
「Criminal」byBritneySpears
「NoSleep」byWizKhalifa
「FreeFallin’」byJohnMayer
相應的,當人們分手時排在榜首的歌曲是的TheCave(DanielEkfaveMumford&Sons樂隊的《洞穴》);而陷入愛河者最喜歡曲目TOP10包括:
TheCave」byMumfordandSons
「CrewLove」byDrake
「AlloftheLights」byKanyeWest
「RollingintheDeep」byAdele
「TakeCare」byDrake
「ItWillRain」byBrunoMars
「WeFoundLove」byRihanna&CalvinHarris
「CallItWhatYouWant」byFosterthePeople
「LoveYouLikeaLoveSong」bySelenaGomezandtheScene
「WithoutYou」byDavidGuettafeaturingUsher
除了博你一笑,Facebook還讓這些分析結果用在基於資料的推薦引擎上。 產品工程師們基於各種推測結果推出了新的社交服務——向使用者提供最契合心境的曲目。
Facebook的資料採礦團隊就像一群已經掌握了愛情「讀心術」的魔法師,而從談(ren)情(zhi)說(chang)愛(qing)做起使用大資料,這個路數看起來更接地氣。 這讓人想到國內大大小小的婚戀平臺和社區,是不是還沒意識到自己還停留在1.0時代呢? 未來,真正的紅娘和「知心姐姐」也許就是社交網站!