「大資料」時代已經來臨

來源:互聯網
上載者:User

近來,無數專家和媒體頻繁提到「大資料」時代已經來臨,那麼到底什麼是大資料,僅從字面來理解,大資料的主要特點就是「大」:除了以往傳統方法獲取的資料外,新的資料來源層出不窮源源不斷,形成一個隨時間變化的巨大資料流程。 這股資料流程摧毀了當前的資料監測和研究行業,也徹底顛覆了人們的理解和想像。

大資料何以如此之「大」? 其「大」到底從何而來? 要回答這個問題,首先需要瞭解資料的來源,這裡所提到的資料,出於企業行銷的角度,我們暫且狹義地理解為消費者的行為資料。 以往此類資料的獲取大致有以下幾種途徑:一是根據產品的銷量及其分佈特徵來瞭解;二是採用問卷調查的方法去獲取消費者的行為及態度意見等;三是通過觀察或訪談去獲取消費者行為資料。 總而言之,在以往獲取資料的方法中,研究者佔據主動位置,消費者比較被動。

然而在大資料時代,消費者已經主動或者不自覺地把自己的行為資訊以資料方式留在某處,新媒體技術無時無刻不在悄悄記錄我們的行為資訊,這些資訊所形成的資料只等待有心人來收集、分析和研判。 所以在一定程度上,大資料時代最主要的資料獲取方法是通過新技術手段進行的悄無聲息的觀察和記錄,而通過這種方式獲取的資訊總量,要遠大於傳統方法收集的消費者資料。 同時在此過程中,消費者更加主動(雖然自己可能並未察覺),而研究者則被動接收。

大資料時代得以形成,有賴於新媒體的飛速發展,比如微博每天產生的資料內容,就遠遠大於以往研究產生的資料。 我們可以通過某個人的微博內容分析,去嘗試瞭解這個人的基本人口特徵,以及其價值觀、消費觀等,甚至可以在其個人微博中發現此人關注的各類品牌資訊,以及對各品牌所持有的態度,所以大資料的價值是顯而易見的。

上述內容還僅僅是橫向資料總量的不斷豐富和擴大,除此之外,資料的縱向拓展也成就了大資料時代。 我們可以把以往的調查或觀察資料看作是一個橫截面的研究,每個消費者對應一系列資料點,這樣兩個座標軸共同構築了一幅二維平面圖。 但是在新媒體時代,消費者每時每刻的行為資訊均加上了一個新的時間座標軸,把原來的二維平面變成了一個三維空間,這個三維空間的資料總量肯定遠遠大於原來的二維空間,這也是新媒體導致大資料時代到來的證明。

中國古時以「羊大」為美,今天以資料量「大」就是「好」嗎? 恐怕事實並非如此。 這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動方向,那麼在這個範圍內經過測算再去撈針顯然更靠譜,它遠比從整個大海中一點點搜索要更高效。 大資料時代也是如此,我們真正需要的其實並不是大資料本身,而是這個大資料背後隱藏的我們想要獲取的情報性資訊,而這樣的資訊可能只占總體的萬分之一,我們需要的只是這萬分之一,其他大量資訊對我們而言都是垃圾。 從這個角度出發,資料量越大,其中垃圾資訊也就越多,這些令人眼花繚亂的垃圾資訊,把我們真正想要的資訊給深深地埋在資料洪流之中。

這就是今天輿情監測行業面臨的困境,筆者見過無數的輿情監測服務商,得意洋洋地誇口自己可以監測海量的資訊來源,以及每天或每分鐘可以抓取無比龐大的資訊內容,更有一些輿情監測機構開始競爭誰的監測覆蓋面更廣等。 而這恰恰是輿情監測的誤區之一,在對以往輿情資訊來源毫無瞭解的情況下,未經前期調研規劃的輿情監測,獲取的資訊量越大,得到的垃圾資訊就越多。

所以輿情監測並不是想當然的那麼簡單,它需要經歷監測源的調研規劃、監測源的管理及權重賦值、監測資訊及其屬性的抓取、輿情資料的分析挖掘和研判、輿情應對策略建議及應對效果評估這樣一個系列的流程環節, 而不僅僅是要求抓取的資訊量越大越好。 在這樣的流程體系中,輿情監測源的前期調研規劃作為第一環節顯得尤其重要,它直接決定著資料獲取的速率以及抓取資訊的有效性、可用性。 所以不同的輿情監測專案,其監測範圍應該有所不同。

大資料時代的到來帶給我們的另一個啟示是,輿情監測業務之間的合作應該大於競爭。 假設企業A在做輿情監測,企業B也在做輿情監測,如果兩家監測能夠按上述所言做好前期調研規劃,那麼兩者所獲取的監測內容重合度應該比較低,所以兩者之間並不存在激烈的競爭關係。 相反,如果企業A、企業B、企業C...... 多家企業把監測獲取的資訊內容資料庫聯合起來,則形成了一個比較完整的行業資料庫。 換一種思路來理解,也就是說如果多家企業可以聯合建立一個共用的輿情監測內容資料庫,每家企業從中篩選過濾出自己所需內容即可,這樣既降低了成本,又提高了精確性,其多方共贏的優勢就能顯現出來。

大資料時代顯然給我們帶來不少便利之處,但是在盲目的歡呼和一時的激動之後,我們更需要認真反思如何正確挖掘出大資料的最大效用,以便我們在大資料的海洋裡遊刃有餘,而不是被大資料洪流衝擊得迷失了方向。

(相關專題見11版)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.